WikiDer > Список программ для распознавания речи - Википедия
Распознавание речи программное обеспечение доступно для многих вычислительные платформы, операционные системы, используйте модели и лицензии на программное обеспечение. Вот список таких, сгруппированных по разным полезным способам.
Акустические модели и речевой корпус (сборник)
В следующем списке представлены примечательные распознавание речи программные движки с кратким описанием характеристик.
Имя приложения | Описание | Открытый исходный код | Лицензия | Операционная система | Язык программирования | Поддерживаемый язык, примечание | Офлайн или онлайн |
---|---|---|---|---|---|---|---|
КМУ Сфинкс | ХМ | да | BSD стиль | Кроссплатформенность | Ява | Английский, немецкий, французский, китайский, русский | Не в сети |
HTK | ХМ нейронная сеть | Нет | Специфический для HTK | Кроссплатформенность | C | Английский; версия 3.5 выпущена в декабре 2015 г. | |
Юлий | HMM триграммы | да | В стиле BSD, некоммерческий | Кроссплатформенность | C | Японский, английский; [2] | Не в сети |
Kaldi | Нейронная сеть | да | Apache | Кроссплатформенность | C ++ | английский | |
RWTH ASR | RWTH Ахенский университет | Нет | RWTH ASR, только для некоммерческого использования | Linux, macOS | C ++ | английский |
Macintosh
Имя приложения | Описание | Открытый исходный код | Лицензия | Цена | Примечание |
---|---|---|---|---|---|
Dragon для Mac (снято с производства в 2018 г.) | macOS; по Nuance | Нет | Проприетарный | ||
Диктант Дракона (снято с производства) | macOS; по Nuance | Нет | Проприетарный | ||
MacSpeech Scribe (снято с производства) | Транскрипция записанного текста; приобретено Nuance | ||||
я слышу (снято с производства) | PowerPC Macintosh; прекращено MacSpeech; приобретено Nuance | ||||
Говорящие предметы | Входит в состав macOS | ||||
ViaVoice (снято с производства) | Продукт IBM; приобретено Nuance | ||||
Голосовой навигатор | Оригинал GUI голосовое управление; 1989 г. |
Кросс-платформенные веб-приложения
Temi.com
Ebby.co
Sonix.ai
Simonsays.ai
Кросс-платформенные веб-приложения на базе Chrome
В следующем списке представлены известные программы для распознавания речи, которые работают в браузере Chrome как веб-приложения. Они используют HTML5 Web-Speech-API.[1]
Имя приложения | Описание | Открытый исходный код | Лицензия | Цена | Примечание |
---|---|---|---|---|---|
Speechmatics[2] | Облачное и локальное автоматическое распознавание речи | Нет | Проприетарный | От 0,06 фунта стерлингов за минуту аудио |
Мобильные устройства и смартфоны
Много мобильный телефон телефоны, в том числе особенность телефонов и смартфоны Такие как айфоны и BlackBerrys, имеют встроенные базовые функции голосового набора. Многие сторонние приложения реализовали поддержку распознавания речи на естественном языке, в том числе:
Имя приложения | Описание | Открытый исходный код | Лицензия | Цена | Примечание |
---|---|---|---|---|---|
Assistant.ai | Ассистент для Android, iOS и Windows Phone | Нет | Проприетарный, бесплатное ПО | Свободный | Снято с производства |
Драконий диктант | Нет | Проприетарный, бесплатное ПО | Свободный | ||
Google сейчас | Голосовой поиск Android | Нет | Проприетарный, бесплатное ПО | Свободный | |
Google Voice Search | Нет | Проприетарный, бесплатное ПО | Свободный | ||
Microsoft Cortana | Голосовой поиск Microsoft | Нет | Проприетарный, бесплатное ПО | Свободный | |
Персональный помощник Siri | Виртуальный персональный помощник Apple | Нет | Проприетарный, бесплатное ПО | Свободный | |
Алекса - Amazon Echo | Личный помощник Amazon | Нет | Проприетарный | ||
СИЛЬВИЯ | Android и iOS | Нет | |||
Влинго |
Windows
Встроенное распознавание речи Windows
В Распознавание речи Windows версия 8.0, автор: Microsoft встроен в Виндоус виста, Windows 7, Windows 8 и Windows 10. Распознавание речи доступно только на английском, французском, испанском, немецком, японском, упрощенном китайском и традиционном китайском языках и только в соответствующей версии Windows; Это означает, что вы не можете использовать механизм распознавания речи на одном языке, если вы используете версию Windows на другом языке. Windows 7 Ultimate и Windows 8 Pro позволяют изменить язык системы и, следовательно, изменить доступный механизм речи. Распознавание речи Windows превратилось в Кортана (программное обеспечение), личный помощник включен в Windows 10.
Надстройки для распознавания речи Windows 7
- Голосовой палец - программное обеспечение для Виндоус виста и Windows 7 это улучшает Распознавание речи Windows система, добавив несколько расширений для ускорения и улучшения управления мышью и клавиатурой.
Распознавание речи сторонних производителей в Windows 7, 8, 10
- Braina - Диктовать стороннему программному обеспечению и веб-сайтам,[3] заполнять веб-формы и выполнять голосовые команды.[4]
- Дракон Естественно из Nuance Communications - Преемник старшего Дракон товар. Сосредоточиться на диктовка. Поддержка 64-битной Windows начиная с версии 10.1.
- SpeechMagic – Nuance Communications приобретенный Philips принадлежит. Направленность медицинской отрасли согласно Фрост и Салливан. Автономный или встроенный.[5]
- Тазти - Создавайте профили речевых команд, чтобы играть в компьютерные игры и управлять приложениями - программами. Создавайте голосовые команды для открытия файлов, папок, веб-страниц, приложений. Версии Windows 7, Windows 8 и Windows 8.1.[6]
Только Windows XP или 2000
- Microsoft Speech API - Функция распознавания речи включена как часть Microsoft Office и в Планшетные ПК работает под управлением Microsoft Windows XP Tablet PC Edition. Его также можно загрузить как часть Speech SDK 5.1 для приложений Windows, но поскольку он предназначен для разработчиков, создающих речевые приложения, в чистой форме SDK отсутствует какой-либо пользовательский интерфейс, и поэтому он не подходит для конечных пользователей.
Встроенное программное обеспечение
- Microsoft Kinect включает встроенное программное обеспечение, которое позволяет распознавать голосовые команды.
- Старшие поколения Nokia телефоны, такие как Nokia N Series (перед использованием Windows 7 мобильные технологии) использовали распознавание речи с фамилиями из списка контактов и несколькими командами.
- Siri, изначально реализованный в Айфон 4С, Apple личный помощник для iOS, который использует технологии от Nuance Communications.
- Кортана (программное обеспечение), Microsoftличный помощник, встроенный в телефон с операционной системой Виндоус и Windows 10.
Интерактивный голосовой отклик
Следующие интерактивный голосовой отклик (IVR) системы:
- Инструментарий CSLU
- Genesys[7]
- HTK - защищено авторским правом Microsoft, но позволяет изменять программное обеспечение для внутреннего использования лицензиатом
- LumenVox ASR
- Tellme Networks; приобретено Microsoft
Unix-подобное программное обеспечение для транскрипции речи x86 и x86-64
Программное обеспечение, снятое с производства
- IBM VoiceType (ранее IBM Personal Dictation System)
- IBM ViaVoice - Встроенная версия все еще поддерживается IBM.[10] Больше не поддерживается для версий выше Windows Vista.[11] Не тестировалось выше macOS 10.4 или на Macintosh с чипсетом Intel.[12]
- Quack.com; приобретено AOL; это имя теперь было повторно использовано для поискового приложения iPad.
- SpeechWorks из Nuance Communications.
- Яп Speech Cloud - Платформа преобразования речи в текст приобретена Amazon.com.
Смотрите также
- Программное обеспечение для распознавания речи для Linux
- Распознавание речи
- Транскрипция (программное обеспечение)
Рекомендации
- ^ «Спецификация Web Speech API». dvcs.w3.org. В архиве из оригинала от 21.06.2016.
- ^ Орловский, Андрей. «Total recog: британский ИИ совершает универсальный речевой прорыв». Реестр. Публикация ситуации. Получено 17 мая 2018.
- ^ «Программа распознавания речи для ПК с Windows - Braina». www.brainasoft.com. В архиве из оригинала от 07.04.2015.
- ^ "Динамический список наиболее 57 программных средств распознавания речи и веб-сервисов". В архиве с оригинала 13 февраля 2019 г.. Получено 23 февраля, 2019.
- ^ «Компания Frost & Sullivan назвала Philips SpeechMagic лидером в области технологий в Европе». www.frost.com. В архиве из оригинала от 15.04.2008.
- ^ О'Нил, Марк (2013-11-06). «Управляйте своим компьютером с помощью этих 5 программ распознавания речи». Компьютерный мир. В архиве из оригинала на 01.01.2014. Получено 2013-12-30.
- ^ "Интерактивный голосовой отклик". Genesys. В архиве из оригинала от 14.10.2016.
- ^ [1][мертвая ссылка]
- ^ Lavie, A .; Waibel, A .; Левин, Л .; Финке, М .; Гейтс, Д .; Гавальда, М .; Zeppenfeld, T .; Чжан, Пумин (1 апреля 1997 г.). «Янус-III: преобразование речи в речь на нескольких языках». 1997 Международная конференция IEEE по акустике, речи и обработке сигналов. IEEE Xplore. 1. С. 99–102. CiteSeerX 10.1.1.36.6967. Дои:10.1109 / ICASSP.1997.599557. ISBN 978-0-8186-7919-3.
- ^ «Архивная копия». В архиве из оригинала 08.08.2010. Получено 2010-06-29.CS1 maint: заархивированная копия как заголовок (связь)
- ^ «Поддержка продуктов Nuance для Microsoft Windows 7». Nuance Communications, Помощь клиентам. Получено 2019-03-16.
- ^ «ViaVoice для Mac OS X на наборе микросхем Intel». Nuance Communications, Помощь клиентам. Получено 2019-03-16.