WikiDer > Беззвучный речевой интерфейс

Silent speech interface

Беззвучный речевой интерфейс это устройство, которое позволяет речевое общение без использования звука, издаваемого людьми, звуки речи. Таким образом, это тип электронного чтение по губам. Он работает с помощью компьютера, определяющего фонемы что человек произносит из неаудиторских источников информации об их речевые движения. Затем они используются для воссоздания речь с помощью синтез речи.[1]

Источники информации

Системы немого речевого интерфейса были созданы с использованием УЗИ и оптический вход камеры язык и губа движения.[2] Электромагнитные устройства - еще один метод отслеживания движений языка и губ.[3] Обнаружение речевых движений электромиография речевых артикуляторов, мышц и гортань это еще одна техника.[4][5] Еще один источник информации - это голосовой тракт резонансные сигналы, которые передаются через костная проводимость называется неслышным ропотом.[6] Они также были созданы как интерфейс мозг-компьютер используя мозговую активность в моторная кора получен из внутрикортикальные микроэлектроды.[7]

Использует

Такие устройства созданы как помощь тем, кто не может создавать звук. звучание необходимо для слышимой речи, например, после ларингэктомия.[8] Другое использование - для общения, когда речь замаскирована фоновый шум или искаженный автономный дыхательный аппарат. Дальнейшее практическое использование - это там, где существует потребность в бесшумном общении, например, когда требуется конфиденциальность в общественном месте или когда требуется бесшумная передача данных без помощи рук военные или охранная операция.[2][9]

В 2002 году японская компания NTT DoCoMo объявил, что создал тихую мобильный телефон с помощью электромиография и визуализация движения губ. «Стимулом к ​​разработке такого телефона, - заявили в компании, - стало избавление от шума в общественных местах», добавив, что «ожидается, что эта технология также поможет людям, которые навсегда потеряли голос».[10] С тех пор была показана возможность использования интерфейсов беззвучной речи для практического общения.[11]

В художественной литературе

Расшифровка немой речи с помощью компьютера сыграла важную роль в Артур Кларкистория и Стэнли Кубриксвязанный фильм Космическая одиссея. В этом, HAL 9000, компьютер, управляющий космическим кораблем Discovery One, направляясь к Юпитеру, обнаруживает заговор, чтобы отключить его астронавтами миссии Дэйв Боуман и Фрэнк Пул через чтение по губам их разговоры.[12]

В Орсон Скотт КардСерии (включая Игра Эндера), с искусственным интеллектом можно разговаривать, в то время как главный герой носит датчик движения в челюсти, что позволяет ему общаться с ИИ без шума. Он также носит ушной имплант.

Смотрите также

использованная литература

  1. ^ Денби Б., Шульц Т., Хонда К., Хьюбер Т., Гилберт Дж. М., Брумберг Дж. С. (2010). Беззвучные речевые интерфейсы. Речевое общение 52: 270–287. Дои:10.1016 / j.specom.2009.08.002
  2. ^ а б Хюбер Т., Бенароя Э. Л., Чоллет Г., Денби Б., Дрейфус Г., Стоун М. (2010). Разработка интерфейса беззвучной речи на основе ультразвуковых и оптических изображений языка и губ. Речевое общение, 52 288–300. Дои:10.1016 / j.specom.2009.11.004
  3. ^ Ван Дж., Самал А. и Грин Дж. Р. (2014). Предварительное тестирование интерактивного интерфейса беззвучной речи в реальном времени на основе электромагнитного артикулографа, 5-й семинар ACL / ISCA по обработке речи и языка для вспомогательных технологий, Балтимор, Мэриленд, 38-45.
  4. ^ Йоргенсен С., Душан С. (2010). Речевые интерфейсы на основе поверхностной электромиографии. Речевая коммуникация, 52: 354–366. Дои:10.1016 / j.specom.2009.11.003
  5. ^ Шульц Т., Ванд М. (2010). Моделирование коартикуляции в распознавании непрерывной речи на основе ЭМГ. Речевое общение, 52: 341-353. Дои:10.1016 / j.specom.2009.12.002
  6. ^ Хирахара Т., Отани М., Симидзу С., Тода Т., Накамура К., Накадзима Ю., Шикано К. (2010). Усиление беззвучной речи с помощью проводимых телом сигналов голосового тракта. Речевое общение, 52: 301–313. Дои:10.1016 / j.specom.2009.12.001
  7. ^ Брумберг Дж. С., Ньето-Кастанон А., Кеннеди П. Р., Гюнтер Ф. Х. (2010). Интерфейсы мозг – компьютер для речевого общения. Речевое общение 52: 367–379. 2010 г. Дои:10.1016 / j.specom.2010.01.001
  8. ^ Дэн Ю., Патель Р., Хитон Дж. Т., Колби Г., Гилмор Л. Д., Кабрера Дж., Рой С. Х., Де Лука С. Дж., Мельцнер Г. С. (2009). Нарушение распознавания речи с помощью акустических сигналов и сигналов sEMG. В INTERSPEECH-2009, 644-647.
  9. ^ Дэн Ю., Колби Г., Хитон Дж. Т. и Мельцнер Х.Г. С. (2012). Усовершенствования обработки сигналов для системы распознавания беззвучной речи на основе MUTEsEMG. Конференция по военной связи, МИЛКОМ 2012.
  10. ^ Фицпатрик М. (2002). Мобильный телефон для чтения по губам заглушает крикунов. Новый ученый.
  11. ^ Жезл М, Шульц Т. (2011). Независимое от сеанса распознавание речи на основе EMG. Труды 4-й Международной конференции по биотехнологическим системам и обработке сигналов.
  12. ^ Кларк, Артур С. (1972). Затерянные миры 2001 года. Лондон: Сиджвик и Джексон. ISBN 0-283-97903-8.