WikiDer > Общий голос

Common Voice
Общий голос
Common Voice Banner2.png
Разработчики)Фонд Mozilla
изначальный выпускИюнь 2017, 19; 3 года назад (19-06-2017)
Репозиторийhttps://github.com/mozilla/voice-web
Доступно вМногоязычный (Список языков)
ЛицензияCreative Commons CC0
Интернет сайтcommonvoice.mozilla.org

Общий голос это краудсорсинг проект начат Mozilla создать бесплатный база данных за программное обеспечение для распознавания речи. Проект поддерживается волонтеры кто записывает образцы предложений с микрофон и просматривать записи других пользователей. Расшифрованные предложения будут собраны в голосовой базе данных, доступной под всеобщее достояние лицензия CC0. Эта лицензия гарантирует, что Разработчики может использовать базу данных для приложений преобразования голоса в текст без ограничений и затрат.

Цели

Common Voice стремится предоставить разнообразные образцы голоса. По словам Катарины Борхерт из Mozilla, многие существующие проекты использовали наборы данных с общественного радио или иным образом имели наборы данных, в которых недостаточно представлены как женщины, так и люди с ярко выраженным акцентом.[1]

Голосовая база данных

База данных English Common Voice является второй по величине общедоступной голосовой базой данных после LibriSpeech. К моменту публикации первых данных 29 ноября 2017 года более 20000 пользователей по всему миру зарегистрировали 400000 проверенных предложений общей продолжительностью 500 часов.[2]

В феврале 2019 года была выпущена первая партия языков. Это включало 18 языков: английский, Французский, Немецкий и Мандаринский китайский, но также и менее распространенные языки, как валлийский и Kabyle. В общей сложности это включало почти 1400 часов записанных голосовых данных от более чем 42 000 участников.[3]

Рекомендации

  1. ^ «Почему мы учитываем гендерную проблематику ИИ? Компании, занимающиеся голосовыми технологиями, стремятся быть более инклюзивными». Хранитель. 11 января 2020 г.. Получено 19 апреля 2020.
  2. ^ «Объявление о первом выпуске модели распознавания речи Mozilla с открытым исходным кодом и набора голосовых данных». блог mozilla.org. 29 ноября 2017 года.
  3. ^ «Mozilla обновляет набор данных Common Voice, добавляя 1400 часов речи на 18 языках». VentureBeat. 28 февраля 2019.