WikiDer > MBROLA
Оригинальный автор (ы) | Тьерри Дютуа |
---|---|
Разработчики) | Винсент Пейджел |
изначальный выпуск | 1995 |
Стабильный выпуск | 3.3 / 17 декабря 2019 |
Репозиторий | github |
Написано в | C |
Операционная система | Linux Windows FreeBSD |
Тип | Синтезатор речи |
Лицензия | Стандартная общественная лицензия GNU Affero |
Интернет сайт | github |
MBROLA является синтез речи программного обеспечения как всемирный совместный проект. Веб-страница проекта MBROLA предоставляет базы данных дифонов для многих[1] разговорный языки.
Программное обеспечение MBROLA не является полным синтез речи система для всех этих языков; в текст сначала должен быть преобразован в фонема и просодический информация в формате MBROLA и отдельное программное обеспечение (например, eSpeakNG) необходимо.
История
Проект MBROLA стартовал в 1995 году в лаборатории TCTS Lab Faculté polytechnique de Mons (Бельгия) в качестве научного проекта по получению набора синтезаторов речи для максимально возможного количества языков. Первый выпуск программного обеспечения MBROLA был выпущен в 1996 году и поставлялся как бесплатное ПО для некоммерческого, невоенного применения. Лицензии на созданные голосовые базы данных различаются, но в основном они предназначены для некоммерческого и невоенного использования.
Благодаря бесплатному использованию только для некоммерческих приложений, MBROLA де-факто была альтернативой для частных / домашних пользователей. синтез речи двигатель eSpeakNG в Linux рабочих станций, но в основном не использовались для коммерческих решений (например, для часов разговоров, уведомлений о посадке на порты и терминалы и т. д.). После первоначальной разработки голосовых баз обновления и поддержка программного обеспечения MBROLA прекратились, и постепенно двоичные файлы с закрытым исходным кодом отставали от разработки последних оборудование и операционные системы.[2] Чтобы разобраться с этой проблемой, команда разработчиков MBROLA решила выпустить MBROLA как Открытый исходный код программного обеспечения, а 24 октября 2018 г. был выпущен исходный код на GitHub с Стандартная общественная лицензия GNU Affero. 23 января 2019 года инструмент называется MBROLATOR был выпущен для обеспечения создания базы данных MBROLA из WAV файлы с той же лицензией.
Используемая технология
Программное обеспечение MBROLA использует MBROLA (добавление перекрытия многополосного ресинтеза)[3] алгоритм для генерации речи. Хотя это является дифон-основно, качество синтеза MBROLA считается выше, чем у большинства синтезаторов дифонов, поскольку он предварительно обрабатывает дифоны, налагая постоянные подача и гармонический фазы, которые усиливают их сцепление, лишь незначительно ухудшая их сегментное качество.
MBROLA - это алгоритм во временной области, похожий на ПСОЛА, что подразумевает очень низкую вычислительную нагрузку во время синтеза. Однако, в отличие от PSOLA, MBROLA не требует предварительной разметки периодов подачи. Эта функция позволила разработать проект MBROLA на основе алгоритма MBROLA, с помощью которого многие исследования речи лаборатории, компании, или же отдельные лица по всему миру предоставили дифоны базы данных для многих языков и голосов, но есть некоторые заметные упущения, такие как Китайский.
Рекомендации
- ^ Список голосов MBROLA
- ^ Mbrola-64 сразу вылетает с SEGFAULT
- ^ Дютуа, Т; Leich, H (декабрь 1993 г.). «MBR-PSOLA: синтез текста в речь на основе повторного синтеза MBE базы данных сегментов». Речевое общение. 13 (3–4): 435–440. Дои:10.1016 / 0167-6393 (93) 90042-J.