Описание
3i Language ID – Специальное программное обеспечение, предназначенное для автоматической идентификации языка по голосу в аудио-потоке. Технология может эффективно работать как с телерадиовещательным, так и с телефонным каналом входящих данных.
Поддерживаемые языки:
Телерадиовещание (Broadcast):
- Русский;
- Английский;
- Китайский;
- Немецкий;
- Испанский.
Телефония (Phone):
- Русский;
- Английский.
Используемая в 3i Language ID технология основана на вычислении наиболее вероятной последовательности звуков и слов, и определении вероятности порождения моделью целевого языка этой наиболее вероятной последовательности. Данный процесс повторяется для каждого целевого языка. Таким образом, учитывается акустическая и лингвистическая статистика распределения единиц языка (фонем слогов слов) на основе Скрытой Марковской модели для моделирования последовательностей лингвистических единиц речи и глубокой нейронной сети для моделирования акустики речи.
Предполагается, что речь на нецелевом языке будет иметь меньшую вероятность порождения моделью целевого языка, чем речь на целевом языке, поскольку фонетический состав, акустические особенности и распределение слов в нецелевом языке значительно отличается от целевого. Каждый язык из целевого множества языков должен иметь модель языка, которая поставляется совместно с модулем. Кроме того, каждый тип канала (броадкаст, телефония) для каждого языка также имеет модель языка.
Если вы обнаружили ошибку, пожалуйста, уведомите нас — выделите текст с ошибкой и нажмите клавиши Ctrl+Enter. Отключите блокировщик рекламы, если после нажатия комбинации кнопок не срабатывает всплывающее окно.