/ / Microsoft установила новый рекорд в распознавании речи
7994420702;horizontal

Microsoft установила новый рекорд в распознавании речи

24 августа 2017

В октябре прошлого года исследовательская команда речи и диалога Microsoft заявила о достижении качества распознавания речи на уровне человека, с количеством ошибок 6,3%. Через пять месяцев IBM сообщила об уровне ошибок 5,5%, ну а теперь уровень ошибок у Microsoft составляет 5,1%, что лучше, чем у профессиональных расшифровщиков речи.

Для достижения уровня ошибок в 5,1% компания провела ряд усовершенствований в своих нейросетевых акустической и языковой моделях.

Исследовательская группа Microsoft по речи и диалогу

Так, были доработаны алгоритмы распознавания в самой модели; доработана предиктивная система на основании множества акустических моделей, как на уровне кадров, так и на уровне слов; для предсказания будущего текста теперь используется вся история текущего диалога; разработано новое масштабируемое ПО для глубокого обучения; применение Azure GPU позволило сократить время на обучение модели и тестирование новых идей.

Что же, Microsoft явно достигла больших успехов в распознавании речи в монологах и диалогах, однако теперь фирме нужно доказать работоспособность своих наработок в сложных условиях, включая зашумлённую среду, далеко стоящий микрофон, правильное распознавание разных речевых стилей и речи на повышенных тонах, а также разговора с акцентом и на других языках с ограниченным обучением ИИ.

Microsoft, искусственный интеллект