Система распознавания речи Microsoft не уступает человеку

На рубеже веков мир был помешан на идее машинного распознавания речи. В наши дни эти технологии уже не являются чем-то необычным.

Многие ведущие IT компании мира решили эту проблему по-своему, однако достижения Microsoft в этой сфере не могут не удивлять. По словам софтверного гиганта, новая технология распознавания речи при работе допускает 5,9% ошибок, что примерно соответствует уровню профессионального расшифровщика речи.

Распознавание речи в Cortana

Также компания отметила, что эта величина является самой низкой в промышленности при проведении тестов по стандартным промышленным задачам распознавания Switchboard. Также этот результат на 0,4% лучше продемонстрированного в сентябре и на 1% лучше результата IBM Watson, зарегистрированного в апреле.

По словам компании, данный результат стал кульминацией двадцатилетней работы, а доступен он стал благодаря современным нейронным сетям глубокого анализа. Джеффри Цвейг, глава исследовательской группы Speech & Dialog, отметил, что теперь, когда компания достигла высочайших результатов в распознавании человеческой речи, важнейшим вопросом становится понимание речи.

Технологии распознавания речи Microsoft использует в своём голосовом помощнике Cortana и в системах синхронного перевода, реализованных в Skype.