Проект Moziila по распознаванию речи набрал 20 000 часов контента

11 мая 2022 года

Организация Moziila сообщила, что набор данных проекта Common Voice превысил 20 000 часов контента, что позволяет кому угодно на планете создавать собственное ПО для распознавания речи.

За год объём этих данных увеличился вдвое. Последний добавленный набор данных для английского языка составляет гигантские 71 ГБ, а поддержка языков выросла ещё сильнее. Теперь к списку добавились такие редкие языки, как тигре, тайваньский (миннан), марийский, бенгальский, токипона и кантонский.

По информации Mozilla, проект Common Voice важен, поскольку позволяет каждому вложить свой голос в его развитие, чтобы позволить виртуальным помощникам лучше понимать акценты. В дополнение, крупные технологические компании становятся не единственными держателями больших объёмов данных, что позволяет мелким разработчикам создавать собственные конкурентные продукты в сфере распознавания речи.

Среди важных изменений в свежем наборе данных Common Voice компания Mozilla отметила поддержку новых шести языков (перечислены выше); 27 языков, которые теперь имеют более 100 часов начитки (бенгальский, тайский, баскский, кантонский); 9 языков с более чем 500 часов начитки (киняруанда, каталанский и суахили).

Если вы хотите внести свой вклад, то это можно сделать на сайте проекта. Вам будет предложено прочитать текст, или послушать его и дать собственную оценку его правильности.