«ВКонтакте» открыла доступ к собственной технологии распознавания речи

22 сентября 2022, 19:41

486

Соцсеть ВКонтакте предоставила разработчикам новую технологию распознавания речи, позволяющую переводить аудиозапись в печатный текст.

Разработка новой технологии началась два года назад. Новой возможностью можно воспользоваться бесплатно в различных проектах.

Внедрение новой технической разработки распознавания речи осуществляется просто - при помощи нескольких кликов. Нейросети отлично распознают записи, на которых присутствуют лишние шумы, сленг или имеются сокращения. Они отлично справляются с удалением шума и пауз из аудиофайла, воспринимают невнятную речь.

«Под капотом у решения сразу три нейросети: одна отвечает за распознавание речи, вторая находит подходящие слова, а третья расставляет знаки препинания», — сказано в сообщении пресс-службы «ВКонтакте».

На выбор представлено две модели распознавания: нейтральная - способна расшифровывать разборчивую и внятную речь, и спонтанная модель, которая преобразует речь, содержащую, к примеру, ненормативную лексику. Выбор модели разработчиком будет зависеть от качества обрабатываемой записи. Обработка аудиофайла займет несколько секунд.

Протестировать новую разработку можно как через веб-интерфейс, так и через API.

«ВКонтакте» открыла доступ к собственной технологии распознавания речи

Похожие материалы

Комментарии