Разработка новой технологии началась два года назад. Новой возможностью можно воспользоваться бесплатно в различных проектах.
Внедрение новой технической разработки распознавания речи осуществляется просто - при помощи нескольких кликов. Нейросети отлично распознают записи, на которых присутствуют лишние шумы, сленг или имеются сокращения. Они отлично справляются с удалением шума и пауз из аудиофайла, воспринимают невнятную речь.
«Под капотом у решения сразу три нейросети: одна отвечает за распознавание речи, вторая находит подходящие слова, а третья расставляет знаки препинания», — сказано в сообщении пресс-службы «ВКонтакте».
На выбор представлено две модели распознавания: нейтральная - способна расшифровывать разборчивую и внятную речь, и спонтанная модель, которая преобразует речь, содержащую, к примеру, ненормативную лексику. Выбор модели разработчиком будет зависеть от качества обрабатываемой записи. Обработка аудиофайла займет несколько секунд.
Протестировать новую разработку можно как через веб-интерфейс, так и через API.
Комментарии
-
30% отчислений вам
Партнёрка для владельцев сайтов
-
Заработок на ссылках
Купля-продажа эффективных ссылок
-
Биржа сайтов/каналов/групп
Продать сайт за 500 000 ₽? Легко!