«ВКонтакте» открыла свои технологии распознавания речи

Команда «ВКонтакте» сообщила хорошую новость для сторонних разработчиков. Теперь разработчики смогут бесплатно использовать в своих проектах технологию «ВКонтакте», которая считывает голос и переводит его в текст.

Об этом рассказал технический директор «ВКонтакте» Александр Тоболь на открытии конференции Saint HighLoad++. Технология распознавания речи, или ASR, Automatic Speech Recognition, внедряется в несколько нажатий. Нейросети хорошо справляются с аудио с посторонними шумами, большим количеством сленга и сокращений.

Для распознавания можно выбрать одну из двух моделей. Нейтральная подойдёт для разборчивой речи, как в телешоу или интервью, а спонтанная поможет, когда нужно обработать более обыденную речь со сленгом и ненормативной лексикой. Нейросети «ВКонтакте» обрабатывают файлы за несколько секунд, умеют удалять из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ».

Технологию можно попробовать через веб-интерфейс на специальной странице или интегрировать через публичный API «ВКонтакте». На  портале доступен широкий набор методов, с помощью которых можно создавать мини-приложения «ВКонтакте» или использовать в сторонних проектах. Версию с обработкой аудио до 100 минут в сутки можно применять для любых целей. А для безлимитного использования технологии можно отправить заявку на электронную почту.

 

Источник

Похожие статьи

Добавить комментарий

Закрыть