Сервис «VK Видео» обновил алгоритмы искусственного интеллекта, теперь они автоматически распознают речь и генерируют субтитры для видеоконтента, включая ролики, шоу и клипы. Благодаря улучшениям, точность расшифровки увеличилась на 25%, а словарный запас нейросетей расширился за счет добавления новых слов, включая мемы и профессиональные термины.
Субтитры создаются с использованием ML-моделей, которые не только генерируют текст и расставляют знаки препинания, но и синхронизируют текст с видео. Аудиопоток проходит через несколько стадий обработки: от фильтрации шумов до превращения речи в текст, а затем в читаемый и понятный субтитр, синхронизированный с аудио.
В ближайшем будущем алгоритмы научатся различать речь разных говорящих и разделять их на отдельные диалоги, что сделает субтитры еще более удобными для восприятия.
Использование субтитров на платформе становится все более популярным: их использование в веб-версии «VK Видео» увеличилось на 28% за последний месяц, и сейчас функцией пользуется 11% всех пользователей.
Ранее сообщалось, что станции тропосферной связи «Гроза» получили поддержку нейросетей.