«VK Видео» обновило AI для автоматического создания субтитров

Дмитрий Новиков

12 сентября 2024 15:19:07

Фото: © A. Krivonosov

Новые AI-алгоритмы в «VK Видео» улучшили распознавание речи и субтитры, увеличив точность на 25% и расширив словарный запас.

Сервис «VK Видео» обновил алгоритмы искусственного интеллекта, теперь они автоматически распознают речь и генерируют субтитры для видеоконтента, включая ролики, шоу и клипы. Благодаря улучшениям, точность расшифровки увеличилась на 25%, а словарный запас нейросетей расширился за счет добавления новых слов, включая мемы и профессиональные термины.

Субтитры создаются с использованием ML-моделей, которые не только генерируют текст и расставляют знаки препинания, но и синхронизируют текст с видео. Аудиопоток проходит через несколько стадий обработки: от фильтрации шумов до превращения речи в текст, а затем в читаемый и понятный субтитр, синхронизированный с аудио.

В ближайшем будущем алгоритмы научатся различать речь разных говорящих и разделять их на отдельные диалоги, что сделает субтитры еще более удобными для восприятия.

Использование субтитров на платформе становится все более популярным: их использование в веб-версии «VK Видео» увеличилось на 28% за последний месяц, и сейчас функцией пользуется 11% всех пользователей.

Ранее сообщалось, что станции тропосферной связи «Гроза» получили поддержку нейросетей.

Эта страница может использовать файлы cookie в аналитических целях.