Разное

Швейцарские исследователи победили главную проблему видеогенерации ИИ

Исследователи из Швейцарской высшей технической школы Лозанны (EPFL) представили новый инструмент на базе искусственного интеллекта, который решает одну из ключевых проблем генерации видео — потерю связности со временем. Система получила название Stable Video Infinity (SVI) и уже привлекла внимание технологического сообщества.

Большинство современных моделей генерации видео способны создавать лишь короткие ролики длительностью от нескольких секунд до полуминуты. При увеличении хронометража изображения начинают искажаться: персонажи меняются, сцены «плывут», а логика происходящего разрушается. Этот эффект известен как дрейф и долгое время считался почти неизбежным.

Команда лаборатории Visual Intelligence for Transportation (VITA) предложила нестандартный подход к обучению моделей. Вместо того чтобы игнорировать ошибки, возникающие при генерации видео, новый метод — «переобучение с использованием повторяющихся ошибок» — намеренно возвращает эти сбои в процесс обучения. Таким образом, ИИ учится справляться с собственными деформациями.

Руководитель проекта, профессор Александр Алахи, сравнивает этот подход с подготовкой пилота в условиях сильной турбулентности. Обучение на ошибках делает систему более устойчивой и позволяет ей сохранять стабильность даже при длительной генерации. Именно этот принцип лег в основу Stable Video Infinity. В отличие от существующих решений, которые часто теряют качество уже через 20–30 секунд, SVI способна создавать связные и детализированные видео продолжительностью в несколько минут и дольше.

Дополнительно команда представила метод LayerSync, который помогает ИИ синхронизировать внутреннюю логику при работе с видео, изображениями и аудио. Вместе эти технологии открывают путь к созданию более надежных автономных систем и масштабных генеративных медиа. Проект уже опубликован в открытом доступе на GitHub и собрал более 2000 звезд, а само исследование было представлено на конференции ICLR 2026, что подчеркивает его значимость для будущего генеративных технологий.