Разное

Генерация видео на новом уровне: Сбер представил Kandinsky Video 4.0

На международной конференции AI Journey, Сбер представил бета-версию своей новой нейросети Kandinsky 4.0 Video, разработанной для создания реалистичных видеороликов на основе текстового описания или исходного кадра.

Эта нейросеть предназначена для использования как обычными пользователями для создания анимированных поздравлений, так и профессионалами в области дизайна и маркетинга для генерации трейлеров и клипов. Модель способна создавать видеоряд продолжительностью до 12 секунд и поддерживает различные соотношения сторон видео.

Сбер подчеркнул, что ключевые особенности Kandinsky 4.0 включают улучшенное визуальное качество с высоким контрастом и чёткостью, а также реалистичность движений объектов. Успехи в разработке достигнуты благодаря совместной работе научных и инженерных команд, которые сосредоточились на улучшении архитектуры модели и оптимизации данных для обучения.

Дополнительно, команда Kandinsky ввела упрощенную версию, Kandinsky 4.0 Video Flash, которая за 15 секунд генерирует видео продолжительностью до 12 секунд в разрешении 480p на основе текста. Первым доступ к новой технологии получат профессионалы, они смогут создавать мини-фильмы с полным сценарием и звуковым оформлением. Общедоступная версия нейросети появится в первом квартале 2025 года.

Ранее сообщалось, что робособаки помогут сингапурским электрикам осматривать энергосети.