Nowe narzędzie AI stabilizuje generowanie długich filmów

Danny Weber

23:33 10-02-2026

© RusPhotoBank

Szwajcarscy naukowcy z EPFL opracowali Stable Video Infinity (SVI), narzędzie AI eliminujące dryf czasowy w wideo. Pozwala tworzyć spójne filmy trwające minuty, dostępne jako open source.

Naukowcy ze Szwajcarskiego Federalnego Instytutu Technologii w Lozannie (EPFL) zaprezentowali nowe narzędzie oparte na sztucznej inteligencji, które rozwiązuje kluczowe wyzwanie w generowaniu wideo: utratę spójności czasowej. System o nazwie Stable Video Infinity (SVI) już zwrócił uwagę społeczności technologicznej.

W większości obecne modele generowania wideo potrafią tworzyć jedynie krótkie klipy trwające od kilku sekund do około pół minuty. Gdy czas trwania rośnie, obrazy zaczynają się zniekształcać: postacie się zmieniają, sceny tracą stabilność, a logika sekwencji ulega załamaniu. Ten efekt, znany jako dryf, długo uważano za niemal nieunikniony.

Zespół z laboratorium Visual Intelligence for Transportation (VITA) zaproponował nietypowe podejście do trenowania modeli. Zamiast ignorować błędy pojawiające się podczas generowania wideo, ich nowa metoda – „rekurencyjne ponowne uczenie na błędach” – celowo wprowadza te usterki z powrotem do procesu uczenia. W praktyce oznacza to, że sztuczna inteligencja uczy się radzić sobie z własnymi zniekształceniami.

Kierownik projektu, profesor Alexander Alahi, porównuje to podejście do szkolenia pilota w ciężkich turbulencjach. Uczenie się na błędach sprawia, że system jest bardziej odporny i pozwala mu utrzymać stabilność nawet podczas długotrwałego generowania. Ta zasada leży u podstaw Stable Video Infinity. W przeciwieństwie do istniejących rozwiązań, które często tracą jakość po 20–30 sekundach, SVI może tworzyć spójne i szczegółowe filmy trwające kilka minut lub dłużej.

Zespół wprowadził również metodę LayerSync, która pomaga sztucznej inteligencji synchronizować wewnętrzną logikę podczas pracy z wideo, obrazami i dźwiękiem. Razem te technologie torują drogę bardziej niezawodnym systemom autonomicznym i generatywnym mediom na dużą skalę. Projekt jest już dostępny jako otwarte oprogramowanie na GitHubie, gdzie zdobył ponad 2000 gwiazdek, a badania zaprezentowano na konferencji ICLR 2026, podkreślając ich znaczenie dla przyszłości technologii generatywnych.