Danny Weber
23:38 10-02-2026
© RusPhotoBank
Výzkumníci z EPFL představili AI nástroj Stable Video Infinity, který pomocí rekurentního tréninku a LayerSync udržuje stabilitu v delších videích. Otevřete cestu k spolehlivějším generativním médiím.
Výzkumníci ze Švýcarského federálního technologického institutu v Lausanne (EPFL) představili nový nástroj založený na umělé inteligenci, který řeší klíčový problém při generování videa: ztrátu časové soudržnosti. Systém nazvaný Stable Video Infinity (SVI) již vzbudil pozornost technologické komunity.
Současné modely pro generování videa dokážou většinou vytvořit pouze krátké klipy trvající od několika sekund do zhruba půl minuty. Když se délka prodlužuje, obrazy se začínají deformovat: postavy se mění, scény ztrácejí stabilitu a logika sekvence se rozpadá. Tento jev, známý jako drift, byl dlouho považován za téměř nevyhnutelný.
Tým z laboratoře Visual Intelligence for Transportation (VITA) navrhl netradiční přístup k trénování modelů. Jejich nová metoda, nazvaná "rekurentní trénink na chybách", místo aby ignorovala chyby vznikající při generování videa, záměrně tyto poruchy znovu zavádí do učebního procesu. V praxi to znamená, že se umělá inteligence učí zvládat vlastní deformace.
Vedoucí projektu profesor Alexander Alahi přirovnává tento přístup k výcviku pilota v silné turbulenci. Učení se z chyb dělá systém robustnějším a umožňuje mu udržet stabilitu i při delším generování. Tento princip stojí za Stable Video Infinity. Na rozdíl od stávajících řešení, která často degradují po 20–30 sekundách, dokáže SVI vytvářet souvislá a detailní videa trvající několik minut i déle.
Tým také představil metodu LayerSync, která pomáhá umělé inteligenci synchronizovat vnitřní logiku při práci s videem, obrázky a zvukem. Společně tyto technologie otevírají cestu k spolehlivějším autonomním systémům a rozsáhlým generativním médiím. Projekt je již open-source na GitHubu, kde získal přes 2 000 hvězdiček, a výzkum byl prezentován na konferenci ICLR 2026, což zdůrazňuje jeho význam pro budoucnost generativních technologií.