Stable Video Infinity: Inteligența artificială care generează videoclipuri lungi și coerente

Cercetătorii de la Institutul Federal Elvețian de Tehnologie din Lausanne (EPFL) au dezvelit un nou instrument bazat pe inteligență artificială care abordează o provocare majoră în generarea de videoclipuri: pierderea coerenței temporale. Sistemul, numit Stable Video Infinity (SVI), a atras deja atenția comunității tehnologice.

Majoritatea modelelor actuale de generare video pot produce doar clipuri scurte, care durează de la câteva secunde la aproximativ jumătate de minut. Când durata crește, imaginile încep să se deformeze: personajele se schimbă, scenele devin instabile, iar logica secvenței se destramă. Acest efect, cunoscut sub numele de drift, a fost mult timp considerat aproape inevitabil.

Echipa de la laboratorul Visual Intelligence for Transportation (VITA) a propus o abordare neconvențională pentru antrenarea modelelor. În loc să ignore erorile care apar în timpul generării video, noua lor metodă – „reantrenarea recurentă a erorilor” – reintroduce în mod deliberat aceste defecte în procesul de învățare. În practică, asta înseamnă că inteligența artificială învață să-și gestioneze propriile distorsiuni.

Conducătorul proiectului, profesorul Alexander Alahi, compară această abordare cu antrenarea unui pilot în condiții de turbulență severă. Învățarea din erori face sistemul mai robust și îi permite să mențină stabilitatea chiar și în timpul generărilor prelungite. Acest principiu stă la baza Stable Video Infinity. Spre deosebire de soluțiile existente, care adesea se degradează după 20–30 de secunde, SVI poate crea videoclipuri coerente și detaliate care durează câteva minute sau mai mult.

Echipa a introdus și metoda LayerSync, care ajută inteligența artificială să sincronizeze logica internă atunci când lucrează cu video, imagini și audio. Împreună, aceste tehnologii deschid calea către sisteme autonome mai fiabile și media generative la scară largă. Proiectul este deja open-source pe GitHub, unde a strâns peste 2.000 de stele, iar cercetarea a fost prezentată la conferința ICLR 2026, subliniind semnificația sa pentru viitorul tehnologiilor generative.