Nuovo strumento IA per video coerenti e dettagliati

I ricercatori del Politecnico federale di Losanna (EPFL) hanno presentato un nuovo strumento basato sull'intelligenza artificiale che affronta una sfida chiave nella generazione video: la perdita di coerenza temporale. Il sistema, chiamato Stable Video Infinity (SVI), ha già attirato l'attenzione della comunità tecnologica.

La maggior parte degli attuali modelli di generazione video può produrre solo clip brevi, della durata di pochi secondi fino a circa mezzo minuto. Quando la durata aumenta, le immagini iniziano a distorcersi: i personaggi cambiano, le scene diventano instabili e la logica della sequenza si interrompe. Noto come "drift", questo effetto è stato a lungo considerato quasi inevitabile.

Il team del laboratorio Visual Intelligence for Transportation (VITA) ha proposto un approccio non convenzionale per addestrare i modelli. Invece di ignorare gli errori che sorgono durante la generazione video, il loro nuovo metodo – "recurrent error retraining" – reintroduce deliberatamente questi problemi nel processo di apprendimento. In pratica, ciò significa che l'IA impara a gestire le proprie distorsioni.

Il professor Alexander Alahi, responsabile del progetto, paragona l'approccio all'addestramento di un pilota in condizioni di turbolenza estrema. Imparare dagli errori rende il sistema più robusto e gli permette di mantenere la stabilità anche durante generazioni prolungate. Questo principio è alla base di Stable Video Infinity. A differenza delle soluzioni esistenti, che spesso si degradano dopo 20-30 secondi, SVI può creare video coerenti e dettagliati della durata di diversi minuti o più.

Il team ha anche introdotto il metodo LayerSync, che aiuta l'IA a sincronizzare la logica interna quando lavora con video, immagini e audio. Insieme, queste tecnologie aprono la strada a sistemi autonomi più affidabili e a media generativi su larga scala. Il progetto è già open-source su GitHub, dove ha raccolto oltre 2.000 stelle, e la ricerca è stata presentata alla conferenza ICLR 2026, sottolineandone l'importanza per il futuro delle tecnologie generative.