Secondo Decrypt, Stability AI ha annunciato il rilascio di Stable Video Diffusion, uno strumento di conversione testo-video progettato per la generazione di testo-video e immagini-video ad alta risoluzione. Il documento di ricerca dell'azienda evidenzia la sua adattabilità e la tecnologia open source, che consente varie applicazioni nella pubblicità, nell'istruzione e nell'intrattenimento. Stable Video Diffusion è attualmente disponibile in un'anteprima di ricerca e afferma di sovraperformare i metodi basati su immagini con una frazione del budget di calcolo.
Stability AI ha sviluppato due modelli sotto l'ombrello Stable Video Diffusion: SVD e SVD-XT. Il modello SVD trasforma le immagini fisse in video 576x1024 in 14 fotogrammi, mentre SVD-XT utilizza la stessa architettura ma si estende a 24 fotogrammi. Entrambi i modelli offrono generazione di video con frame rate compresi tra tre e 30 fotogrammi al secondo, dimostrando l'avanguardia della tecnologia text-to-video open source. Stable Video Diffusion compete con i modelli innovativi di Pika Labs, Runway e Meta nel campo in rapida evoluzione della generazione di video AI.
Nonostante i suoi risultati tecnologici, Stability AI deve affrontare sfide, comprese considerazioni etiche sull’utilizzo di dati protetti da copyright nella formazione sull’IA. L’azienda sottolinea che in questa fase il modello non è destinato ad applicazioni commerciali o nel mondo reale, concentrandosi sul perfezionamento in base al feedback della comunità e alle preoccupazioni sulla sicurezza.
