Stability AI introduce la diffusione video stabile per la generazione di testo in video

Secondo Decrypt, Stability AI ha annunciato il rilascio di Stable Video Diffusion, uno strumento di conversione testo-video progettato per la generazione di testo-video e immagini-video ad alta risoluzione. Il documento di ricerca dell'azienda evidenzia la sua adattabilità e la tecnologia open source, che consente varie applicazioni nella pubblicità, nell'istruzione e nell'intrattenimento. Stable Video Diffusion è attualmente disponibile in un'anteprima di ricerca e afferma di sovraperformare i metodi basati su immagini con una frazione del budget di calcolo.
Stability AI ha sviluppato due modelli sotto l'ombrello Stable Video Diffusion: SVD e SVD-XT. Il modello SVD trasforma le immagini fisse in video 576x1024 in 14 fotogrammi, mentre SVD-XT utilizza la stessa architettura ma si estende a 24 fotogrammi. Entrambi i modelli offrono generazione di video con frame rate compresi tra tre e 30 fotogrammi al secondo, dimostrando l'avanguardia della tecnologia text-to-video open source. Stable Video Diffusion compete con i modelli innovativi di Pika Labs, Runway e Meta nel campo in rapida evoluzione della generazione di video AI.
Nonostante i suoi risultati tecnologici, Stability AI deve affrontare sfide, comprese considerazioni etiche sull’utilizzo di dati protetti da copyright nella formazione sull’IA. L’azienda sottolinea che in questa fase il modello non è destinato ad applicazioni commerciali o nel mondo reale, concentrandosi sul perfezionamento in base al feedback della comunità e alle preoccupazioni sulla sicurezza.

Stability AI introduce la diffusione video stabile per la generazione di testo in video

Creator pertinente

Ultime notizie