Podle společnosti Decrypt oznámila Stability AI vydání nástroje Stable Video Diffusion, nástroje pro převod textu na video určeného pro generování převodu textu na video a obrázku do videa ve vysokém rozlišení. Výzkumná zpráva společnosti zdůrazňuje její přizpůsobivost a technologii open source, která umožňuje různé aplikace v reklamě, vzdělávání a zábavě. Stable Video Diffusion je aktuálně k dispozici ve zkušební verzi a tvrdí, že překonává metody založené na obrázcích za zlomek jejich výpočetního rozpočtu.

Stability AI vyvinula dva modely pod deštníkem Stable Video Diffusion: SVD a SVD-XT. Model SVD transformuje statické obrázky na videa 576x1024 ve 14 snímcích, zatímco SVD-XT používá stejnou architekturu, ale rozšiřuje se na 24 snímků. Oba modely nabízejí generování videa se snímkovou frekvencí v rozmezí od 3 do 30 snímků za sekundu, což představuje špičkovou technologii open source převodu textu na video. Stable Video Diffusion soutěží s inovativními modely od Pika Labs, Runway a Meta v rychle se vyvíjející oblasti generování AI videa.

Navzdory svým technologickým úspěchům čelí Stability AI výzvám, včetně etických úvah o používání dat chráněných autorským právem při školení AI. Společnost zdůrazňuje, že model není v této fázi určen pro reálné nebo komerční aplikace a zaměřuje se na jeho upřesnění na základě zpětné vazby od komunity a bezpečnostních obav.