Stability AI představuje stabilní šíření videa pro generování textu na video

Podle společnosti Decrypt oznámila Stability AI vydání nástroje Stable Video Diffusion, nástroje pro převod textu na video určeného pro generování převodu textu na video a obrázku do videa ve vysokém rozlišení. Výzkumná zpráva společnosti zdůrazňuje její přizpůsobivost a technologii open source, která umožňuje různé aplikace v reklamě, vzdělávání a zábavě. Stable Video Diffusion je aktuálně k dispozici ve zkušební verzi a tvrdí, že překonává metody založené na obrázcích za zlomek jejich výpočetního rozpočtu.
Stability AI vyvinula dva modely pod deštníkem Stable Video Diffusion: SVD a SVD-XT. Model SVD transformuje statické obrázky na videa 576x1024 ve 14 snímcích, zatímco SVD-XT používá stejnou architekturu, ale rozšiřuje se na 24 snímků. Oba modely nabízejí generování videa se snímkovou frekvencí v rozmezí od 3 do 30 snímků za sekundu, což představuje špičkovou technologii open source převodu textu na video. Stable Video Diffusion soutěží s inovativními modely od Pika Labs, Runway a Meta v rychle se vyvíjející oblasti generování AI videa.
Navzdory svým technologickým úspěchům čelí Stability AI výzvám, včetně etických úvah o používání dat chráněných autorským právem při školení AI. Společnost zdůrazňuje, že model není v této fázi určen pro reálné nebo komerční aplikace a zaměřuje se na jeho upřesnění na základě zpětné vazby od komunity a bezpečnostních obav.

Stability AI představuje stabilní šíření videa pro generování textu na video

Relevantní tvůrce

Nejnovější zprávy