Stabilitātes mākslīgais intelekts ievieš stabilu video difūziju teksta pārveidošanai video

Saskaņā ar Decrypt, Stability AI ir paziņojis par Stable Video Diffusion, teksta pārveides rīka izlaišanu, kas paredzēts augstas izšķirtspējas teksta-video un attēla-video ģenerēšanai. Uzņēmuma pētnieciskajā dokumentā ir uzsvērta tā pielāgošanās spēja un atvērtā pirmkoda tehnoloģija, kas ļauj izmantot dažādus lietojumus reklāmā, izglītībā un izklaidē. Stabila video difūzija pašlaik ir pieejama pētījuma priekšskatījumā, un tā apgalvo, ka tā pārspēj uz attēliem balstītas metodes ar nelielu daļu no to aprēķina budžeta.
Stability AI ir izstrādājusi divus modeļus zem Stable Video Diffusion zīmola: SVD un SVD-XT. SVD modelis pārvērš statiskās bildes 576x1024 videoklipos 14 kadrus, savukārt SVD-XT izmanto to pašu arhitektūru, bet paplašinās līdz 24 kadriem. Abi modeļi piedāvā video ģenerēšanu ar kadru ātrumu no trīs līdz 30 kadriem sekundē, demonstrējot atvērtā koda tekstu uz video tehnoloģijas priekšrocības. Stable Video Diffusion konkurē ar inovatīviem modeļiem no Pika Labs, Runway un Meta strauji attīstīgajā AI video ģenerēšanas jomā.
Neskatoties uz tehnoloģiskajiem sasniegumiem, Stability AI saskaras ar izaicinājumiem, tostarp ētiskām apsvērumiem par autortiesību datu izmantošanu AI apmācībā. Uzņēmums uzsver, ka modelis šajā posmā nav paredzēts reālās pasaules vai komerciālām lietojumprogrammām, koncentrējoties uz tā pilnveidošanu, pamatojoties uz kopienas atsauksmēm un drošības bažām.

Stabilitātes mākslīgais intelekts ievieš stabilu video difūziju teksta pārveidošanai video

Atbilstošs autors

Jaunākās ziņas