Menurut Decrypt, Stability AI telah mengumumkan peluncuran Difusi Video Stabil, alat teks-ke-video yang dirancang untuk pembuatan teks-ke-video dan gambar-ke-video resolusi tinggi. Makalah penelitian perusahaan menyoroti kemampuan beradaptasi dan teknologi sumber terbuka, yang memungkinkan berbagai penerapan dalam periklanan, pendidikan, dan hiburan. Difusi Video Stabil saat ini tersedia dalam pratinjau penelitian dan diklaim mengungguli metode berbasis gambar dengan anggaran komputasi yang lebih kecil.

Stability AI telah mengembangkan dua model di bawah payung Difusi Video Stabil: SVD dan SVD-XT. Model SVD mengubah gambar diam menjadi video 576x1024 dalam 14 frame, sedangkan SVD-XT menggunakan arsitektur yang sama tetapi diperluas hingga 24 frame. Kedua model ini menawarkan pembuatan video dengan kecepatan bingkai berkisar antara tiga hingga 30 bingkai per detik, menampilkan teknologi teks-ke-video sumber terbuka yang mutakhir. Difusi Video Stabil bersaing dengan model inovatif dari Pika Labs, Runway, dan Meta di bidang pembuatan video AI yang berkembang pesat.

Terlepas dari pencapaian teknologinya, Stability AI menghadapi tantangan, termasuk pertimbangan etis seputar penggunaan data berhak cipta dalam pelatihan AI. Perusahaan menekankan bahwa model tersebut tidak dimaksudkan untuk aplikasi dunia nyata atau komersial pada tahap ini, dan berfokus pada penyempurnaan berdasarkan masukan masyarakat dan masalah keselamatan.