Selon Decrypt, Stability AI a annoncé la sortie de Stable Video Diffusion, un outil de conversion texte-vidéo conçu pour la génération de texte-vidéo et d'image-vidéo haute résolution. Le document de recherche de la société met en évidence son adaptabilité et sa technologie open source, qui permet diverses applications dans les domaines de la publicité, de l'éducation et du divertissement. Stable Video Diffusion est actuellement disponible dans un aperçu de recherche et prétend surpasser les méthodes basées sur l'image pour une fraction de leur budget de calcul.
Stability AI a développé deux modèles sous l'égide de Stable Video Diffusion : SVD et SVD-XT. Le modèle SVD transforme les images fixes en vidéos 576x1024 en 14 images, tandis que SVD-XT utilise la même architecture mais s'étend jusqu'à 24 images. Les deux modèles offrent la génération vidéo à des fréquences d'images allant de trois à 30 images par seconde, mettant en valeur la pointe de la technologie texte-vidéo open source. Stable Video Diffusion est en concurrence avec les modèles innovants de Pika Labs, Runway et Meta dans le domaine en évolution rapide de la génération vidéo IA.
Malgré ses réalisations technologiques, Stability AI est confrontée à des défis, notamment des considérations éthiques liées à l'utilisation de données protégées par le droit d'auteur dans la formation en IA. La société souligne que le modèle n'est pas destiné à des applications réelles ou commerciales à ce stade, et se concentre sur son perfectionnement en fonction des commentaires de la communauté et des préoccupations en matière de sécurité.
