Según Decrypt, Stability AI ha anunciado el lanzamiento de Stable Video Diffusion, una herramienta de conversión de texto a video diseñada para la generación de texto a video e imagen a video de alta resolución. El trabajo de investigación de la compañía destaca su adaptabilidad y tecnología de código abierto, que permite diversas aplicaciones en publicidad, educación y entretenimiento. Stable Video Diffusion está actualmente disponible en una vista previa de la investigación y pretende superar a los métodos basados ​​en imágenes por una fracción de su presupuesto informático.

Stability AI ha desarrollado dos modelos bajo el paraguas de Stable Video Diffusion: SVD y SVD-XT. El modelo SVD transforma imágenes fijas en vídeos de 576x1024 en 14 fotogramas, mientras que SVD-XT utiliza la misma arquitectura pero se extiende a 24 fotogramas. Ambos modelos ofrecen generación de vídeo a velocidades de fotogramas que oscilan entre tres y 30 fotogramas por segundo, lo que muestra lo último en tecnología de texto a vídeo de código abierto. Stable Video Diffusion compite con modelos innovadores de Pika Labs, Runway y Meta en el campo en rápida evolución de la generación de videos con IA.

A pesar de sus logros tecnológicos, Stability AI enfrenta desafíos, incluidas consideraciones éticas sobre el uso de datos protegidos por derechos de autor en el entrenamiento de IA. La compañía enfatiza que el modelo no está destinado a aplicaciones comerciales o del mundo real en esta etapa, enfocándose en refinarlo en función de los comentarios de la comunidad y las preocupaciones de seguridad.