Meta presentó una serie de modelos de IA llamados "Movie Gen" el 4 de octubre. Estos modelos pueden producir películas fotorrealistas de hasta 16 segundos y también incluyen efectos de sonido y música de fondo.
Movie Gen no es el primer modelo de IA multimodal que puede generar video y audio a partir de comandos de texto simples, pero presenta capacidades de vanguardia. Los investigadores afirman que la aplicación supera a los sistemas rivales en pruebas en humanos.
Según la publicación del blog de Meta, Movie Gen actualmente puede producir películas a 16 FPS. Esto se acerca bastante a una imagen cinematográfica de calidad profesional, considerando que las películas de Hollywood anteriores a la era digital se filmaban tradicionalmente a 24 FPS.
Los modelos Movie Gen pueden producir películas completamente nuevas o modificar imágenes y vídeos existentes basándose en simples comandos de texto. Su aportación más avanzada es la capacidad de producir hasta 45 segundos de sonido sincronizado con el movimiento.
Meta mantiene los modelos base de Movie Gen en secreto por ahora y no ha dado un plazo para el lanzamiento del producto. La compañía señala que se requerirán más pruebas de seguridad antes de la implementación.
¿Qué opinas de este desarrollo? Comparte con nosotros en los comentarios.