4 октября Meta представила серию моделей искусственного интеллекта под названием Movie Gen. Эти модели могут создавать фотореалистичные видеоролики продолжительностью до 16 секунд, а также включать звуковые эффекты и фоновую музыку.
Movie Gen — не первая мультимодальная модель искусственного интеллекта, которая может генерировать видео и аудио с помощью простых текстовых команд, но она демонстрирует передовые возможности. Исследователи утверждают, что приложение превосходит конкурирующие системы при тестировании на людях.
Согласно сообщению в блоге Меты, Movie Gen в настоящее время может создавать фильмы со скоростью 16 кадров в секунду. Это довольно близко к кинематографическому изображению профессионального качества, учитывая, что голливудские фильмы доцифровой эпохи традиционно снимались со скоростью 24 кадра в секунду.
Модели Movie Gen могут создавать совершенно новые фильмы или изменять существующие изображения и видео на основе простых текстовых команд. Его самым передовым достижением является способность воспроизводить до 45 секунд звука, синхронизированного с движением.
Meta пока держит в секрете базовые модели Movie Gen и не назвала сроки запуска продукта. Компания отмечает, что перед развертыванием потребуется дополнительное тестирование безопасности.
Что вы думаете об этом развитии? Поделитесь с нами в комментариях.