Black Forest Labs ha lanzado Flux, un modelo de generación de texto a imagen de código abierto con 12 mil millones de parámetros capaz de producir imágenes de alta calidad comparables a modelos como Midjourney. Hay tres variantes de Flux, a saber, el Flux Dev de código abierto, la versión rápida Flux Schnell y el Flux Pro de código cerrado. Las pruebas comparativas muestran que la calidad de síntesis de imágenes de Flux supera a muchos modelos convencionales, como Midjourney v6.0 y Dall-E 3, lo que lo convierte en un fuerte competidor entre los generadores de imágenes de código abierto.
punto clave
- Flux es el modelo generativo de texto a imagen de código abierto más grande hasta la fecha, con 12 mil millones de parámetros.
- Flux ofrece tres versiones: Flux Dev (código abierto), Flux Schnell (versión rápida) y Flux Pro (versión API de código cerrado).
- Los usuarios pueden descargar modelos Flux en Hugging Face y utilizar nuevos flujos de trabajo nativos en ComfyUI.
- Flux se desempeña de manera sobresaliente en los puntos de referencia de síntesis de imágenes, superando a múltiples modelos de la competencia.
- Aunque Flux proporciona resultados de alta calidad, el tamaño del modelo más grande limita su uso a usuarios con tarjetas gráficas más bajas.
- Black Forest Labs coopera con Fal AI para respaldar la generación de la nube y los usuarios pueden probar Flux de forma gratuita a través de la plataforma Replicate.
- Flux Pro y Schnell ofrecen costos de generación de imágenes que son relativamente más bajos que competidores como Midjourney e Ideogram.