¡Ay caramba! ¡Google otra vez no está jugando limpio! Gemma 4 12B, esta jugada ha llevado el modelo multimodal a otro nivel.
La verdad, cuando vi esto me quedé boquiabierto. Gemma 4 12B, la clave es "unificado, multimodal sin codificadores". En palabras simples, este modelo puede entender texto, imágenes e incluso videos, como si fuera un cerebro humano conectando toda la información, y su arquitectura es más simple, con una eficiencia que se dice que es superior.
En HackerNews ya hay 1012 likes y 381 comentarios; hermanos, este nivel de interés no es broma. Con 12B de parámetros, Google realmente está planeando hacer algo grande en el camino de la IA general. Este enfoque de "sin codificadores" me tiene muy emocionado por su rendimiento real.
De todos modos, yo ya lo tengo marcado y estoy listo para profundizar en este nuevo modelo. Aquí les dejo el enlace, los que saben, vayan a echar un vistazo, ¡no solo confíen en mí!
https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/
#AI大模型 #谷歌AI #Gemma #multimodal