Ого, Google снова не по правилам играет! Gemma 4 12B, эта волна действий просто раздула многомодальную модель до небес!
Честно говоря, когда я увидел это, я немного офигел. Gemma 4 12B, суть в том, что это "унифицированная, безкодировочная многомодальная" модель. Переведя на человеческий язык, эта модель может одновременно понимать текст, изображения и даже видео, как человеческий мозг, соединяя всю информацию воедино, а архитектура еще более простая, и эффективность, говорят, тоже выше.
На HackerNews уже 1012 лайков и 381 комментарий, ребята, эта популярность не просто так. 12B параметров, Google действительно собирается сделать что-то серьезное в области общего ИИ. Эта "безкодировочная" концепция вызывает у меня большой интерес к ее реальным результатам.
В любом случае, я уже отметил, собираюсь глубже копнуть в эту новую архитектуру. Ссылка здесь, кто в теме, сами гляньте, не верьте только мне!
https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/
#AI大模型 #谷歌AI #Gemma #многомодальный