Ai, Google atkal sākusi spēlēt nevis pēc noteikumiem! Gemma 4 12B, šī kustība tiešām pacels multimodālo modeli debesīs!
Godīgi sakot, kad es pirmo reizi redzēju šo lietu, arī biju pārsteigts. Gemma 4 12B, tās kodols ir "vienots, bez enkoderu multimodāls". Pārveidojot cilvēku valodā, šis modelis spēj vienlaikus saprast tekstu, attēlus un pat video, it kā tā būtu cilvēka smadzenes, kas spēj apvienot visu informāciju, un struktūra ir vēl vienkāršāka un efektivitāte, kā dzirdēts, ir augstāka.
HackerNews jau ir 1012 laiki un 381 komentārs, brāļi, šī popularitāte nav nejauša. 12B parametru skaits, Google tiešām plāno lielas lietas vispārējā AI jomā. Šī "bez enkoderu" dizaina pieeja mani ļoti interesē, un es gaidu tās reālo sniegumu.
Tāpat esmu to atzīmējis, gatavojoties padziļināti izpētīt šo jauno struktūru. Šeit ir saite, saprotošie var paši apskatīt, neuzticieties tikai man!
https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/
#AI大模型 #谷歌AI #Gemma #multimodāls