Gemini 2.0 - Model pro „Všechno“

Google představil Gemini 2.0, experimentální AI model, který je vyhlašován jako transformační krok směrem k "univerzálnímu asistentovi."

Schopný autonomně procházet webové stránky, model má za cíl posílit uživatele, aby vyvíjeli pokročilé AI agenty.

Generální ředitel Sundar Pichai to popsal jako dosud nejvýkonnější výtvor Google, navržený pro "agentickou éru."

Začínáme naši éru Gemini 2.0 s Gemini 2.0 Flash, který překonává 1.5 Pro na klíčových benchmarkech při 2X rychlosti (viz níže uvedený graf). Jsem obzvlášť nadšený z rychlého pokroku v programování, s dalším zlepšením na cestě.

Vývojáři si mohou vyzkoušet experimentální verzi v AI… pic.twitter.com/iEAV8dzkaW

— Sundar Pichai (@sundarpichai) 11. prosince 2024

Tento start podtrhuje závazek Google vést závod AI uprostřed silné konkurence od průmyslových gigantů, jako jsou Meta a Microsoft.

Model bude zaveden napříč produkty

Pichai oznámil, že Gemini 2.0, vybavený pokročilými multimodálními schopnostmi, bude brzy integrován do jeho produktového portfolia, podporující nativní obrazový a audio výstup.

Jsme nadšeni, že můžeme představit Gemini 2.0 - náš dosud nejvýkonnější AI model - s 2.0 Flash Experimentální.

Od dnešního dne mohou všichni uživatelé Gemini vyzkoušet verzi Gemini 2.0 Flash Experimentální optimalizovanou pro chat, s vylepšeným výkonem na řadě klíčových benchmarků a rychlosti… pic.twitter.com/HTIn1dDg7J

— Google Gemini App (@GeminiApp) 11. prosince 2024

To následuje po vydání Gemini 1.0 v prosinci 2023, který byl označován jako první "nativně multimodální" model schopný zpracovávat a reagovat na textové, video, obrázkové, audio a kódové dotazy.

Nejnovější verze odráží úsilí Google zůstat na čele konkurenceschopné AI krajiny.

Pichai poznamenal:

„Pokud bylo Gemini 1.0 o organizaci a porozumění informacím, Gemini 2.0 je o tom, aby bylo mnohem užitečnější.“

Gemini 2.0, který debutuje téměř 10 měsíců po mezivrstvě 1.5, zůstává v experimentálním náhledu.

V současnosti je k dispozici pouze menší, nákladově efektivní varianta 2.0 Flash, primárně pro vývojáře a testery.

Demis Hassabis, generální ředitel Google DeepMind, popsal spuštění jako významný milník pro společnost, i přes jeho omezené počáteční vydání.

Hassabis vysvětlil:

„Je to tak dobré, jako je současný Pro model. Takže si to můžete představit jako o jednu celou úroveň lepší, za stejnou nákladovou efektivitu a výkonovou efektivitu a rychlost. O tom jsme opravdu šťastní.“

Další uživatelé Gemini mají stále přístup k 1.5 Flash, uznávanému pro svou rychlost a efektivitu.

I když jsou naše experimentální modely nastaveny na bezpečnost v souladu s naším přístupem a pokyny, jsou to rané náhledy a nemusí fungovat podle očekávání. Kromě toho některé funkce Gemini nebudou kompatibilní s těmito modely ve svém experimentálním stavu.

— Google Gemini App (@GeminiApp) 11. prosince 2024

Nejen Gemini 2.0, Google oznamuje řadu funkcí

Google nastínil ambiciózní plány pro svůj nejnovější AI model, Gemini 2.0, který podle Pichaiho vylepší funkci AI Přehledy již dostupnou pro jednu miliardu uživatelů.

Pichai poznamenal, že AI Přehledy se rychle stávají jedním z nejpopulárnějších vyhledávacích nástrojů Google.

S integrací Gemini 2.0 bude funkce schopna zpracovávat složité, vícestupňové dotazy, jako je řešení matematických rovnic a odpovídání na multimodální otázky.

Omezené testování modelu začalo tento týden, ale širší přístup k jeho schopnostem uvažování je plánován na začátek příštího roku.

Model funguje na 6. generaci AI čipu Google, Trillium, který debutoval spolu s oznámením.

Podle společnosti Trillium nabízí čtyřnásobný výkon a je o 67 % energeticky efektivnější než jeho předchůdce.

Zákazníci Google Cloud nyní mají přístup k tomuto špičkovému hardwaru.

Mezi novými funkcemi poháněnými Gemini 2.0 je "Hluboký výzkum", pokročilý výzkumný asistent dostupný v Gemini Advanced.

Tento nástroj využívá uvažování a schopnosti dlouhého kontextu k sestavení podrobných výzkumných zpráv.

Investujeme do hranic agentických schopností s několika ranými prototypy. Projekt Mariner je postaven s Gemini 2.0 a je schopen chápat a uvažovat o informacích - pixelech, textech, kódech, obrázcích + formulářích - na vaší obrazovce prohlížeče, a poté využívá tyto informace k… pic.twitter.com/zM1SKahg86

— Sundar Pichai (@sundarpichai) 11. prosince 2024

Generální ředitel Google DeepMind Demis Hassabis poznamenal, že tyto pokroky připravují půdu pro transformační rok 2025:

„Opravdu vidíme rok 2025 jako skutečný začátek éry založené na agentech.“

Google také představil Projekt Mariner, experimentální rozšíření Chrome schopné autonomně procházet webovými prohlížeči, a představil Jules, AI agenta navrženého k pomoci vývojářům identifikovat a opravit chyby v kódu.

Další funkce poháněná Gemini, popsaná jako "velikonoční vajíčko" Hassabisem, je herní asistent schopný analyzovat obrazovku uživatele a zlepšit hru - důkaz skutečných multimodálních schopností modelu.

ICYMI: Jsme v naší éře Gemini 2.0 🧵↓ https://t.co/w2pHRWutgJ

— Google Gemini App (@GeminiApp) 12. prosince 2024