Gemini 2.0 - Un Modello per “Tutto”
Google ha svelato Gemini 2.0, un modello IA sperimentale salutato come un passo trasformativo verso un "assistente universale."
Capace di navigare autonomamente nei siti web, il modello mira a dare potere agli utenti per sviluppare agenti IA avanzati.
Il CEO Sundar Pichai l'ha descritto come la creazione più capace di Google finora, progettata per l'"era agentica."
Stiamo dando il via all'inizio della nostra era di Gemini 2.0 con Gemini 2.0 Flash, che supera 1.5 Pro in importanti benchmark a 2X velocità (vedi grafico qui sotto). Sono particolarmente entusiasta di vedere il rapido progresso nella programmazione, con molto altro in arrivo.
Gli sviluppatori possono provare una versione sperimentale in IA… pic.twitter.com/iEAV8dzkaW
— Sundar Pichai (@sundarpichai) 11 dicembre 2024
Questo lancio sottolinea l'impegno di Google a guidare la corsa all'IA in mezzo a una feroce competizione da giganti del settore come Meta e Microsoft.
Il Modello Sarà Distribuito Su Prodotti
Pichai ha annunciato che Gemini 2.0, con avanzate capacità multimodali, sarà presto integrato nella sua suite di prodotti, supportando l'output nativo di immagini e audio.
Siamo entusiasti di presentare Gemini 2.0 - il nostro modello IA più capace finora - con 2.0 Flash Sperimentale.
A partire da oggi, tutti gli utenti di Gemini possono ora provare una versione ottimizzata per la chat di Gemini 2.0 Flash Sperimentale, con prestazioni migliorate su numerosi benchmark chiave e velocità… pic.twitter.com/HTIn1dDg7J
— Google Gemini App (@GeminiApp) 11 dicembre 2024
Questo segue il rilascio di dicembre 2023 di Gemini 1.0, pubblicizzato come il primo modello "nativamente multimodale" in grado di elaborare e rispondere a query di testo, video, immagini, audio e codice.
L'ultima versione riflette la spinta di Google a rimanere all'avanguardia nel competitivo panorama dell'IA.
Pichai ha notato:
“Se Gemini 1.0 riguardava l'organizzazione e la comprensione delle informazioni, Gemini 2.0 riguarda il renderlo molto più utile.”
Gemini 2.0, che debutterà quasi 10 mesi dopo il modello intermedio 1.5, rimane in anteprima sperimentale.
Attualmente, solo la variante 2.0 Flash più piccola e conveniente è disponibile, principalmente per sviluppatori e tester.
Demis Hassabis, CEO di Google DeepMind, ha descritto il lancio come una tappa significativa per l'azienda, nonostante il suo rilascio iniziale limitato.
Hassabis ha spiegato:
“È buono quanto l'attuale modello Pro. Quindi puoi pensarlo come un intero livello migliore, per la stessa efficienza di costo e prestazioni e velocità. Siamo davvero felici di questo.”
Altri utenti di Gemini hanno ancora accesso a 1.5 Flash, riconosciuto per la sua velocità ed efficienza.
Sebbene i nostri modelli sperimentali siano sintonizzati per la sicurezza, in allineamento con il nostro approccio e linee guida, sono una prima anteprima e potrebbero non funzionare come previsto. Inoltre, alcune funzionalità di Gemini non saranno compatibili con questi modelli nel loro stato sperimentale.
— Google Gemini App (@GeminiApp) 11 dicembre 2024
Non Solo Gemini 2.0, Google Annuncia una Plenitudine di Funzionalità
Google ha delineato ambiziosi piani per il suo ultimo modello IA, Gemini 2.0, che Pichai afferma migliorerà la funzione Panoramiche IA già disponibile per un miliardo di utenti.
Pichai ha notato che le Panoramiche IA stanno rapidamente diventando uno degli strumenti di ricerca più popolari di Google.
Con l'integrazione di Gemini 2.0, la funzione sarà in grado di gestire query complesse e multi-fase, come risolvere equazioni matematiche e affrontare domande multimodali.
I test limitati per il modello sono iniziati questa settimana, ma un accesso più ampio alle sue capacità di ragionamento è previsto per l'inizio del prossimo anno.
Il modello opera sul chip IA di sesta generazione di Google, Trillium, che ha debuttato insieme all'annuncio.
Secondo l'azienda, Trillium offre quattro volte le prestazioni ed è il 67% più efficiente dal punto di vista energetico rispetto al suo predecessore.
I clienti di Google Cloud hanno ora accesso a questo hardware all'avanguardia.
Tra le nuove funzionalità alimentate da Gemini 2.0 c'è "Deep Research", un assistente di ricerca avanzato disponibile all'interno di Gemini Advanced.
Questo strumento sfrutta le capacità di ragionamento e di lungo contesto per compilare report di ricerca dettagliati.
Stiamo investendo nelle frontiere delle capacità agentiche con alcuni prototipi iniziali. Il Progetto Mariner è costruito con Gemini 2.0 ed è in grado di comprendere e ragionare attraverso le informazioni - pixel, testo, codice, immagini + moduli - sullo schermo del tuo browser e poi usa quelle informazioni per… pic.twitter.com/zM1SKahg86
— Sundar Pichai (@sundarpichai) 11 dicembre 2024
Il CEO di Google DeepMind, Demis Hassabis, ha osservato che questi progressi pongono le basi per un 2025 trasformativo:
“Vediamo davvero il 2025 come l'inizio vero dell'era basata su agenti.”
Google ha anche svelato il Progetto Mariner, un'estensione Chrome sperimentale in grado di navigare autonomamente i browser web, e ha introdotto Jules, un agente IA progettato per aiutare gli sviluppatori a identificare e correggere errori di codifica.
Un'altra funzionalità alimentata da Gemini, descritta come un "Easter egg" da Hassabis, è un assistente di gioco in grado di analizzare lo schermo di un utente e migliorare il gameplay—una testimonianza delle vere capacità multimodali del modello.
ICYMI: Siamo nella nostra era di Gemini 2.0 🧵↓ https://t.co/w2pHRWutgJ
— Google Gemini App (@GeminiApp) 12 dicembre 2024
