Il Progetto Astra e Mariner Presentati come Innovazioni Chiave in Gemini 2.0
La CEO di Google e Alphabet Sundar Pichai ha annunciato mercoledì il lancio di Gemini 2.0, una nuova iterazione del modello di intelligenza artificiale dell’azienda, finalizzata a migliorare le capacità di ragionamento multimodale e lo sviluppo di agenti intelligenti.
Hai fretta? Ecco i fatti principali!
- Gemini 2.0 Flash offre bassa latenza e prestazioni migliorate per gli sviluppatori.
- Il Progetto Astra migliora il dialogo e la memoria, supportando strumenti di comunicazione e integrazione multilingue.
- Il Progetto Mariner, un prototipo iniziale, naviga con successo nelle attività web con l’83,5% di successo.
Con Gemini 2.0, Google si avvicina alla sua visione di creare un assistente universale, con nuove funzionalità che amplieranno l’utilità dell’intelligenza artificiale in vari settori.
Il lancio di Gemini 2.0 segue l’introduzione di Gemini 1.0 nel dicembre 2023, che ha segnato l’inizio della spinta di Google verso l’IA multimodale, in grado di elaborare e comprendere testi, immagini, video, audio e codice.
Ora, con il rilascio di Gemini 2.0, queste capacità sono ulteriormente potenziate, permettendo sia l’input che l’output di molteplici modalità, compresi immagini, video e persino testo in lingua parlata in diverse lingue.
Al centro di Gemini 2.0 c’è la sua natura “agente”, il che significa che può ragionare attraverso i problemi e intraprendere azioni per conto dell’utente sotto la loro supervisione. L’uscita segna l’inizio di uno sforzo più ampio per integrare queste capacità avanzate nei prodotti di uso quotidiano.
Queste capacità avvicinano Gemini 2.0 a diventare un assistente universale, capace di supportare varie applicazioni in diversi settori.
Per gli sviluppatori, il lancio include anche il modello Gemini 2.0 Flash, un cavallo da lavoro con bassa latenza e prestazioni migliorate, disponibile tramite l’API di Gemini e Google AI Studio. Questo modello mira a offrire interazioni efficienti in tempo reale, migliorando significativamente la velocità e l’efficacia delle applicazioni AI.
Gemini 2.0 Flash sarà disponibile per gli sviluppatori all’inizio del 2024, e gli utenti possono sperimentare una versione aggiornata dell’assistente Gemini tramite l’app Gemini, ottimizzata per l’accesso mobile e desktop.
Inoltre, nuovi progetti alimentati da Gemini 2.0 mostrano le crescenti capacità degli agenti AI. Project Astra è un assistente AI che utilizza la comprensione multimodale per interagire con il mondo reale. Ha ricevuto preziosi feedback da tester fidati, permettendo a Google di perfezionare le sue capacità.
Gli ultimi aggiornamenti includono un dialogo migliorato, con supporto per molteplici lingue e accenti, e nuove integrazioni di strumenti come Google Search, Lens e Maps. Project Astra vanta anche una memoria migliore, permettendogli di ricordare conversazioni passate, e una latenza inferiore, che consente risposte quasi istantanee.
Google sta espandendo il suo programma di tester e prevede di portare queste funzionalità su vari dispositivi, inclusi gli occhiali prototipo.
Project Mariner, un altro progetto alimentato da Gemini 2.0, è un agente AI basato su browser progettato per assistere con compiti complessi. Può navigare pagine web, comprendere testi, codici, immagini e moduli, e svolgere compiti come compilare moduli.
Sebbene sia ancora in una fase iniziale, ha dimostrato un’impressionante prestazione, raggiungendo l’83,5% di successo nel benchmark WebVoyager. Sono in atto misure di sicurezza, come la richiesta di conferma dell’utente prima di azioni sensibili.
Inoltre, Google sta sperimentando con agenti AI nel gaming, dove aiutano a navigare mondi virtuali, e nella robotica, utilizzando il ragionamento spaziale di Gemini 2.0 per applicazioni nel mondo reale. Google sottolinea lo sviluppo responsabile, lavorando con esperti per mitigare i rischi e garantire la sicurezza in questi avanzati sistemi AI.
Lascia un commento
Annulla