Ecco che Google, dopo aver fatto una timida apparizione nel dicembre scorso con l’accesso a sviluppatori selezionati e tester fidati, ha deciso di aprire il rubinetto: è arrivato Gemini 2.0, la suite di modelli di intelligenza artificiale “più potente” finora creata dal colosso di Mountain View. Ma se vi aspettate una rivoluzione immediata, forse è il caso di rivedere le vostre aspettative.
Gemini 2.0, tanto per iniziare, si presenta con tre varianti. La più robusta, 2.0 Flash, è descritta come “un modello da lavoro, ottimale per compiti di alta frequenza e ad alto volume”, come se le aziende potessero farne un uso intensivo senza battere ciglio. Poi c’è 2.0 Pro Experimental, pensata per gli sviluppatori più affamati di performance nel coding, e infine 2.0 Flash-Lite, la versione economica, ideale per chi vuole spremere ogni centesimo dalla propria carta di credito senza rinunciare alle potenzialità dell’IA. Flash, infatti, costa 10 centesimi ogni milione di “token” per gestire input di testo, immagine e video, mentre la sua versione Lite si ferma a 0,75 centesimi per lo stesso servizio. Non male, no?
Già, i “token” sono l’unità di misura di Google per il lavoro svolto dall’intelligenza artificiale. Ogni “token” rappresenta un frammento di dati che il modello elabora, una piccola parte di un ingranaggio complesso che sta dietro a una promessa che suona sempre più come una speranza: l’avvento di agenti intelligenti in grado di svolgere compiti complessi per conto degli utenti, senza bisogno che questi ultimi spieghino ogni singolo passo.
Siamo ormai in pieno “arms race” tra i big della tecnologia: Meta, Amazon, Microsoft, OpenAI, e ora anche Google, tutti si stanno lanciando nella corsa agli agenti IA. Modelli capaci di compiere azioni “autonome”, che vanno ben oltre la semplice risposta a domande o la generazione di testi. Ma questi agenti sono davvero pronti a prendere il controllo delle nostre vite digitali? Google sembra puntare su un “universale assistente”, ma la domanda è: quanto possiamo fidarci di un assistente che vuole fare tutto da solo?
Nel frattempo, sul fronte dei competitor, c’è chi sta facendo progressi sorprendenti. Anthropic, ad esempio, startup finanziata da Amazon e fondata da ex ricercatori di OpenAI, ha recentemente vantato di aver creato agenti IA in grado di usare i computer come farebbe un essere umano. I suoi modelli sono in grado di completare compiti complessi, come navigare siti web, selezionare pulsanti, inserire testo, e fare altre operazioni attraverso software diversi. Un po’ come se l’IA fosse ormai un estensione della nostra mente, capace di compiere azioni multistep in maniera quasi fluida.
Non si è fatta aspettare nemmeno OpenAI, che ha presentato un’innovazione chiamata “Operator”, un vero e proprio agente in grado di eseguire operazioni come la pianificazione di vacanze, la prenotazione di ristoranti, l’ordine di generi alimentari, e anche la compilazione di moduli. Praticamente, una segretaria digitale con molto più potere.
Ecco la domanda che, a questo punto, si fa largo: davvero le aziende di tecnologia stanno preparando il terreno per agenti IA pronti a rivoluzionare il nostro modo di vivere e lavorare?
Oppure siamo solo all’inizio di un lungo periodo di sperimentazione, dove non sarà il primo a lanciare un prodotto a vincere, ma chi riuscirà ad eseguire con precisione chirurgica la sua visione?
La risposta, per ora, è nelle mani di Sundar Pichai, che, con la calma di chi ha visto tante corse e ha capito che la velocità non è sempre la chiave, ha dichiarato: “Nella storia, non è sempre necessario essere i primi, ma bisogna eseguire bene e davvero essere i migliori nella propria categoria“. Il 2025 potrebbe dunque essere l’anno decisivo, anche se, probabilmente, ci sarà qualcuno che sorriderà di fronte alla fretta di chi, ancora una volta, rischia di inseguire il futuro senza prenderne il controllo.