Google DeepMind ha presentato Gemini 1.5, la nuova generazione del suo modello linguistico.
Gemini 1.5 offre notevoli miglioramenti in diverse dimensioni rispetto alla versione 1.0:
- Architettura più efficiente basata sulla ricerca leader su Transformer e Mixture-of-Experts (MoE), che consente di apprendere attività complesse più rapidamente mantenendo la qualità.
- Maggiore capacità di comprendere contesti lunghi, con una finestra contestuale espandibile fino a 1 milione di token, la più ampia mai offerta da un chatbot consumer.
- Prestazioni paragonabili al modello 1.0 Ultra, il più grande fino ad oggi, ma con un utilizzo inferiore delle risorse di elaborazione.
Gemini 1.5 Pro: La versione all’avanguardia
La prima versione di Gemini 1.5 rilasciata per i test è Gemini 1.5 Pro, un modello multimodale di medie dimensioni ottimizzato per scalare su una vasta gamma di compiti[1]. Gemini 1.5 Pro offre:
- Notevoli miglioramenti nei benchmark pubblici in aree come ragionamento, codifica, comprensione di immagini e video.
- Capacità di seguire istruzioni sempre più complesse, incluse quelle che specificano il comportamento a livello di prodotto.
- Controllo migliorato sulle risposte per casi d’uso specifici come la creazione di agenti di chat personalizzati.
- Comprensione dell’audio, oltre alle immagini, nei video caricati in Google AI Studio.
Gemini 1.5 e il futuro degli assistenti AI
Google sta apportando numerosi aggiornamenti a Gemini, tra cui una finestra contestuale più ampia, nuova analisi dei dati, collegamenti ad altre app Google e più opzioni personalizzabili. Questi progressi sono parte della missione di Google DeepMind di sviluppare l’intelligenza artificiale in modo responsabile e a servizio delle persone, con l’obiettivo di costruire un agente AI universale utile nella vita quotidiana.