Google DeepMind ha presentato Gemini 1.5, la nuova generazione del suo modello linguistico.

Gemini 1.5 offre notevoli miglioramenti in diverse dimensioni rispetto alla versione 1.0:

  • Architettura più efficiente basata sulla ricerca leader su Transformer e Mixture-of-Experts (MoE), che consente di apprendere attività complesse più rapidamente mantenendo la qualità.
  • Maggiore capacità di comprendere contesti lunghi, con una finestra contestuale espandibile fino a 1 milione di token, la più ampia mai offerta da un chatbot consumer.
  • Prestazioni paragonabili al modello 1.0 Ultra, il più grande fino ad oggi, ma con un utilizzo inferiore delle risorse di elaborazione.

Gemini 1.5 Pro: La versione all’avanguardia

La prima versione di Gemini 1.5 rilasciata per i test è Gemini 1.5 Pro, un modello multimodale di medie dimensioni ottimizzato per scalare su una vasta gamma di compiti[1]. Gemini 1.5 Pro offre:

  • Notevoli miglioramenti nei benchmark pubblici in aree come ragionamento, codifica, comprensione di immagini e video.
  • Capacità di seguire istruzioni sempre più complesse, incluse quelle che specificano il comportamento a livello di prodotto.
  • Controllo migliorato sulle risposte per casi d’uso specifici come la creazione di agenti di chat personalizzati.
  • Comprensione dell’audio, oltre alle immagini, nei video caricati in Google AI Studio.

Gemini 1.5 e il futuro degli assistenti AI

Google sta apportando numerosi aggiornamenti a Gemini, tra cui una finestra contestuale più ampia, nuova analisi dei dati, collegamenti ad altre app Google e più opzioni personalizzabili. Questi progressi sono parte della missione di Google DeepMind di sviluppare l’intelligenza artificiale in modo responsabile e a servizio delle persone, con l’obiettivo di costruire un agente AI universale utile nella vita quotidiana.