Google ha annunciato il rilascio di Gemma 2, un aggiornamento significativo della sua famiglia di modelli AI, che sarà lanciato a giugno 2024. Questo nuovo modello presenta un’architettura con 27 miliardi di parametri, segnando un notevole miglioramento rispetto alle versioni precedenti con 2 miliardi e 7 miliardi di parametri.

L’introduzione di Gemma 2 è stata evidenziata durante la conferenza per sviluppatori Google I/O 2024, dove è stato sottolineato che questo modello è progettato per prestazioni ed efficienza eccezionali su varie piattaforme hardware, inclusi i GPU Nvidia e i TPU di Google Cloud.

Gemma 2 è dichiarato in grado di superare modelli che sono il doppio della sua dimensione, offrendo prestazioni di prim’ordine nella sua categoria. Questo è particolarmente notevole per la sua variante da 9 miliardi di parametri, che dimostra anche capacità superiori rispetto ad altri modelli nella sua fascia di dimensione.

Il modello è disponibile con una licenza commerciale favorevole, consentendo a sviluppatori e ricercatori di utilizzare e condividere liberamente le proprie innovazioni. Può essere accessibile tramite piattaforme come Google AI Studio, Kaggle e attraverso un piano gratuito per i notebook Colab, rendendolo ampiamente disponibile per esperimenti e sviluppo.

Gemma 2 è stato specificamente ottimizzato per un’inferenza efficiente su vari setup hardware, riducendo significativamente i costi operativi mantenendo alte prestazioni. Questa ottimizzazione si estende sia agli ambienti locali che a quelli basati su cloud, assicurando che gli utenti possano sfruttare il modello in modo efficace, indipendentemente dalla loro infrastruttura.

Dopo il rilascio di Gemma 2, Google prevede di introdurre varianti aggiuntive, inclusa una variante da 2,6 miliardi di parametri mirata a bilanciare accessibilità leggera con prestazioni potenti. Questo indica un impegno a espandere la famiglia Gemma per soddisfare le diverse esigenze delle applicazioni AI.

Il lancio di Gemma 2 rappresenta un passo avanti significativo nelle offerte di modelli AI di Google, promettendo capacità migliorate per sviluppatori e ricercatori che cercano di sfruttare la potenza dei modelli di linguaggio di grandi dimensioni nei loro progetti.