Google ha presentato martedì la sesta generazione dei suoi chip con unità di elaborazione tensor, notando un significativo miglioramento rispetto alla generazione precedente. I nuovi chip, denominati Trillium, saranno disponibili per i clienti cloud entro la fine dell’anno e offrono un miglioramento delle prestazioni quasi cinque volte (4,7 volte) rispetto al TPU v5e presentato lo scorso agosto.

Google sta intensificando gli sforzi nella creazione di chip personalizzati per i data center, in un contesto di crescente investimento nell’intelligenza artificiale. Recentemente, la società ha lavorato su CPU per data center, conosciute come Axion, progettate per supportare compiti come l’alimentazione del motore di ricerca di Google e altre attività legate all’IA.

Trillium può addestrare modelli di intelligenza artificiale di nuova generazione più velocemente, con una latenza ridotta e costi inferiori rispetto ai predecessori.

È il TPU più sostenibile di Google fino ad oggi, con oltre il 67% di efficienza energetica in più rispetto al TPU v5p.

Può scalare fino a 256 TPU in un singolo pod ad alta larghezza di banda e bassa latenza.

Supporta la tecnologia multislice, consentendo a Google di interconnettere migliaia di chip per costruire un supercomputer in grado di elaborare petabit di dati al secondo.

Fa parte dell’AI Hypercomputer di Google, un’architettura di supercomputer progettata per gestire carichi di lavoro IA all’avanguardia.

Google collabora con Hugging Face per ottimizzare Trillium per l’addestramento e il servizio di modelli open source.

Google ha introdotto il suo primo TPU v1 nel 2013, seguito dal Cloud TPU nel 2017 che alimenta vari servizi come la ricerca vocale in tempo reale, il riconoscimento di oggetti fotografici, la traduzione linguistica e altro ancora.

Analisti della Bank of America hanno previsto che il mercato globale degli acceleratori di intelligenza artificiale potrebbe raggiungere un valore compreso tra 250 e 500 miliardi di dollari nei prossimi tre-cinque anni, evidenziando un aumento significativo rispetto alle stime precedenti[5].