Secondo New Street Research, l’infrastruttura dell’intelligenza artificiale (IA) non mostra segni di rallentamento nel prossimo futuro, grazie a un aumento della spesa in potenza di calcolo che porta a modelli sempre più performanti. Questo crea un ciclo di autoperpetuazione, dove la domanda di potenza di calcolo alimenta ulteriormente lo sviluppo di modelli più avanzati.
Gli analisti di New Street Research, guidati da Pierre Ferragu, hanno osservato che, sebbene i costi di inferenza stiano diminuendo rapidamente con la maturazione dei modelli, i nuovi modelli richiedono risorse significativamente maggiori rispetto alle versioni precedenti. Questo incremento dei costi è particolarmente evidente con l’introduzione di capacità di ragionamento avanzato, il che solleva interrogativi sulla sostenibilità economica di tali modelli. Ferragu ha sottolineato che “l’intelligenza artificiale generativa è un business in cui il costo incrementale è orribilmente costoso”, a differenza del software tradizionale, dove il costo incrementale è praticamente nullo.
Aziende come Meta e xAI, la startup fondata da Elon Musk, stanno intensificando gli investimenti in hardware per l’IA. Musk ha recentemente annunciato un cluster di addestramento alimentato da 100.000 GPU H100 di Nvidia, con piani per raddoppiare questa capacità nei prossimi mesi. Meta, dal canto suo, prevede di avere 350.000 GPU H100 entro la fine dell’anno per supportare le sue iniziative di IA.
Nvidia attualmente domina il mercato dei chip per IA, controllando tra il 70% e il 95% del mercato per i chip utilizzati nel training e nell’inferenza dei modelli. Le sue GPU, come le H100, sono state fondamentali per il suo successo, ma la crescente concorrenza da parte di AMD e altri attori sta cominciando a farsi sentire. AMD, pur avendo una quota di mercato inferiore, sta cercando di competere lanciando GPU per IA e ha recentemente acquisito ZT Systems per rafforzare la sua posizione.
Ferragu ha affermato che, nonostante ci possano essere pause o correzioni nel mercato, non si prevede un picco insostenibile nella domanda di IA. La continua evoluzione e miglioramento della comprensione economica dell’IA suggerisce che ci sia ancora spazio per una crescita significativa. Tuttavia, la questione principale rimane se i costi crescenti dei modelli di nuova generazione siano sostenibili a lungo termine.
L’industria dell’intelligenza artificiale sta vivendo una fase di rapida crescita e innovazione, supportata da un aumento della potenza di calcolo e da investimenti significativi in hardware. Tuttavia, le sfide legate ai costi di inferenza e alla sostenibilità economica dei nuovi modelli rimangono questioni cruciali da affrontare.