Epoch AI ha recentemente pubblicato due articoli che affrontano temi cruciali nell’evoluzione dei modelli di intelligenza artificiale (IA).

Il primo studio esplora il divario nelle prestazioni tra modelli di IA aperti e chiusi, scoprendo che i modelli “open-source” sono in ritardo di circa un anno rispetto ai modelli chiusi. Nonostante la crescente disponibilità di pesi di modelli aperti, che consentono l’adozione e l’adattamento da parte della comunità, questi ultimi non riescono ancora a competere con le prestazioni superiori dei modelli chiusi, come quelli sviluppati da OpenAI e Google. Le differenze non sono solo una questione di accessibilità, ma anche di ottimizzazione computazionale. Ad esempio, pur utilizzando meno potenza di calcolo, i modelli aperti come DeepSeek V2 e Gemma 2 9B non sono riusciti a superare l’efficienza dei modelli chiusi.

Il secondo articolo si concentra su un problema imminente che potrebbe ostacolare la scalabilità dei modelli di IA: i colli di bottiglia nel movimento dei dati. Con l’aumento delle dimensioni dei modelli e della potenza di calcolo necessaria, il trasferimento rapido e l’elaborazione dei dati diventeranno un ostacolo significativo. Nonostante esistano tecniche per ottimizzare questo flusso, come l’uso di architetture di rete più avanzate, non è ancora chiaro se queste soluzioni possano risolvere completamente il problema.

Questi articoli evidenziano le sfide tecniche che l’industria dell’IA deve affrontare mentre cerca di raggiungere un equilibrio tra innovazione, accessibilità e prestazioni computazionali.