In un settore in continua evoluzione come l’intelligenza artificiale (IA), OpenAI sta affrontando una sfida significativa con il modello Orion, la cui performance sembra migliorare a un ritmo inferiore rispetto ai modelli precedenti. Le aspettative erano elevate, considerando il rapido progresso tra GPT-3 e GPT-4, ma le fonti indicano che il salto di qualità da GPT-4 a GPT-5 è inferiore al previsto, sollevando dubbi tra i ricercatori e i sostenitori di OpenAI.

Dati emersi dal testing interno indicano che Orion ha raggiunto prestazioni paragonabili a GPT-4 dopo solo il 20% del suo addestramento. Tuttavia, gli esperti osservano che le fasi iniziali dell’addestramento spesso generano i progressi più significativi, con miglioramenti marginali nelle fasi successive. Questo aspetto potrebbe limitare l’impatto del restante 80% dell’addestramento, indicando un divario più stretto di quello sperato tra Orion e il suo predecessore.

Le implicazioni per OpenAI sono considerevoli. Dopo il recente round di finanziamento da 6,6 miliardi di dollari, le aspettative degli investitori sono più alte che mai, ma gli ostacoli tecnici alla scalabilità potrebbero attenuare l’entusiasmo. Se Orion non rispetta le aspettative, la strada per i futuri finanziamenti potrebbe rivelarsi più complessa, specialmente in un contesto in cui il CEO Sam Altman sembra orientato verso una monetizzazione più spinta dell’azienda.

La Carenza di Dati di Alta Qualità e la Necessità di Nuove Strategie

Uno dei problemi principali è la scarsità di dati pubblici di alta qualità, essenziali per l’addestramento di modelli su larga scala. Ricerche recenti stimano che le fonti pubbliche di testo generato da umani potrebbero esaurirsi tra il 2026 e il 2032. Questo scenario evidenzia la difficoltà di sostenere l’IA tramite il solo approccio basato sulla crescita dei dati, costringendo i team di ricerca ad esplorare strategie alternative.

OpenAI e altre aziende di IA stanno valutando approcci come la generazione di dati sintetici, il transfer learning da domini ricchi di dati e l’uso di dati non pubblici. Tuttavia, questi metodi richiedono sviluppi tecnologici sofisticati e investimenti considerevoli. L’ottimizzazione non può più dipendere solo dall’aumento della quantità di dati, ma richiede una gestione più intelligente delle risorse esistenti.

La Strategia di OpenAI: Separazione dei Modelli e Focus sulle Capacità di Ragionamento

Per affrontare queste sfide, OpenAI sta adottando una strategia che separa i modelli in due linee di sviluppo distinte. Da una parte, la serie O, nome in codice “Strawberry”, si focalizza su compiti complessi di ragionamento, richiedendo una potenza computazionale significativamente superiore. Questi modelli mirano a risolvere problemi analitici complessi, anche se a costi operativi sei volte superiori rispetto ai modelli attuali.

Sebbene questi costi rappresentino un onere significativo, l’aumento delle capacità di ragionamento potrebbe giustificare la spesa per applicazioni che richiedono elaborazioni avanzate. Con modelli progettati specificamente per il ragionamento, OpenAI punta a mantenere una posizione di leadership nel settore, bilanciando le prestazioni nei compiti di linguaggio con la capacità di gestire sfide intellettualmente più elevate.