Noam Brown, un prominente scienziato di ricerca di OpenAI, ha preso la parola martedì alla conferenza TED sull’AI a San Francisco, offrendo un discorso potente sul futuro dell’intelligenza artificiale. Il suo intervento si è concentrato in particolare sul nuovo modello o1 di OpenAI e sul suo potenziale per trasformare le industrie attraverso il ragionamento strategico, la programmazione avanzata e la ricerca scientifica. Brown, che in precedenza ha guidato importanti progressi in sistemi di AI come Libratus, l’AI per il poker, e CICERO, che ha conquistato il gioco della Diplomazia, ora immagina un futuro in cui l’AI non è solo uno strumento, ma un motore centrale di innovazione e decisione in diversi settori.
“Il progresso incredibile nell’AI negli ultimi cinque anni può essere riassunto in una parola: scala,” ha esordito Brown, rivolgendosi a un pubblico catturato di sviluppatori, investitori e leader del settore. “Sì, ci sono stati avanzamenti significativi, ma i modelli di frontiera di oggi si basano ancora sulla stessa architettura a trasformatore introdotta nel 2017. La principale differenza è la scala dei dati e della potenza di calcolo che vengono impiegati.”
Brown, figura centrale negli sforzi di ricerca di OpenAI, ha sottolineato che, sebbene il potenziamento dei modelli sia stato un fattore critico nel progresso dell’AI, è giunto il momento di un cambiamento di paradigma. Ha evidenziato la necessità per l’AI di andare oltre la mera elaborazione dei dati, entrando in ciò che ha definito “ragionamento di sistema due”—una forma di ragionamento più lenta e deliberata che rispecchia il modo in cui gli esseri umani affrontano problemi complessi.
Per sottolineare questo punto, Brown ha condiviso una storia dei suoi giorni da dottorando, quando stava lavorando a Libratus, l’AI per il poker che sconfisse giocatori umani di alto livello nel 2017. “Si è scoperto che permettere a un bot di pensare per soli 20 secondi durante una mano di poker ha portato allo stesso miglioramento delle prestazioni di un potenziamento del modello di 100.000 volte e un addestramento per 100.000 volte più a lungo,” ha dichiarato. “Quando ho ottenuto questo risultato, ho pensato che fosse un bug. Per i primi tre anni del mio dottorato, avevo scalato questi modelli di 100 volte. Ero orgoglioso di quel lavoro. Avevo scritto diversi articoli su come farlo, ma sapevo abbastanza rapidamente che tutto ciò sarebbe stato solo una nota a margine rispetto a questo potenziamento del ragionamento di sistema due.”
Brown ha introdotto il ragionamento di sistema due come soluzione ai limiti della scalabilità tradizionale. Popolarizzato dal psicologo Daniel Kahneman nel libro Thinking, Fast and Slow, il ragionamento di sistema due si riferisce a un modo di pensare più lento e deliberato che gli esseri umani usano per risolvere problemi complessi. Brown crede che integrare questo approccio nei modelli di AI potrebbe portare a guadagni significativi in termini di prestazioni, senza richiedere dati o potenza di calcolo esponenzialmente maggiori.
L’Interno del Modello o1 di OpenAI
Il discorso di Brown è arrivato poco dopo il rilascio dei modelli della serie o1 di OpenAI, che introducono il ragionamento di sistema due nell’AI. Lanciati a settembre 2024, questi modelli sono progettati per elaborare le informazioni con maggiore attenzione rispetto ai loro predecessori, rendendoli ideali per compiti complessi in campi come la ricerca scientifica, la programmazione e la decisione strategica.
“Non siamo più vincolati solo all’aumento della formazione di sistema uno. Ora possiamo potenziare anche il ragionamento di sistema due, e la cosa bella di aumentare in questa direzione è che è in gran parte inesplorata,” ha spiegato Brown. “Questa non è una rivoluzione che avverrà tra dieci anni o anche tra due anni. È una rivoluzione che sta accadendo ora.”
I modelli o1 hanno già dimostrato prestazioni solide in vari benchmark. Ad esempio, in un esame di qualificazione per le Olimpiadi Internazionali di Matematica, il modello o1 ha raggiunto un tasso di precisione dell’83%—un notevole miglioramento rispetto al 13% ottenuto dal GPT-4o di OpenAI. Brown ha notato che la capacità di ragionare attraverso formule matematiche complesse e dati scientifici rende il modello o1 particolarmente prezioso per le industrie che si basano su decisioni guidate dai dati.
Per le aziende, il modello o1 di OpenAI offre vantaggi oltre le prestazioni accademiche. Brown ha sottolineato che il potenziamento del ragionamento di sistema due potrebbe migliorare i processi decisionali in settori come la sanità, l’energia e la finanza. Ha utilizzato il trattamento del cancro come esempio, chiedendo al pubblico: “Alzate la mano se sareste disposti a pagare più di 1 dollaro per un nuovo trattamento per il cancro… E che ne dite di 1.000 dollari? E di un milione di dollari?”
Brown ha suggerito che il modello o1 potrebbe aiutare i ricercatori a velocizzare la raccolta e l’analisi dei dati, consentendo loro di concentrarsi sull’interpretazione dei risultati e sulla generazione di nuove ipotesi. Nel settore dell’energia, ha osservato che il modello potrebbe accelerare lo sviluppo di pannelli solari più efficienti, portando a potenziali progressi nelle energie rinnovabili.
Ha riconosciuto lo scetticismo riguardo ai modelli di AI più lenti. “Quando lo menziono alla gente, una risposta frequente che ricevo è che le persone potrebbero non essere disposte ad aspettare alcuni minuti per ottenere una risposta, o a pagare qualche dollaro per avere una risposta a una domanda,” ha detto. Ma per i problemi più importanti, ha argomentato, quel costo vale sicuramente la pena.
Il cambiamento di OpenAI verso il ragionamento di sistema due potrebbe ridefinire il panorama competitivo per l’AI, specialmente nelle applicazioni aziendali. Mentre la maggior parte dei modelli attuali è ottimizzata per la velocità, il processo di ragionamento deliberato dietro o1 potrebbe offrire alle aziende intuizioni più accurate, particolarmente in settori come la finanza e la sanità.
Nel settore tecnologico, dove aziende come Google e Meta investono pesantemente nell’AI, il focus di OpenAI sul ragionamento profondo la distingue. L’AI Gemini di Google, ad esempio, è ottimizzata per compiti multimodali, ma resta da vedere come si confronterà con i modelli di OpenAI in termini di capacità di risoluzione dei problemi.
Detto ciò, il costo dell’implementazione del modello o1 potrebbe limitarne l’adozione diffusa. Il modello è più lento e costoso da gestire rispetto alle versioni precedenti. I rapporti indicano che il modello o1-preview costa 15 dollari per milione di token di input e 60 dollari per milione di token di output, molto più rispetto al GPT-4o. Tuttavia, per le imprese che necessitano di output ad alta precisione, l’investimento potrebbe essere giustificato.
Nel concludere il suo intervento, Brown ha enfatizzato che lo sviluppo dell’AI è a un bivio critico: “Ora abbiamo un nuovo parametro, uno in cui possiamo potenziare anche il ragionamento di sistema due — e siamo appena all’inizio di questo potenziamento in questa direzione.” Le parole di Brown non solo riflettono un avanzamento tecnico significativo, ma anche un cambiamento fondamentale nella concezione di come l’AI può e dovrebbe operare nelle nostre vite quotidiane e nel mondo degli affari.
Credits : VentureBeat