Il Nuovo Modello o1 di OpenAI: Ragionamento Migliorato con Catena di Pensiero

OpenAI ha recentemente lanciato una nuova serie di modelli di intelligenza artificiale conosciuti come OpenAI o1, progettati per migliorare le capacità di ragionamento e affrontare compiti complessi. Questa nuova gamma include due varianti: o1-preview e o1-mini.

“Stiamo introducendo OpenAI o1, un nuovo modello linguistico di grandi dimensioni addestrato con apprendimento per rinforzo per eseguire ragionamenti complessi”, post ufficiale del blog , “o1 pensa prima di rispondere”.

“Per compiti di ragionamento complessi, questo è un progresso significativo e rappresenta un nuovo livello di capacità di intelligenza artificiale”,
ha affermato OpenAI . “Dato questo, stiamo reimpostando il contatore a uno e chiamando questa serie OpenAI o1”.

Il modello utilizza una tecnica chiamata “catena di pensiero” per fornire risposte più accurate e dettagliate. A differenza dei modelli precedenti come ChatGPT che avrebbero rapidamente prodotto una risposta, o1 impiega più tempo per calcolare una risposta suddividendo il problema in passaggi e ragionando attraverso ognuno di essi.

Un precedente modello di IA open source chiamato Reflection aveva sperimentato un approccio simile basato sul ragionamento, ma era stato criticato per la sua mancanza di trasparenza. Quel modello utilizzava tag per separare i passaggi del suo ragionamento, portando a quello che i suoi sviluppatori hanno definito un miglioramento rispetto agli output dei modelli convenzionali.

Le caratteristiche chiave di o1 includono:

Utilizza un approccio a catena di pensiero per risolvere problemi passo dopo passo, simile a come elaborano le informazioni gli esseri umani. Eccelle in compiti complessi e multi-step come la codifica, i problemi di matematica e il ragionamento scientifico.
Fornisce un output dettagliato che mostra l’intero processo di pensiero per arrivare alla risposta finale.
Addestrato utilizzando l’apprendimento per rinforzo per affrontare in modo indipendente i problemi, piuttosto che replicare semplicemente schemi.
Riduce allucinazioni e affermazioni errate rispetto ai modelli precedenti

Tuttavia, o1 ha anche alcune limitazioni:

Tempo di risposta più lento rispetto a GPT-4.
Costoso per gli sviluppatori, con prezzi di 15 dollari per milione di token di input e 60 dollari per milione di token di output nell’API.
Supporta solo input/output di testo attualmente, senza capacità di immagine

Per accedere a o1, gli utenti hanno bisogno di un abbonamento ChatGPT Plus o Team. OpenAI prevede di rendere disponibile in futuro la versione più economica o1-mini a tutti gli utenti di ChatGPT.

Mentre o1 rappresenta un passo verso capacità di ragionamento più simili all’uomo nell’intelligenza artificiale, è importante ricordare che non sta pensando o essendo intelligente nello stesso modo degli esseri umani.

L’obiettivo di OpenAI è quello di continuare a far progredire le capacità di ragionamento nei grandi modelli di linguaggio per consentire sistemi e agenti più autonomi in futuro.

“La serie di modelli o1 è addestrata con apprendimento di rinforzo su larga scala per ragionare usando una catena di pensiero”, afferma OpenAI nella
scheda di sistema della famiglia o1 .

“Addestrare i modelli a incorporare una catena di pensiero prima di rispondere ha il potenziale per sbloccare vantaggi sostanziali, aumentando al contempo i potenziali rischi derivanti da un’intelligenza accresciuta”.

I modelli o1 sono stati specificamente addestrati per dedicare più tempo al pensiero prima di rispondere, consentendo loro di gestire query intricate in modo più efficace rispetto ai modelli precedenti. Questo include prestazioni migliorate in aree come scienza, programmazione e matematica.

OpenAI o1 si posiziona nell’89° percentile per quanto riguarda le domande di programmazione competitiva su Codeforces e ha mostrato risultati notevoli in competizioni matematiche, ottenendo l’83% nell’AIME, rispetto al solo 13% del suo predecessore, GPT-4o. Inoltre, supera l’accuratezza a livello di dottorato umano su benchmark in fisica, biologia e chimica.

I modelli utilizzano un approccio di apprendimento per rinforzo, che consente loro di affinare le proprie strategie di problem-solving e riconoscere gli errori in modo più efficace. Questo metodo contrasta con i modelli precedenti che si concentravano principalmente sulla previsione della parola successiva basata sui modelli dei dati di addestramento.

A partire dal 12 settembre 2024, gli utenti di ChatGPT Plus e Team possono accedere sia a o1-preview che a o1-mini, con piani per estendere la disponibilità agli utenti di ChatGPT Enterprise ed Edu a breve. I modelli saranno anche accessibili tramite l’API di OpenAI, con limiti specifici di utilizzo.

I prezzi per l’uso dell’API sono più elevati rispetto ai modelli precedenti, con o1-preview che costa 15 dollari per milione di token in input e 60 dollari per milione di token in output, riflettendo le sue capacità avanzate.

OpenAI prevede di migliorare ulteriormente i modelli o1 integrando funzionalità aggiuntive come la navigazione in rete e il caricamento di file. L’azienda immagina che questi modelli possano contribuire in modo significativo a settori che richiedono un ragionamento complesso, inclusi sanità e fisica.

La comunità dei jailbreakers è più attiva che mai nel superare i controlli di sicurezza dell’IA: i primi jailbreak di OpenAI 01 sono stati segnalati pochi minuti dopo il rilascio.

Nel tempo, il modello verrà inoltre modificato per soddisfare gli standard minimi di OpenAI in termini di sicurezza, prevenzione del jailbreak e autonomia.

OpenAI o1 rappresenta un significativo avanzamento nelle capacità di ragionamento dell’IA, con l’obiettivo di colmare il divario verso un’intelligenza più simile a quella umana nei sistemi artificiali. Con queste nuove funzionalità e miglioramenti, OpenAI continua a spingere i confini dell’intelligenza artificiale, rendendola sempre più utile e versatile in vari ambiti.

Il Nuovo Modello o1 di OpenAI: Ragionamento Migliorato con Catena di Pensiero

Arista Networks sembra il probabile vincitore del mega cluster di MetaMeta

Catherine Brownstein: OpenAI o1 e la Genetica