OpenAI ha presentato CriticGPT, un nuovo modello di intelligenza artificiale basato su GPT-4 progettato per identificare errori nel codice generato da ChatGPT, segnando un passo significativo verso il miglioramento della precisione e dell’affidabilità degli output generati dall’intelligenza artificiale, ricorda il personaggio Grillo di Pinocchio, Jiminy Cricket.

Introduzione a CriticGPT

reddit.com

reddit.com

Sviluppato da OpenAI, CriticGPT rappresenta un nuovo approccio per migliorare l’affidabilità dei contenuti generati dall’IA. Questo modello innovativo, parte della famiglia GPT-4, è specificamente progettato per assistere i revisori umani nel rilevamento e nella critica degli errori nel codice prodotto da ChatGPT

Sfruttando le capacità avanzate dell’intelligenza artificiale, CriticGPT mira ad affrontare la crescente sfida di valutare risultati dell’intelligenza artificiale sempre più sofisticati, in particolare quando i modelli linguistici di grandi dimensioni diventano più complessi e capaci.

Formazione e prestazioni

Il training di CriticGPT ha utilizzato un dataset con bug intenzionali, permettendo al modello di riconoscere e segnalare vari errori di codifica. Questo metodo innovativo ha portato a risultati notevoli, con CriticGPT che ha individuato circa l’85% dei bug rispetto al 25% rilevato dagli umani. Il feedback del modello è stato preferito nel 63% dei casi di errori LLM naturali, dimostrando la sua superiorità nel rilevamento degli errori.

Per migliorare ancora, i ricercatori hanno sviluppato la tecnica Force Sampling Beam Search (FSBS), che ha aumentato la capacità di CriticGPT di fornire revisioni dettagliate del codice riducendo i falsi positivi.

Applicazioni e limitazioni

neowin.net

neowin.net

Anche se CriticGPT si concentra principalmente sulla revisione del codice, ha dimostrato di poter individuare errori in attività non di codice, mostrando la sua versatilità nel migliorare i risultati dell’IA.

Tuttavia, la sua efficacia può essere limitata in compiti più lunghi e complessi, poiché è stato addestrato su risposte brevi. Nonostante le sue prestazioni impressionanti, CriticGPT produce ancora alcuni falsi positivi e necessita di supervisione umana per garantirne l’accuratezza. Inoltre, il modello ha difficoltà nel rilevare errori su più stringhe di codice, rendendo difficile identificare alcune allucinazioni dell’IA.

icona preferita di arstechnica.com
favicon di siliconangle.com

Piani di integrazione futuri

OpenAI sta pianificando di integrare CriticGPT nella sua pipeline di apprendimento rinforzato basato sul feedback umano (RLHF). Questa integrazione fornirà agli istruttori umani un assistente AI per rivedere e migliorare gli output dell’intelligenza artificiale generativa.

L’obiettivo è potenziare la qualità complessiva e l’allineamento dei sistemi di intelligenza artificiale con le aspettative umane. Sfruttando le capacità avanzate di CriticGPT, OpenAI mira a incrementare l’efficienza e la precisione dei propri processi di formazione AI, aprendo la strada a modelli di intelligenza artificiale più affidabili e sofisticati in futuro.

favicon di openai.com