L’era dell’IA agentica, in cui le intelligenze artificiali formulano ipotesi, le verificano e prendono decisioni autonomamente senza intervento umano, è ormai alle porte. Tuttavia, sviluppare modelli di ragionamento ad alte prestazioni è una sfida che solo poche aziende nel mondo sono riuscite a superare. In questo contesto, LG AI Research ha svelato EXAONE Deep, un’IA di ragionamento avanzato che promette di competere con i leader del settore.

EXAONE Deep eccelle nella comprensione della logica matematica, nel ragionamento su concetti scientifici e nella risoluzione di problemi di programmazione, affermandosi come un modello altamente performante specializzato nel ragionamento avanzato.

Per raggiungere questi risultati, LG AI Research ha concentrato gli sforzi sul miglioramento delle prestazioni di ragionamento in matematica, scienza e coding, garantendo al contempo la capacità del modello di comprendere e applicare conoscenze in vari domini.

I risultati sono sorprendenti: il modello EXAONE Deep 32B ha ottenuto 94,5 punti nella sezione matematica del CSAT 2025 e 90,0 punti all’AIME 2024, dimostrando prestazioni superiori rispetto a modelli concorrenti di dimensioni significativamente maggiori.

In particolare, ha eguagliato le prestazioni del modello DeepSeek-R1 da 671 miliardi di parametri, pur avendo solo il 5% delle sue dimensioni, evidenziando un’efficienza di apprendimento e un rapporto costo-efficacia notevoli.

Anche le versioni più leggere di EXAONE Deep hanno ottenuto risultati eccellenti. Il modello da 7,8 miliardi di parametri ha raggiunto 94,8 punti nel MATH-500 e 59,6 all’AIME 2025, mentre la versione da 2,4 miliardi ha ottenuto 92,3 punti nel MATH-500 e 47,9 all’AIME 2024, posizionandosi al primo posto in tutti i principali benchmark nelle rispettive categorie.

Le capacità di EXAONE Deep non si limitano alla matematica. Nel campo scientifico e del coding, il modello da 32 miliardi di parametri ha ottenuto un punteggio di 66,1 nel test GPQA Diamond, che valuta le abilità di problem-solving a livello di dottorato in fisica, chimica e biologia.

Inoltre, ha raggiunto 59,5 punti nel LiveCodeBench, un benchmark per valutare le capacità di coding, superando altri modelli di ragionamento IA di dimensioni simili. Anche le versioni da 7,8 e 2,4 miliardi di parametri si sono classificate al primo posto nei test GPQA Diamond e LiveCodeBench, dimostrando un’elevata applicabilità in domini che richiedono conoscenze specialistiche.

Oltre alle competenze specialistiche, EXAONE Deep offre prestazioni eccezionali nella comprensione generale del linguaggio. Ha ottenuto il punteggio MMLU più alto tra i modelli sviluppati in Corea, stabilendo un nuovo standard per le capacità di ragionamento generale.

Subito dopo il suo rilascio, EXAONE Deep 32B è stato inserito nella lista dei modelli IA notevoli di Epoch AI, a conferma delle sue prestazioni. Questo risultato segue il successo di EXAONE 3.5, rendendo EXAONE l’unico modello coreano ad essere stato incluso in questa lista negli ultimi due anni.

EXAONE Deep rappresenta un passo significativo nell’espansione delle capacità di ragionamento dell’IA in vari domini, affrontando sfide di problem-solving sempre più complesse. Attraverso una ricerca e un’innovazione continue, LG AI Research mira a far progredire l’IA per contribuire ad arricchire e migliorare la comodità della vita umana.