Nel panorama tecnologico, il progresso verso l’intelligenza artificiale generale (AGI) è costellato di trionfi straordinari e controversie altrettanto rilevanti. Recentemente, OpenAI ha portato avanti una campagna con la quale vantava le capacità matematiche avanzate del modello GPT-3.5, che ha stupito molti con il suo apparente dominio nel risolvere una serie di problemi matematici complessi definiti con il benchmark FrontierMath, che trovate in allegato. Questi problemi, pensati per mettere alla prova le capacità di risoluzione matematica di modelli linguistici (LLM), sono stati etichettati come indipendenti e unici, con l’intento di dimostrare l’evoluzione delle capacità dei modelli di OpenAI in un ambito considerato fino a quel momento particolarmente arduo per l’intelligenza artificiale.

Tuttavia, un dettaglio che era rimasto nell’ombra in precedenza, è emerso in modo sorprendente grazie a una dichiarazione pubblica di Tamay Besiroglu, il fondatore di Epoch.AI, l’azienda che ha creato il benchmark FrontierMath. In un thread su Reddit, Besiroglu ha svelato un aspetto poco noto: OpenAI non solo ha finanziato Epoch.AI, ma ha avuto accesso al benchmark FrontierMath molto prima che iniziasse l’allenamento del modello GPT-3.5. Eppure, secondo l’accordo verbale, OpenAI avrebbe giurato di non utilizzare quei dati per allenare il modello. Una dichiarazione che solleva dubbi etici e tecnici su come OpenAI ha gestito le informazioni a sua disposizione.