Un nuovo modello di intelligenza artificiale denominato “gpt2-chatbot” è apparso senza annuncio su LMSYS Chatbot Arena. Ha superato GPT-4 di OpenAI e Claude Opus di Anthropic nei compiti di ragionamento, codifica e matematica, sbalordendo i ricercatori con le sue capacità.
I primi resoconti del modello sono apparsi per la prima volta su 4chan, poi si sono diffusi su piattaforme di social media come X , seguito subito dopo dall’hype .
C’è una teoria tra gli sviluppatori che suggerisce che sia stata scoperta una nuova tecnica per addestrare modelli linguistici in modo più efficiente. Questo avrebbe portato alla creazione di un modello di dimensioni simili a GPT-2, ma con prestazioni pari a GPT-4. Il test di questo modello segreto potrebbe essere un preludio a qualcosa di più grande. Ci sono opinioni contrastanti sulla sua natura e sulle potenzialità, ma molti sono entusiasti delle possibilità rivoluzionarie che potrebbe portare.
Alcuni credono che un team lo abbia rilasciato per mostrare le capacità dell’intelligenza artificiale e generare buzz, simile a GPT-4chan nel 2022.
Presenta somiglianze con i modelli OpenAI; Si prevede che OpenAI si stia preparando per il rilascio del suo prossimo modello principale, GPT-5, quest’estate. Gpt2 si autoidentifica come creato da OpenAI; Il CEO di OpenAI Sam Altman ha twittato in modo criptico “Ho un debole per gpt2”. Potrebbe essere la prossima iterazione, deludente ma non sorprendente.