Gpt2 Archivi - Rivista AI

Un nuovo modello di intelligenza artificiale denominato “gpt2-chatbot” è apparso senza annuncio su LMSYS Chatbot Arena. Ha superato GPT-4 di OpenAI e Claude Opus di Anthropic nei compiti di ragionamento, codifica e matematica, sbalordendo i ricercatori con le sue capacità.

I primi resoconti del modello sono apparsi per la prima volta su 4chan, poi si sono diffusi su piattaforme di social media come X , seguito subito dopo dall’hype .

C’è una teoria tra gli sviluppatori che suggerisce che sia stata scoperta una nuova tecnica per addestrare modelli linguistici in modo più efficiente. Questo avrebbe portato alla creazione di un modello di dimensioni simili a GPT-2, ma con prestazioni pari a GPT-4. Il test di questo modello segreto potrebbe essere un preludio a qualcosa di più grande. Ci sono opinioni contrastanti sulla sua natura e sulle potenzialità, ma molti sono entusiasti delle possibilità rivoluzionarie che potrebbe portare.

Alcuni credono che un team lo abbia rilasciato per mostrare le capacità dell’intelligenza artificiale e generare buzz, simile a GPT-4chan nel 2022.

Presenta somiglianze con i modelli OpenAI; Si prevede che OpenAI si stia preparando per il rilascio del suo prossimo modello principale, GPT-5, quest’estate. Gpt2 si autoidentifica come creato da OpenAI; Il CEO di OpenAI Sam Altman ha twittato in modo criptico “Ho un debole per gpt2”. Potrebbe essere la prossima iterazione, deludente ma non sorprendente.

There is a mysterious new model called gpt2-chatbot accessible from a major LLM benchmarking site. No one knows who made it or what it is, but I have been playing with it a little and it appears to be in the same rough ability level as GPT-4. A mysterious GPT-4 class model? Neat! pic.twitter.com/1s2iEreaiT
— Ethan Mollick (@emollick) April 29, 2024

Intelligenza Artificiale, Innovazione e Trasformazione Digitale

Tag: Gpt2

Ho un debole per Gpt2