La Rivoluzione di DeepSeek R1: L’Intelligenza Artificiale Cinese Sfida Silicon Valley e Rimescola le Carte

L’annuncio della cinese DeepSeek di questa settimana ha scosso le fondamenta della Silicon Valley, mettendo in crisi il predominio delle big tech americane. Il lancio del modello di linguaggio R1 non solo ha segnato un traguardo tecnico impressionante, ma ha anche messo in discussione la capacità delle aziende statunitensi di mantenere il loro vantaggio tecnologico nel settore dell’intelligenza artificiale.

DeepSeek, supportata esclusivamente dal fondo hedge High-Flyer, ha rilasciato lunedì uno studio dettagliato sul proprio modello R1, sottolineando come sia possibile costruire modelli avanzati con budget limitati, il modello esegue query a soli $ 0,14 per milione di token rispetto ai
$ 7,50 di OpenAI (-98%) e senza supervisione umana diretta. Questa rivelazione contrasta con l’approccio ad alto capitale che caratterizza le aziende americane come OpenAI, Meta e Anthropic, le quali hanno investito miliardi nello sviluppo di modelli di linguaggio.

DeepSeek-R1-Zero, un modello sviluppato con apprendimento di rinforzo su larga scala senza necessità di messa a punto fine supervisionata come fase iniziale, dimostra eccezionali abilità di ragionamento, secondo il documento di ricerca.

Il fondatore di DeepSeek e High-Flyer, Liang Wenfeng, ha visto il suo status salire vertiginosamente. Dopo l’exploit del modello R1, Wenfeng è diventato uno dei volti principali del settore in Cina, tanto da essere l’unico leader dell’AI invitato a un incontro con Li Qiang, il secondo leader più potente del paese.

Jim Fan di NVDIA ha dichiarato: “Stiamo vivendo in una linea temporale in cui un’azienda non statunitense mantiene viva la missione originale di OpenAI: una ricerca di frontiera veramente aperta che dà potere a tutti”, ha osservato Fan, elogiando la trasparenza senza precedenti di DeepSeek.

I benchmark pubblicati da DeepSeek dimostrano che il modello R1 ha superato le prestazioni dei concorrenti americani, creando scalpore nel settore. Come Meta con il suo Llama, anche DeepSeek ha optato per un approccio open-source, una scelta che si discosta dalla recente strategia di OpenAI, sempre più orientata verso un ecosistema chiuso nonostante le sue origini open-source.

R1 non è solo un trionfo tecnologico, ma anche un successo strategico. Nonostante le restrizioni imposte dagli Stati Uniti sull’esportazione di chip avanzati, come gli Nvidia H100, DeepSeek è riuscita a superare queste barriere, dimostrando che le sanzioni non hanno avuto l’effetto sperato. L’origine delle sue capacità hardware rimane in parte un mistero, alimentando il dibattito su quanto accesso la Cina abbia realmente ai chip più avanzati.

Satya Nadella, CEO di Microsoft, ha definito il modello R1 “impressionante“, evidenziando la sua efficienza computazionale e la capacità di eseguire compiti complessi con risorse relativamente limitate. Nadella ha anche sottolineato l’importanza di prendere sul serio gli sviluppi provenienti dalla Cina, un segnale che il panorama globale dell’IA sta diventando sempre più competitivo.

“Tramite RL, DeepSeek-R1-Zero emerge naturalmente con numerosi comportamenti di ragionamento potenti e interessanti”, hanno affermato i ricercatori nel loro articolo. Il modello ha persino sviluppato capacità sofisticate come l’autoverifica e la riflessione senza essere esplicitamente programmato per farlo.

Durante l’addestramento, il modello ha imparato a dedicare più “tempo di riflessione” a problemi complessi e a riconoscere i propri errori. I ricercatori hanno osservato un “momento di illuminazione” quando il modello rivalutava i suoi approcci iniziali ai problemi, senza essere stato programmato per farlo. Le prestazioni sono impressionanti. Nel benchmark matematico AIME 2024, DeepSeek R1 ha ottenuto un successo del 79,8%, superando il modello di ragionamento o1 di OpenAI. Nei test di codifica, ha dimostrato prestazioni di “livello esperto”, con un punteggio Elo di 2.029 su Codeforces, superando il 96,3% dei concorrenti umani.

Anche Alexandr Wang, CEO di Scale AI, ha alimentato la narrativa di una vera e propria “guerra dell’IA” tra Stati Uniti e Cina. In un’intervista a CNBC, Wang ha affermato che la Cina potrebbe avere un accesso ai chip Nvidia H100 molto più ampio di quanto si pensi comunemente, una preoccupazione che mette in discussione il livello reale del gap tecnologico tra le due superpotenze.

Tuttavia, Silicon Valley non resta a guardare. Il progetto Stargate, annunciato questa settimana da Sam Altman, CEO di OpenAI, e dal presidente Donald Trump alla Casa Bianca, rappresenta una risposta aggressiva. Con un budget di 500 miliardi di dollari in quattro anni, Stargate mira a creare un’infrastruttura IA senza precedenti, basata sui chip di nuova generazione Blackwell di Nvidia. Oracle, Arm e Microsoft sono tra i principali partner di questa iniziativa, sottolineando il peso politico ed economico che gli Stati Uniti stanno riversando in questa competizione.

Questa nuova fase dello sviluppo dell’IA non riguarda solo tecnologia e innovazione, ma riflette una lotta geopolitica più ampia per il controllo del futuro tecnologico. Se DeepSeek rappresenta il simbolo della resilienza e dell’innovazione cinese, Stargate incarna l’ambizione americana di mantenere la leadership globale. La competizione si prospetta serrata, e il risultato finale definirà il ruolo che ciascuna nazione giocherà nel prossimo decennio.

Per approfondire clicca qui

La Rivoluzione di DeepSeek R1: L’Intelligenza Artificiale Cinese Sfida Silicon Valley e Rimescola le Carte

𝗔𝗰𝘁𝗶𝘃𝗲𝗽𝗶𝗲𝗰𝗲𝘀: Il Futuro dell’Automazione del Lavoro con Open-Source e Intelligenza Artificiale

Il futuro conversazionale dell’editoria: una rivoluzione guidata dall’Intelligenza Artificiale by Politecnico di Milano (POK)