Una volta tutti volevano battere OpenAI. Era il punto di riferimento, il benchmark, il modello da superare. Adesso? Non più. Il nuovo boss della giungla si chiama DeepSeek, direttamente dalla Cina, e tutti gli altri sono di colpo diventati i comprimari di una storia che non hanno scritto.
Lunedì scorso, DeepSeek ha fatto saltare il banco, causando miliardi di perdite a Wall Street e mettendo in crisi l’intero ecosistema AI americano. A Washington qualcuno ha cominciato a sudare freddo, mentre i venture capitalist hanno iniziato a chiedersi se i loro miliardi siano stati investiti nel posto giusto. La risposta, almeno per ora, sembra essere “no”.
NUOVI SFIDANTI? BUONA FORTUNA
Nel caos generale, due nuovi giocatori hanno deciso di buttarsi nella mischia: l’Allen Institute for AI di Seattle e Alibaba. Entrambi sostengono di aver creato modelli AI migliori di DeepSeek V3. La realtà? Si vedrà.
L’Allen Institute, famoso per progetti di ricerca più accademici che rivoluzionari, ha sfornato Tülu 3, un mostro da 405 miliardi di parametri, open-source e pronto per il test. Secondo loro, questo modello dimostra che si può fare AI avanzata senza nascondere il codice dietro un paywall o una NDA scritta in piccolo.
Parliamo di numeri: Meta, che non si è ancora arresa, ha il suo Llama-3.3 con 70 miliardi di parametri. Ma il suo Llama-3.1, con la stessa mole di Tülu 3, non sembra essere il game changer che tutti speravano.
La cosa più divertente? Per far funzionare il loro gigante, quelli dell’Allen Institute hanno dovuto mettere insieme 32 nodi con 256 GPU in parallelo. Un’operazione che ricorda più un tentativo disperato di scalare un grattacielo con un elastico che una rivoluzione tecnologica.
E GLI AMERICANI GRIDANO AL FURTO
Nel frattempo, gli Stati Uniti non l’hanno presa bene. Il governo di Washington, con il supporto bipartisan di politici che fino a ieri non sapevano distinguere un algoritmo da un tostapane, ha lanciato accuse di furto tecnologico contro DeepSeek.
Howard Lutnick, nuovo candidato a Segretario del Commercio, ha dichiarato davanti al Senato che DeepSeek avrebbe “rubato tecnologia, hackerato i sistemi e preso la nostra IP”. Dichiarazioni forti, che rispecchiano il panico crescente di fronte a una Cina che non si limita più a copiare, ma ora crea e innova a una velocità che Silicon Valley fatica a tenere.
IL RINFORZO DALLA CINA: ALIBABA E QWEN 2.5-MAX, Tülu 3
Ma DeepSeek non è sola. Alibaba ha deciso di rincarare la dose con il lancio di Qwen 2.5-Max, un modello addestrato su oltre 20 trilioni di token. Il tempismo non è casuale: mentre gli americani piangono, i cinesi festeggiano il Capodanno Lunare con una AI che supera DeepSeek V3 in coding, matematica, ragionamento e conoscenza generale.
Le performance sono impressionanti: Qwen 2.5-Max batte GPT-4o e Claude 3.5-Sonnet in benchmark cruciali come Arena-Hard, LiveBench, LiveCodeBench e GPQA-Diamond. E non è solo un modello testato in laboratorio: Alibaba lo ha rilasciato con una API compatibile con OpenAI, rendendolo accessibile a sviluppatori e aziende in cerca di alternative.
Il dettaglio più interessante? Il loro portale Qwen Chat.
Qwen Chat consente agli utenti di generare testo, codice e immagini. Supporta ricerca web, artefatti e un generatore di video, tutto nella stessa interfaccia, gratuitamente. Include una funzione unica che permette di far “combattere” due modelli per ottenere la risposta migliore.
A differenza di Tülu 3, che si limita al testo, Qwen 2.5-Max offre immagini, codice, ricerca web e perfino generazione video. Se sei un utente comune, è probabilmente l’interfaccia AI più versatile oggi disponibile.
Alibaba offre il modello tramite la sua piattaforma cloud con un’API compatibile con OpenAI, permettendo agli sviluppatori di integrarlo facilmente. La documentazione aziendale include esempi di utilizzo per favorire una diffusa adozione. Il portale web Qwen Chat di Alibaba è perfetto per utenti comuni e molto impressionante per chi crea un account. È probabilmente l’interfaccia chatbot AI più versatile disponibile.
Ma Tülu 3 (Il modello è disponibile su (Playground di Allen AI ) presenta un aspetto intrigante: il suo nuovo framework RLVR (Reinforcement Learning with Verifiable Rewards) ha mostrato notevole efficacia nei compiti di ragionamento matematico verificate con questi TEST. Ogni iterazione RLVR dura circa 35 minuti, con l’inferenza che richiede 550 secondi, il trasferimento dei pesi 25 secondi e la fase di addestramento 1.500 secondi. L’IA migliora nella risoluzione dei problemi a ogni ciclo.

L’apprendimento per rinforzo con ricompense verificabili (RLVR) è un metodo formativo simile a un avanzato sistema di tutoraggio. L’intelligenza artificiale riceve compiti, come risolvere problemi matematici, e ottiene feedback immediato sulla correttezza delle risposte.
A differenza dell’addestramento tradizionale dell’intelligenza artificiale, dove il feedback umano può essere soggettivo, RLVR premiava l’intelligenza artificiale solo per risposte verificabilmente corrette, simile a un insegnante di matematica che riconosce soluzioni giuste o sbagliate. Questo rende il modello efficace nei problemi di matematica e logica, ma meno adatto per compiti come la scrittura creativa, il gioco di ruolo o l’analisi dei fatti.
Il modello è disponibile per il download tramite Hugging Face , con alternative che vanno da 8 miliardi di parametri alla gigantesca versione da 405 miliardi di parametri.
LA GUERRA NON È FINITA
DeepSeek ha già dimostrato che l’open-source può competere con le big tech. Ma ora Alibaba ha alzato la posta. Se DeepSeek continuerà sulla sua strada, potrebbe lanciare un nuovo modello distillato da Qwen, rendendolo ancora più potente e accessibile.
Nel frattempo, OpenAI cerca di salvare il salvabile con il lancio del modello o3, che secondo alcuni analisti potrebbe costare fino a 1.000 dollari per query. Una cifra che farebbe comodo a Sam Altman per pagare i server, ma che rischia di alienare sviluppatori e aziende che non vogliono vendere un rene per accedere all’AI di punta.
Per dolce: Kimi k1.5 di Moonshot AI sfida OpenAI 01 in matematica, codifica e comprensione visiva, grazie a un contesto lungo fino a 128k. Tencent, con il suo Hunyuan, e iFLYTEK con Spark V4.0 Turbo, dimostrano come la ricerca cinese stia spingendo i confini dell’elaborazione del linguaggio naturale.
La famiglia Yi di 01.AI offre modelli open-source con una forte capacità bilingue, e Baichuan propone soluzioni ottimizzate per efficienza e prestazioni. Questa ondata di innovazione dimostra che la competizione globale è più aperta che mai, con la Cina pronta a ridefinire gli equilibri del settore AI.
La guerra dell’AI non è finita. È appena cominciata.
