Quando una start-up cinese fa tremare i giganti della Silicon Valley non è mai un caso, è un segnale. DeepSeek, con la sua atmosfera da thriller tecnologico, sta scatenando una tempesta di speculazioni online, lasciando il mondo dell’AI con il fiato sospeso. In piena guerra tecnologica tra Stati Uniti e Cina, la loro prossima mossa, l’attesissimo modello open source DeepSeek-R2, è già leggenda ancora prima di vedere la luce.

Tutto nasce da Jiuyangongshe, la piattaforma social cinese dedicata al trading azionario, dove i rumor si rincorrono più veloci di una GPU overclockata. Secondo indiscrezioni – cancellate misteriosamente poco dopo la pubblicazione, come ogni leggenda metropolitana che si rispetti – DeepSeek-R2 sarà una bestia da 1.2 trilioni di parametri. Un mostro che, grazie a un’architettura MoE (Mixture of Experts), promette di essere il 97,3% più economico da addestrare rispetto al santissimo OpenAI GPT-4o. Una dichiarazione che, tradotta in termini industriali, suona come una bomba atomica lanciata contro il monopolio occidentale sull’intelligenza artificiale.

Per chi non mastica ogni giorno machine learning a colazione, MoE significa spezzettare il modello in tanti mini-esperti, ciascuno addestrato su un pezzetto di realtà, per lavorare in parallelo riducendo drasticamente i costi computazionali. Una strategia che suona diabolicamente efficiente, ma che richiede una regia impeccabile per funzionare a regime.

E qui arriva l’altro pugno nello stomaco per l’asse USA: DeepSeek avrebbe usato server basati sui chip Ascend 910B di Huawei, raggiungendo una efficienza del 91% rispetto ai cluster Nvidia A100, ovvero i cavalli da tiro delle AI occidentali. Un insulto ben calibrato all’embargo tecnologico imposto dagli americani, condito dalla nota velenosa che DeepSeek potrebbe aver trasmesso dati a server ByteDance senza consenso, accusa sussurrata da fonti sudcoreane e rapidamente insabbiata.

Su X (il social che un tempo chiamavamo Twitter, quando ancora esistevano certezze), la notizia è esplosa come un incendio in una fabbrica di fuochi d’artificio. Deedy Das di Menlo Ventures, uno che mastica startup da trent’anni, ha sottolineato come il caso DeepSeek-R2 rappresenti una “grande fuga dalle supply chain americane”, alimentando il panico tra gli investitori high-tech a stelle e strisce.

In tutto questo clamore, DeepSeek tace, mostrando una disciplina monastica che, a confronto, i ninja sembrano chiassosi. Niente comunicati ufficiali, niente teaser, solo qualche paper scientifico buttato lì come esca per pesci troppo curiosi. L’ultimo aggiornamento reale risale a un mese fa, quando hanno migliorato il loro modello V3, quasi fosse un avvertimento silenzioso.

È quasi poetico vedere come, in un mondo dominato da aziende che annunciano ogni beta release come se fosse il Secondo Avvento, DeepSeek abbia scelto la via del mistero, alimentando una hype machine che nemmeno i più sofisticati team di marketing occidentali riuscirebbero a orchestrare.