Nel panorama in continua evoluzione dell’intelligenza artificiale (IA) in Cina, DeepSeek ha fatto un annuncio che potrebbe segnare un punto di svolta. Il 21 febbraio, la startup cinese ha dichiarato che renderà pubblico il codice dei suoi modelli IA, raddoppiando il suo impegno per l’open-source. L’annuncio è stato fatto tramite un post sulla piattaforma social X, dove la società ha annunciato che aprirà 5 repository di codice la prossima settimana. Questa mossa è stata descritta come un “piccolo ma sincero progresso”, con l’intenzione di condividere i propri sviluppi con la massima trasparenza.
L’open-source è diventato un elemento distintivo per DeepSeek, che si differenzia dalla maggior parte delle aziende cinesi di IA. A differenza dei suoi concorrenti occidentali, molte delle aziende cinesi hanno una tendenza a mantenere i propri modelli di IA chiusi, preferendo un approccio commerciale più tradizionale. In un’intervista rara dello scorso luglio, il fondatore di DeepSeek, Liang Wenfeng, aveva sottolineato che l’azienda non era concentrata sulla commercializzazione dei suoi modelli IA, ma piuttosto sul potenziale soft power derivante dal contribuire alla comunità open-source. Liang ha dichiarato che l’open-source è “più un comportamento culturale che commerciale” e che il contributo ad esso conferisce rispetto, mentre la possibilità che altri seguano le proprie innovazioni porta un forte senso di realizzazione.
Questa filosofia open-source è stata esemplificata dal rilascio del modello di ragionamento R1 di DeepSeek, che lo scorso mese ha scosso l’industria globale dell’IA. Non solo il modello ha rivaleggiato con le performance dei sistemi occidentali, ma è stato sviluppato a un costo significativamente inferiore. Questo approccio ha reso l’azienda cinese una delle realtà più innovative nel campo dell’IA, ma anche una delle più impegnate nella costruzione di un ecosistema di sviluppo aperto.
Con l’apertura del codice, DeepSeek non solo sta condividendo i modelli IA già pubblicati, ma sta anche fornendo infrastrutture di supporto per questi modelli. Questo rappresenta un passo importante per estendere il framework di modelli open-source, contribuendo così alla creazione di una base tecnologica più solida su cui altri sviluppatori e ricercatori possono costruire.
Il coinvolgimento di DeepSeek nell’open-source non si è fermato al rilascio del codice. Infatti, l’azienda ha recentemente annunciato il rilascio di un nuovo algoritmo chiamato Native Sparse Attention (NSA), progettato per migliorare l’efficienza del training e dell’inferenza su contesti di grandi dimensioni. Questo algoritmo risponde a una delle sfide più critiche nel campo dell’IA: gestire e analizzare grandi quantità di dati in modo più rapido ed efficiente, un aspetto fondamentale per il miglioramento delle prestazioni nei modelli di linguaggio e ragionamento.
Il successo di DeepSeek è evidente anche dal suo rapido aumento di utenti. A partire dall’inizio di gennaio, la piattaforma chatbot di DeepSeek ha superato i 22,2 milioni di utenti attivi giornalieri, rendendola la più popolare in Cina, superando persino il celebre Douban, che conta 16,95 milioni di utenti. Questi numeri evidenziano non solo l’interesse crescente per i prodotti di DeepSeek, ma anche l’efficacia dei suoi modelli IA nel rispondere alle esigenze degli utenti cinesi.
Il crescente impatto di DeepSeek sul mercato dell’intelligenza artificiale e il suo impegno nell’open-source sono segnali che l’azienda sta assumendo un ruolo centrale nel panorama globale dell’IA. La combinazione di modelli avanzati, innovazioni tecnologiche e una filosofia aperta rappresenta un’alternativa significativa alle pratiche più chiuse di altre grandi aziende di tecnologia. Con il continuo sviluppo di nuove tecnologie e l’espansione della sua base di utenti, DeepSeek potrebbe rappresentare un esempio di come l’open-source possa diventare un catalizzatore di crescita e innovazione, sfidando le convenzioni esistenti.