Costa veramente 6 milioni di dollari o ci sono costi nascosti di DeepSeek che non conosciamo?
DiPLab ha appena pubblicato uno studio sulla nascita e la crescita di DeepSeek, analizzando quanto è vera la storia della creazione di un sistema LLM a basso costo. DeepSeek è veramente costata solo 6 milioni di dollari? Nelle interviste sono stati tralasciati altri costi, come quelli del lavoro di addestratori e taggatori? Ricerche e analisi tecnico-economiche iniziano a pubblicare cosa è stato scoperto.
Il documento di DiPLab sui costi nascosti di DeepSeek
Il documento esamina l’ascesa di DeepSeek, un’azienda cinese di intelligenza artificiale, e in sostanza mette in discussione le sue affermazioni di efficienza e basso costo.
L’analisi fatta si concentra sul lavoro umano, che non viene descritto spesso come meriterebbe, lavoro nascosto dietro lo sviluppo dell’IA, rivelando come DeepSeek si affidi a un vasto esercito di annotatori di dati, molti dei quali lavorano in condizioni precarie.
Inoltre il testo confronta DeepSeek con precedenti scandali tecnologici, come la storia di Theranos di Elizabeth Holmes, e sottolinea come l’interesse per l’innovazione possa oscurare le realtà dello sfruttamento del lavoro.
Il documento su DeepSeek entra anche nel merito delle politiche governative cinesi a sostegno dell’annotazione dei dati e offre raccomandazioni per proteggere i diritti e la privacy dei lavoratori dell’IA.
Vedremo anche quant’è differente la narrazione aziendale dalla realtà del lavoro umano sfruttato che sostiene i sistemi di IA.
DeepSeek è costata veramente solo 6 milioni di dollari?
Il costo reale di DeepSeek è stato da subito uno dei segreti meglio custoditi da Liang Wenfeng.
DeepSeek ha affermato che il suo modello di intelligenza artificiale è stato sviluppato con soli 6 milioni di dollari, una cifra notevolmente inferiore rispetto ai 500 milioni di dollari spesi da OpenAI.
DeepSeek dice che è costata 83 volte meno di OpenAI. Per capire la differenza è come se il clone cinese della Ferrari Roma invece di costare 208mila euro costasse solo 2500€.
Facciamo l’elenco delle cose che non tornano nelle dichiarazioni di DeepSeek
Costi elevati dell’hardware
Secondo il CEO di Scale AI, Alexandr Wang, già in passato si è dichiarata perplessa per i costi di DeepSeek soprattutto perché toccherebbe da vicino il business di Scale AI, indicando che potrebbe aver utilizzato circa 50.000 chip H100 di Nvidia per l’addestramento dei suoi modelli.
Sul mercato americano, questi chip avrebbero un costo di circa 2 miliardi di dollari. Anche se il costo degli H100 è diminuito dopo l’uscita degli H200, nei mesi precedenti, quando DeepSeek probabilmente li ha acquisiti, il costo combinato dell’hardware da solo avrebbe potuto raggiungere tra i 20 e i 25 miliardi di dollari.
Mercato nero dei chip in Cina
Dai 20 ai 25 miliardi di dollari se acquistati regolarmente, ma ricordiamoci che a causa del divieto degli Stati Uniti di esportare chip Nvidia in Cina, è nato un mercato nero per l’approvvigionamento di questi chip.
Sappiamo bene che l’acquisto sul mercato nero potrebbe aver aumentato significativamente i costi per DeepSeek.
Costi nascosti del lavoro di annotazione dati
Dicevamo nel primo paragrafo che DeepSeek minimizza il ruolo e il costo del lavoro umano nell’annotazione dei dati, suggerendo che un piccolo team di soli 32 annotatori sia sufficiente.
Questi 32 esperti però o devono essere dei fenomeni in velocità e lavorare 24 ore al giorno. In pratica 32 superman esperti in dati.
Dire che bastano solo 32 annotatori cozza con le realtà del settore, dove la maggior parte dei modelli di intelligenza artificiale si basano su un vasto numero di lavoratori sottopagati che trascrivono testi, etichettano immagini e classificano video.
Per capire per un LLM da 7B di token con sistemi di tagging automatico e per task semplici servono dai 10 ai 50 annotatori per 12 mesi, numero che sale tra i 200 e i 500 l’anno per task complessi senza possibilità di tagging automatico.
Ma ricordiamoci che il LLM di DeepSeek è di 48B di token.
Anche se DeepSeek utilizza tecniche di “reinforcement learning” che teoricamente riducono la necessità di annotatori di dati, nella pratica del lavoro è comunque necessario il controllo umano.
Supporto governativo cinese
Il governo cinese supporta attivamente il settore dell’annotazione dati attraverso sussidi e incentivi fiscali, il che potrebbe aver contribuito a ridurre i costi per DeepSeek. Tuttavia, l’impatto di queste politiche sul benessere dei lavoratori rimane incerto.
Mancanza di trasparenza
Sappiamo che il mondo tecnologico Cinese è chiuso per gli osservatori esteri.
C’è anche da ricordare che DeepSeek è stata accusata di mancanza di trasparenza riguardo alle dimensioni e alla composizione del suo database di training e del suo pool di annotatori.
Questo rende difficile verificare le affermazioni dell’azienda sui costi e sull’efficienza.
In sintesi, mentre DeepSeek afferma di aver sviluppato il suo modello di intelligenza artificiale per soli 6 milioni di dollari, ci sono forti indicazioni che includendo i costi nascosti di DeepSeek il costo reale potrebbe essere significativamente più alto, considerando i costi elevati dell’hardware, il mercato nero dei chip in Cina e i costi nascosti del lavoro di annotazione dati.
Qiandian Houchang
Con “modello Qiandian Houchang” vengono indicati quei negozi che nascondono una fabbrica dove si lavora 24 ore al giorno 7 giorni su 7, con turni massacranti dove i lavoratori vivono di fatto all’interno della fabbrica.
Il modello “Qiandian Houchang” nell’AI nasconde diversi rischi, principalmente legati allo sfruttamento della forza lavoro e alla precarietà delle condizioni lavorative, ed è una delle grandi domande sui costi nascosti di DeepSeek.
Questo modello di lavoro, in cui team di annotatori di dati vengono assemblati per completare incarichi per le grandi aziende tecnologiche cinesi, presenta diverse problematiche etiche e tecnologiche.
Sfruttamento del lavoro a basso costo
Il modello si basa sul reclutamento di lavoratori provenienti da aree urbane a basso reddito disposti ad accettare salari minimi per un lavoro ripetitivo.
A questo si somma la totale ignoranza sugli skill che il lavoro richiede, trasformando di fatto questi lavoratori in una marea umana che esegue compiti che di fatto non conosce.
Competizione al ribasso e compressione dei salari
La competizione tra le diverse “basi di annotazione” ha innescato una spirale salariale verso il basso. Lo abbiamo già visto nella globalizzazione e nella delocalizzazione delle fabbriche, dove il costo di un tecnico locale veniva equiparato al costo di 5 o 10 tecnici del continente indo-asiatico.
Cosa che abbiamo talmente digerito e considerato normale che è diventata una battuta sugli stereotipi tra Ebrei e Indiani a Big Band Theory:
Scarse condizioni di lavoro e pratiche scorrette
Il documento di DiPLab indica anche una ricerca di Julie Chen che descrive un quadro di “Four S’s”: Swindle (truffa), Swiping (furto di salario), Scold (rimprovero) e Study (studio continuo).
I lavoratori sono vittime di truffe, furti salariali, rimproveri per la lentezza o la mancata conformità agli standard di qualità e sono costretti a studiare continuamente per adattarsi alle richieste dei diversi progetti di training AI.
Nulla di nuovo
In pratica non abbiamo imparato nulla di nuovo. Il modello “Qiandian Houchang”, anche se aiuta la crescita del settore AI cinese, porta con se tutte quelle storie di sfruttamento e precarietà per i lavoratori coinvolti nell’annotazione dei dati.
Insomma non c’è una sostanziale differenza tra una fabbrica di elettrodomestici e attività high tech come quelle dedicate all’AI.
Se volete approfondire vi lascio il link ad uno studio di Olivia Yijian Liu, ricercatrice dell’università di Oslo e un dottorato all’Università di Pisa, che si intitola “Start-up Wolf: il modello di Shenzhen per l’imprenditorialità high-tech“, un bel libro che spiega esattamente l’applicazione del modello “Qiandian Houchang” nel mondo della nuova imprenditoria high tech Cinese.
Quanto lavoro c’è dietro l’annotazione dei dati di DeepSeek?
Nothing is certain, but based on previous well-documented instances elsewhere, there is the possibility that these individuals coordinate expansive annotation teams in lower-tier cities, managing a workforce far larger than DeepSeek’s narrative suggests.
From this point of view, DeepSeek’s approach to work and workers mirrors that of its Western counterparts. Their obfuscation of data labor practices is standard in the tech.
Non c’è nulla di certo, ma sulla base di precedenti casi ben documentati altrove, c’è la possibilità che questi individui coordinino team di annotazione espansivi in città di livello inferiore, gestendo una forza lavoro molto più ampia di quanto suggerisca la narrazione di DeepSeek.Da questo punto di vista, l’approccio di DeepSeek al lavoro e ai lavoratori rispecchia quello delle sue controparti occidentali. Il loro offuscamento delle pratiche di lavoro sui dati è standard nel settore tecnologico.
Il documento spiega bene che stimare realisticamente la quantità di lavoro umano dietro l’annotazione dei dati di DeepSeek è complesso.
Un po’ a causa della mancanza di trasparenza da parte dell’azienda e delle strategie di occultamento tipiche del settore tecnologico.
Un po’ a causa dell’impossibilità di chiedere e indagare direttamente sul luogo.
Tuttavia, spiega il documento sui costi nascosti di DeepSeek, analizzando le informazioni disponibili e confrontandole con casi simili, è possibile trarre alcune conclusioni.
Nessuno degli annotatori è conosciuto
Nei documenti scientifici di DeepSeek, sono stati identificati solo 31-32 individui esplicitamente accreditati come “annotatori di dati”. Questi sono presentati come una élite di ricercatori esperti (cosa che dicevo poco sopra: i superman dei dati), suggerendo però che potrebbero essere coordinatori di team piuttosto che semplici lavoratori di back-office, team che andrebbero a inserirsi di fatto tra i costi nascosti di DeepSeek.
Probabile coordinamento di team più ampi
Il documento non nasconde la possibilità che questi individui coordinino team di annotazione più ampi in città economicamente disagiate, gestendo una forza lavoro molto più grande di quanto suggerito da DeepSeek ad un costo estremamente basso.
Dipendenza dal lavoro umano
Dietro le quinte, i dirigenti di DeepSeek ammettono che la loro IA si basa fortemente sull’annotazione dei dati, con l’apprendimento supervisionato che coinvolge numerosi etichettatori umani.
Ogni attività di ragionamento dipende ancora dall’apprendimento guidato dall’uomo.
Ed è così, ad oggi non c’è alternativa.
Modello cinese di sfruttamento del lavoro
Come abbiamo spiegato poco sopra tra i costi nascosti di DeepSeek, come altre aziende cinesi, potrebbe esserci il modello “Qiandian Houchang”, che si basa sul reclutamento di lavoratori a basso costo provenienti da aree urbane con scarso sviluppo economico.
Confronto con OpenAI
Non è che OpenAI abbia brillato in etica e anti-sfruttamento.
Si è scoperto che OpenAI utilizza centinaia di annotatori di dati in Africa pagati meno di 2 dollari l’ora, quindi anche DeepSeek potrebbe nascondere una vasta forza lavoro sottopagata.
Money doesn’t stink
In definitiva il documento spiega che è probabile che il numero di annotatori che lavorano per DeepSeek sia significativamente più alto di quanto dichiarato pubblicamente, lavoratori che finiscono tra i costi nascosti di DeepSeek.
La società sembra seguire una strategia comune nel settore tecnologico di occultamento delle pratiche di lavoro sui dati, minimizzando il ruolo degli annotatori e sfruttando il lavoro a basso costo disponibile in Cina.
La cifra esatta rimane sconosciuta, ma è realistico presumere che dietro ai modelli di DeepSeek ci sia un numero considerevole di lavoratori che contribuiscono all’annotazione dei dati.