ByteDance, il colosso dietro TikTok, sta alzando l’asticella nell’intelligenza artificiale con una nuova tecnologia che promette di superare DeepSeek e ridefinire l’addestramento dei modelli di ragionamento AI. Il sistema, battezzato DAPO (Decoupled Clip and Dynamic Sampling Policy Optimisation), è un algoritmo di reinforcement learning scalabile che punta a migliorare le capacità di ragionamento complesso dei modelli linguistici, con tecniche di auto-verifica e raffinamento iterativo.

Il colpo di scena? DAPO ha battuto il modello R1 di DeepSeek nel prestigioso American Invitational Mathematics Examination (AIME) 2024, totalizzando 50 punti contro i 47 di DeepSeek utilizzando lo stesso modello di base, il Qwen2.5-32B di Alibaba. Ma il vero punto di forza è l’efficienza: DAPO ha raggiunto questo risultato con la metà dei passaggi di addestramento.

Il settore non è rimasto indifferente. Philipp Schmid, ingegnere di Google DeepMind, ha lodato l’approccio di ByteDance, sostenendo che il loro metodo supera la Group Relative Policy Optimisation (GRPO) di DeepSeek. Tuttavia, il confronto tra il numero di passaggi di training ha sollevato qualche dubbio: Vitaly Kurin, ricercatore senior di Nvidia, ha messo in discussione se meno passaggi equivalgano davvero a un risparmio di tempo totale nell’addestramento.

ByteDance non si è fermata qui. L’azienda ha schierato i suoi migliori talenti AI, tra cui Yu Qiying, PhD student a Tsinghua e leader del progetto, e altri giovani ricercatori di Hong Kong e Pechino. Nel frattempo, ha lanciato una massiccia campagna di reclutamento per nuovi cervelli dell’AI, cercando studenti di dottorato e laureandi con una “passione estrema per la tecnologia” in città strategiche come Pechino, Shanghai, Singapore, San Jose e Seattle.

Dietro questa spinta aggressiva c’è una strategia chiara: ByteDance vuole posizionarsi come leader globale nel settore AI e sfidare i giganti come OpenAI, DeepMind e Alibaba sul fronte del machine learning. Durante un recente meeting interno, i co-leader dell’LLM team, Zhu Wenjia e Wu Yonghui (ex-Google), hanno ribadito la mission aziendale: “esplorare il limite dell’intelligenza” e promuovere l’open source.

La domanda ora è: ByteDance riuscirà a trasformare il suo vantaggio tecnico in una leadership consolidata nell’AI, o finirà per essere solo l’ennesimo player in una guerra senza esclusione di colpi contro DeepMind, OpenAI e Alibaba?

Paper  Project Page