Tencent ha lanciato Hunyuan T1, un modello di intelligenza artificiale che sfida direttamente DeepSeek-R1 sia in termini di prestazioni che di pricing. Il colosso cinese del tech ha presentato questa novità dopo una fase di test in beta, dimostrando che il modello è in grado di competere con i migliori sistemi di ragionamento esistenti, inclusi quelli di OpenAI.
Il punteggio di 87,2 ottenuto da T1 nel benchmark MMLU Pro, che misura la conoscenza dei modelli di AI, ha superato DeepSeek-R1 (84 punti), ma resta inferiore a OpenAI o1 (89,3 punti). Anche nei test matematici e linguistici, il modello ha dimostrato un livello competitivo: nell’AIME 2024 ha raggiunto 78,2 punti, poco sotto i 79,8 di R1 e i 79,2 di o1. Per quanto riguarda la lingua cinese, T1 ha eguagliato DeepSeek con 91,8 punti nel test C-Eval, superando OpenAI (87,8).
Se la battaglia sulle performance è serrata, quella sui prezzi è ancora più cruciale. Tencent ha deciso di allinearsi a DeepSeek con un costo di 1 yuan (circa 0,14 dollari) per milione di token in input e 4 yuan in output, mentre DeepSeek-R1 varia il prezzo in base all’orario: 1 yuan di giorno e 0,25 yuan di notte per l’input, mentre l’output costa 16 yuan di giorno e 4 yuan di notte. In altre parole, Tencent ha optato per una strategia tariffaria prevedibile, ma competitiva.
La vera innovazione di Hunyuan T1 risiede nell’architettura. Tencent afferma di essere la prima azienda del settore ad adottare una struttura ibrida che combina il Transformer di Google con Mamba, sviluppato da Carnegie Mellon e Princeton. Questo approccio riduce significativamente i costi di addestramento e inferenza, ottimizzando l’uso della memoria e aumentando la velocità di decodifica del 200%.
I test indipendenti di esperti del settore hanno fornito risultati misti. Secondo il blog NCJRYDS, Hunyuan T1 ha perso contro DeepSeek nella creazione di una poesia cinese antica, ma ha superato il rivale nell’interpretazione di un termine cinese in diversi contesti. Il blog GoPlayAI ha invece messo alla prova il modello con quattro problemi matematici, evidenziando come il sistema abbia sbagliato quello più difficile dopo cinque minuti di elaborazione.
Il lancio di T1 rientra nella strategia di Tencent per diversificare le proprie entrate puntando sull’intelligenza artificiale. L’azienda, che controlla WeChat e domina il settore del gaming, sta integrando sia DeepSeek-R1 che i propri modelli Hunyuan nel cloud e nel chatbot Yuanbao. Questo approccio “double-core”, come lo definisce il CEO Pony Ma Huateng, è lo stesso che ha garantito a Tencent il controllo del mercato videoludico: sviluppare internamente e, allo stesso tempo, supportare soluzioni di terze parti.
Il panorama AI cinese si sta rapidamente evolvendo, con attori come Alibaba che rivendicano la superiorità dei propri modelli rispetto a OpenAI e DeepSeek. Tencent, con Hunyuan T1, si unisce alla competizione, puntando su un mix di innovazione tecnologica, pricing aggressivo e integrazione nel proprio ecosistema digitale.