Tencent ha recentemente lanciato una suite di strumenti di intelligenza artificiale open-source in grado di convertire testo e immagini in visuali 3D, segnando un ulteriore passo avanti della Cina nel campo dell’AI generativa. La società ha rilasciato cinque modelli open-source basati sulla tecnologia Hunyuan3D-2.0, inclusi quelli “turbo” capaci di generare visuali 3D di alta qualità in appena 30 secondi.
Questo sviluppo rappresenta una mossa strategica per competere con le controparti statunitensi, offrendo modelli AI ad alte prestazioni a costi ridotti. Tencent aveva introdotto i suoi primi modelli AI 3D nel novembre 2024, rivolgendosi principalmente a designer e sviluppatori di giochi. Il lancio di Hunyuan3D-2.0 nel gennaio 2025 ha ulteriormente migliorato le prestazioni, superando i modelli leader del settore in coerenza testuale, accuratezza geometrica e qualità visiva.
La tecnologia Hunyuan3D-2.0 si basa su un sistema di diffusione su larga scala per la sintesi di asset 3D ad alta risoluzione. Questo sistema comprende due componenti fondamentali: un modello di generazione delle forme e un modello di sintesi delle texture. Il primo, basato su un trasformatore di diffusione a flusso scalabile, mira a creare geometrie che si allineano correttamente con l’immagine fornita come condizione, ponendo una solida base per le applicazioni successive. Il secondo, sfruttando forti priorità geometriche e di diffusione, produce mappe di texture ad alta risoluzione e vivaci per mesh generate o create a mano.
Inoltre, Tencent ha sviluppato Hunyuan3D-Studio, una piattaforma di produzione versatile e user-friendly che semplifica il processo di creazione di asset 3D. Questa piattaforma consente sia agli utenti professionisti che agli amatori di manipolare o addirittura animare le loro mesh in modo efficiente. La valutazione sistematica dei modelli ha dimostrato che Hunyuan3D 2.0 supera i modelli precedenti in dettagli geometrici, allineamento delle condizioni e qualità delle texture.
Nonostante questi progressi, la concorrenza nel campo dell’AI generativa 3D rimane intensa. Ad esempio, ByteDance, la società madre di TikTok, sta sviluppando il modello VeOmniverse per la generazione di contenuti 3D da testo e immagini, sebbene questo rimanga proprietario e non open-source come le offerte di Tencent.