In un tentativo di rassicurare gli investitori e riaffermare la propria posizione dominante nel mercato dell’intelligenza artificiale, il CEO di Nvidia, Jensen Huang, ha presentato le nuove offerte della società che potrebbero notevolmente migliorare le prestazioni del modello R1 di DeepSeek. Questo annuncio è arrivato durante la conferenza annuale GTC a San Jose, California, dove Huang ha spiegato come i prodotti più recenti di Nvidia possano aumentare drasticamente le capacità di ragionamento per modelli come R1.

Huang ha descritto Dynamo, il nuovo software di inferenza open-source di Nvidia, come il “sistema operativo di una fabbrica di intelligenza artificiale”. Questo software, ora disponibile su Github, può offrire fino a 30 volte più prestazioni sui GPU esistenti e nelle architetture per compiti di ragionamento AI, secondo Nvidia. Dynamo succede al NVIDIA Triton Inference Server e si concentra sulla massimizzazione dell’utilizzo delle risorse GPU, orchestrando la comunicazione di inferenza su migliaia di GPU e impiegando il serving disaggregato per ottimizzare indipendentemente le fasi di elaborazione e generazione dei modelli linguistici di grandi dimensioni (LLM) su diverse GPU.

Le principali caratteristiche di Dynamo includono l’allocazione dinamica delle GPU, la capacità di indirizzare le query a GPU specifiche per minimizzare i calcoli di risposta, e lo scaricamento dei dati di inferenza su dispositivi di memoria e archiviazione più economici. Queste funzionalità mirano collettivamente ad aumentare la produttività e ridurre i costi. Ad esempio, eseguendo il modello DeepSeek-R1 su un cluster di rack GB200 NVL72, NVIDIA Dynamo ha aumentato il numero di token generati per GPU di oltre 30 volte.

La natura open-source di NVIDIA Dynamo supporta vari framework, tra cui PyTorch e NVIDIA TensorRT-LLM, facilitando lo sviluppo e l’ottimizzazione del serving di modelli AI attraverso l’inferenza disaggregata. Aziende come AWS, Cohere, CoreWeave, Dell e Google Cloud dovrebbero accelerare la loro adozione dell’inferenza AI con NVIDIA Dynamo.

Tuttavia, il ruolo dominante di Nvidia come unico “fornitore di armi” nella battaglia globale dell’AI è stato messo in discussione a gennaio, quando la società cinese DeepSeek ha presentato modelli a basso costo e ad alte prestazioni, sollevando dubbi sulla necessità di acquistare chip AI costosi. DeepSeek ha anche suscitato sospetti negli Stati Uniti a causa delle tensioni politiche tra Pechino e Washington, ma i produttori di chip statunitensi, tra cui Nvidia e AMD, hanno fatto a gara per supportare i modelli della startup.

Mentre le azioni di Nvidia sono scese del 3,4% a 115,4 dollari martedì, il CEO ha cercato di mitigare le preoccupazioni sulla “legge di scala”, che afferma che i sistemi AI migliorano con l’aumento delle risorse utilizzate per svilupparli. Huang ha anche presentato nuove tecnologie, come il Blackwell Ultra GPU e l’architettura Vera Rubin, che saranno lanciate nei prossimi anni. Inoltre, è stata annunciata l’architettura Feynman, prevista per il 2028, che promette ulteriori innovazioni nel campo dell’AI.

Nvidia sta cercando di riaffermare la propria centralità nel mercato AI, sfruttando le nuove tecnologie per migliorare le prestazioni dei modelli come DeepSeek R1, ma il mercato sembra ancora scettico sulle prospettive a lungo termine della società. La partecipazione di grandi aziende tecnologiche cinesi alla conferenza GTC, come Baidu, Alibaba Cloud e ByteDance, ha anche sottolineato l’importanza della collaborazione internazionale nel settore dell’AI, nonostante le tensioni politiche.

DeepSeek ha sollevato interrogativi sulla sostenibilità a lungo termine dei modelli AI basati su chip costosi, ma Nvidia sembra determinata a dimostrare che le sue tecnologie possono offrire vantaggi significativi in termini di prestazioni e scalabilità, anche in un mercato sempre più competitivo.