I chip AI Blackwell di Nvidia stanno riscontrando seri problemi di surriscaldamento quando utilizzati in rack server capaci di ospitare fino a 72 unità. Questa situazione ha destato preoccupazioni tra importanti clienti come Meta, Microsoft e xAI di Elon Musk, poiché potrebbe ritardare l’apertura di nuovi data center che si basano su questi chip.

I report segnalano che le unità di elaborazione grafica (GPU) Blackwell tendono a surriscaldarsi quando vengono collegate più unità nei rack server appositi. Questo problema ha spinto Nvidia a richiedere diverse modifiche progettuali ai suoi fornitori per risolvere la questione del surriscaldamento.

Le problematiche legate al surriscaldamento potrebbero rallentare l’implementazione di nuovi data center per i principali clienti di Nvidia. Inizialmente, si stimava che i chip Blackwell sarebbero stati consegnati nel secondo trimestre del 2024, ma hanno già incontrato ritardi a causa di diversi difetti di progettazione.

I principali clienti sono preoccupati per questi ritardi, poiché contavano sull’arrivo puntuale dei server Blackwell per potenziare le loro capacità AI. Nvidia ha assicurato che le modifiche ingegneristiche fanno parte del processo abituale e sta lavorando attivamente con i fornitori di servizi cloud per risolvere i problemi.

Nonostante questi contrattempi, i chip Blackwell sono progettati per prestazioni eccezionali, vantando un aumento della velocità di 30 volte per compiti come la risposta a query chatbot rispetto ai loro predecessori. Il CEO di Nvidia, Jensen Huang, ha notato un’alta domanda per questi chip, prevedendo una sostanziale crescita dei ricavi derivanti dalle loro vendite.