I chip AI Blackwell di Nvidia stanno riscontrando seri problemi di surriscaldamento quando utilizzati in rack server capaci di ospitare fino a 72 unità. Questa situazione ha destato preoccupazioni tra importanti clienti come Meta, Microsoft e xAI di Elon Musk, poiché potrebbe ritardare l’apertura di nuovi data center che si basano su questi chip.
Tag: nvdia Pagina 1 di 2
NVIDIA Corporation ha vissuto un 2023 straordinario, triplicando il suo valore di mercato grazie al boom della tecnologia di intelligenza artificiale. Tuttavia, l’imminente rapporto sugli utili del 20 novembre rappresenta un banco di prova cruciale, soprattutto in un contesto geopolitico e commerciale sempre più complesso. Secondo Tatiana Darie, editorialista di Bloomberg News, le politiche protezionistiche prospettate dal Presidente eletto Donald Trump potrebbero rappresentare un rischio significativo per l’azienda.
Nvidia ha annunciato lunedì che la sua tecnologia di rete Spectrum-X ha contribuito all’espansione del supercomputer Colossus della startup xAI, ora riconosciuto come il cluster di addestramento AI più grande al mondo. Situato a Memphis, Tennessee, Colossus è il terreno di addestramento per la terza generazione di Grok, la suite di modelli linguistici di grandi dimensioni sviluppata da xAI per potenziare le funzionalità chatbot per gli abbonati a X Premium.
Il CEO di SoftBank, Masayoshi Son, ha recentemente sottolineato il potenziale di Nvidia, dichiarandola “sottovalutata” durante il suo intervento al Saudi FII Summit. Ha proiettato che per raggiungere l’intelligenza artificiale superintelligente (ASI) potrebbero essere necessari “centinaia di miliardi di dollari”, insieme a un investimento stimato di 9 trilioni di dollari e 200 milioni di chip. Nonostante un leggero calo delle azioni di Nvidia nel premarket, l’azienda ha visto una crescita notevole, con le azioni in aumento del 191% dall’inizio dell’anno e oltre il 2.600% negli ultimi cinque anni.
La prossima grande tappa nel mondo tecnologico sarà la corsa di Apple verso una valutazione di mercato di $4 trilioni, seguita da Nvidia, secondo il noto analista di Wedbush Securities, Dan Ives. Questo traguardo epocale potrebbe materializzarsi nel 2025, spinto dalla capacità di entrambe le aziende di capitalizzare sull’intelligenza artificiale (IA), su ecosistemi integrati e sulla capacità di mantenere rilevante la loro base utenti. Secondo Wedbush, la visione strategica e tecnologica dei due colossi pone Apple e Nvidia in una posizione dominante, difficilmente eguagliabile.
Nvidia ha recentemente introdotto Sana, un modello AI che potrebbe cambiare le regole del gioco nell’arte generativa, soprattutto per coloro che non dispongono di macchine ad alte prestazioni. La chiave del successo di Sana risiede in una serie di innovazioni tecniche: grazie a un deep compression autoencoder è possibile ridurre la dimensione dei dati immagine a 1/32 dell’originale, mantenendo una qualità impeccabile. Questa innovazione, combinata con il modello linguistico Gemma 2 per la comprensione dei prompt, garantisce un output di altissima qualità su hardware relativamente economico, una mossa strategica per Nvidia nel conquistare una platea più ampia.(Sana Github)
L’industria dell’intelligenza artificiale sta assistendo a un’emergente corsa tra startup di data center, che affermano di poter muoversi più rapidamente rispetto ai grandi sviluppatori.
L’ultima in ordine di tempo è Crusoe Energy, che ha annunciato un accordo per ottenere un prestito di 3,4 miliardi di dollari per sviluppare un data center che potrebbe diventare uno dei più grandi al mondo.Oracle, un importante fornitore di servizi cloud, affitterà il sito e noleggerà server equipaggiati con chip Nvidia per le applicazioni di intelligenza artificiale di OpenAI.
Questo progetto rappresenta una significativa opportunità per Crusoe, che ha già dimostrato la sua capacità di adattarsi rapidamente alle esigenze del mercato AI.Il data center sarà situato nel Lancium Clean Campus ad Abilene, Texas, e sarà progettato per supportare applicazioni IT ad alta densità energetica.
Si prevede che il centro dati operi con un potenziale di 206 MW e possa gestire fino a 100.000 GPU su una rete integrata, ottimizzando l’uso delle risorse energetiche rinnovabili.
Questa iniziativa non solo evidenzia la crescente domanda di infrastrutture dedicate all’AI, ma sottolinea anche come le startup come Crusoe possano competere efficacemente con i giganti del settore grazie a modelli di business innovativi e approcci sostenibil
Super Micro Computer ha recentemente annunciato il lancio dei server NVIDIA GB200 NVL72 e HGX B200, progettati per affrontare le crescenti esigenze delle applicazioni di intelligenza artificiale (AI) e dei modelli di linguaggio di grandi dimensioni (LLM). Questi server rappresentano una significativa evoluzione nella potenza di calcolo e nell’efficienza energetica, grazie all’integrazione della nuova architettura Blackwell di NVIDIA.
CoreWeave, un fornitore di cloud specializzato sostenuto da Nvidia, è tra le aziende che hanno annunciato un investimento complessivo di 8,2 miliardi di dollari nei data center nel Regno Unito. Questo investimento segna un passo significativo nella crescita dell’infrastruttura AI nel paese, contribuendo a rafforzare la posizione del Regno Unito come hub tecnologico.
AMD ha svelato il suo ultimo chip per intelligenza artificiale, l’Instinct MI325X, durante un evento volto a sfidare il dominio di Nvidia nel mercato delle GPU per data center. Questo nuovo chip inizierà la produzione entro la fine del 2024 ed è progettato per competere direttamente con i prossimi chip Blackwell di Nvidia, che si prevede inizieranno a essere spediti all’inizio del prossimo anno.
Jensen Huang, CEO di Nvidia, ha dichiarato che il futuro dell’intelligenza artificiale (AI) sarà caratterizzato da servizi in grado di “ragionare”. Tuttavia, ha sottolineato che è necessario ridurre i costi di calcolo per raggiungere questa fase, come riportato da Bloomberg News.
Durante un podcast con Rene Haas, CEO di Arm, Huang ha spiegato che i prossimi strumenti AI saranno in grado di rispondere a domande attraverso centinaia o migliaia di passaggi, riflettendo sulle proprie conclusioni. Questo approccio differenzierà il software futuro dagli attuali sistemi come ChatGPT, che Huang utilizza quotidianamente.
l gigante tecnologico taiwanese Foxconn sta costruendo il più grande impianto di produzione al mondo, dedicato alla realizzazione dei superchip NvidiaGB200 per soddisfare la “enorme” domanda. “Stiamo costruendo il più grande impianto di produzione di GB200 del pianeta,” ha dichiarato il dirigente senior Benjamin Ting durante l’annuale Hon Hai Tech Day a Taipei.
“Non credo di poter dire dove al momento, ma è il più grande del pianeta,”
La nuova fabbrica è destinata a soddisfare la crescente domanda della piattaforma Blackwell di Nvidia, fondamentale per la tecnologia dei server AI. “La domanda è estremamente elevata,”
Ting.
Foxconn, il maggiore assemblatore di iPhone per Apple, sta usando le sue capacità produttive per entrare nel mercato in crescita dell’IA. Il presidente Young Liu ha detto che la catena di approvvigionamento dell’azienda è pronta per la rivoluzione dell’IA. Foxconn ha migliorato le sue tecniche di produzione, includendo tecnologie avanzate di raffreddamento a liquido e dissipazione del calore per i server GB200.
DigitalOcean Holdings ha recentemente lanciato un modello di pagamento flessibile che consente a startup e aziende digitali in crescita di accedere alle GPU H100 di Nvidia per applicazioni di intelligenza artificiale (AI). Questa iniziativa mira a democratizzare lo sviluppo dell’AI fornendo risorse informatiche ad alte prestazioni a un costo accessibile, senza la necessità di investimenti iniziali significativi in hardware.
NVIDIA ha recentemente presentato il Nemotron 51B, un modello di linguaggio AI all’avanguardia che vanta metriche di prestazione impressionanti, essendo 220% più veloce e capace di gestire 400% in più di carico di lavoro rispetto al suo predecessore, il Llama 3.1 70B. Questo modello rappresenta un significativo progresso nella tecnologia AI, in particolare in termini di velocità e scalabilità, rendendolo un rilascio notevole nel campo dell’AI generativa.
Salesforce ha recentemente annunciato importanti collaborazioni con NVIDIA e Google Cloud per migliorare le proprie capacità di intelligenza artificiale, in particolare attraverso la nuova iniziativa chiamata Agentforce. Questo annuncio è stato fatto durante l’evento Dreamforce 2024 a San Francisco.
Nvidia è attualmente in trattative avanzate per acquisire la startup software OctoAI, con un’offerta di circa 165 milioni di dollari.
Questa informazione è stata riportata da The Information, che ha citato un documento inviato agli azionisti di OctoAI.
Il CEO di Nvidia Jensen Huang ha affermato che un trilione di dollari di data center generici saranno modernizzati in elaborazione accelerata.
“Questo accadrà indipendentemente da tutto”, ha osservato Huang mentre discuteva del mercato dei data center.
Xockets, una startup con sede in Texas co-fondata dall’ingegnere Parin Dalal, ha intentato una causa contro Nvidia e Microsoft, accusandole di violazione di brevetto e violazioni delle leggi antitrust. La causa, presentata al Tribunale Distrettuale degli Stati Uniti per il Western District del Texas, sostiene che entrambe le aziende abbiano utilizzato illegalmente la tecnologia del data processing unit (DPU) brevettata da Xockets, fondamentale per migliorare l’efficienza delle infrastrutture cloud e delle applicazioni di intelligenza artificiale.
Il recente crollo delle azioni di Nvidia ha suscitato un ampio dibattito nel mondo finanziario, con l’analista della Deutsche Bank, Jim Reid, che ha evidenziato come la società abbia registrato metà dei maggiori cali di mercato nella storia. Martedì, le azioni di Nvidia sono scese del 9,5%, comportando una perdita di circa 279 miliardi di dollari in valore di mercato, il che rappresenta il più grande calo di capitalizzazione di mercato in un solo giorno nella storia delle aziende pubbliche statunitensi.
EAGLE è un innovativo modello di intelligenza artificiale sviluppato da Nvidia, progettato per migliorare significativamente la comprensione visiva e testuale delle macchine. Questo modello si distingue per la sua capacità di elaborare immagini ad alta risoluzione e di integrare diversi encoder visivi, rendendolo particolarmente efficace in compiti complessi che richiedono una comprensione multimodale.
La famiglia di modelli Eagle, nota anche come NVEagle , include diverse varianti su misura per diverse attività e requisiti. I modelli sono disponibili in tre versioni principali: Eagle-X5-7B , Eagle-X5-13B ed Eagle-X5-13B-Chat .
Dai un’occhiata alle Model Cards e alla Demo .
Gli investitori sono attualmente inquieti nonostante Nvidia abbia riportato utili impressionanti, principalmente a causa di preoccupazioni relative ai ritardi nella distribuzione del suo chip AI di nuova generazione, Blackwell.
Benvenuti a “Un Caffè al Bar dei Daini”! Oggi ci soffermiamo su Nvidia, che è attesa a pubblicare i risultati del secondo trimestre dopo la chiusura delle contrattazioni mercoledì, 28 agosto 2024. Tra aspettative elevate e sfide produttive, gli occhi degli investitori sono puntati sul colosso dei chip per capire se riuscirà a mantenere il suo slancio di crescita.
Prendete un caffè e preparatevi a immergervi nei dettagli di questa attesissima pubblicazione.
NVIDIA ha recentemente presentato alla Gamescom 2024 il suo primo modello di linguaggio ridotto su dispositivo, il Nemotron-4 4B, parte della suite NVIDIA ACE.
Questa tecnologia rappresenta un passo significativo verso la creazione di “umani digitali” più realistici nei videogiochi, in particolare nel titolo Mecha BREAK di Amazing Seasun Games, il primo a integrare completamente questa innovazione.
Cosa è NVIDIA ACE e come funziona?
NVIDIA ACE (AI Companions for Entertainment) è una suite di strumenti progettati per migliorare l’interazione tra i giocatori e i personaggi non giocanti (NPC).
Con l’implementazione del Nemotron-4 4B, i NPC possono ora conversare in modo più naturale e coinvolgente, simile a come farebbe un compagno reale. Questo modello di linguaggio ridotto è alimentato localmente da RTX AI, permettendo risposte più rapide e pertinenti, il che è cruciale per esperienze di gioco immersive.
NVIDIA ha recentemente lanciato un nuovo modello di linguaggio di piccole dimensioni chiamato Mistral-NeMo-Minitron 8B, che offre un’accuratezza all’avanguardia pur essendo compatto abbastanza da funzionare su postazioni di lavoro con schede NVIDIA RTX di fascia consumer.
Nvidia sta affrontando un’attenta analisi negli Stati Uniti per accuse di pratiche anticoncorrenziali, in particolare per quanto riguarda le sue tattiche di vendita e il bundling dei prodotti. Il Dipartimento di Giustizia degli Stati Uniti (DoJ) ha avviato un’indagine in seguito alle denunce dei rivali, tra cui Advanced Micro Devices (AMD).
Huawei Technologies sta per lanciare un nuovo chip per l’intelligenza artificiale, cercando di superare le sanzioni USA e competere con Nvidia, ha riportato il Wall Street Journal.
Di recente, aziende Internet e operatori di telecomunicazioni cinesi hanno testato il nuovo chip, Ascend 910C, secondo il rapporto. Huawei sostiene che il chip è paragonabile all’H100 di Nvidia, che non è disponibile in Cina.
Tuttavia, Huawei ha affrontato ritardi nella produzione dei suoi chip attuali e potrebbe subire ulteriori restrizioni dagli Stati Uniti, impedendole di ottenere parti di macchine e chip di memoria per l’hardware AI.
Ripensando all’evento AWS re:Invent 2023, Jensen Huang, fondatore e CEO di NVIDIA, ha parlato sul palco con il CEO di AWS Adam Selipsky. Hanno discusso di come NVIDIA e AWS stiano collaborando per permettere a milioni di sviluppatori di accedere a tecnologie avanzate per innovare rapidamente con l’intelligenza artificiale generativa.
AWS e NVIDIA hanno rafforzato la loro collaborazione al GTC 2024. I CEO delle due aziende hanno discusso la loro partnership e l’evoluzione dell’intelligenza artificiale in un comunicato stampa:
“La profonda collaborazione tra le nostre due organizzazioni risale a più di 13 anni fa, quando insieme abbiamo lanciato la prima istanza cloud GPU al mondo su AWS, e oggi offriamo la più ampia gamma di soluzioni GPU NVIDIA per i clienti”, afferma Adam Selipsky , CEO di AWS. “Il processore Grace Blackwell di nuova generazione di NVIDIA segna un significativo passo avanti nell’intelligenza artificiale generativa e nel GPU computing. Se combinato con la potente rete Elastic Fabric Adapter di AWS, il clustering iperscalabile di Amazon EC2 UltraClusters e le esclusive funzionalità di virtualizzazione e sicurezza avanzate del nostro AWS Nitro System , rendiamo possibile per i clienti creare ed eseguire modelli di linguaggio di grandi dimensioni con più di trilioni di parametri più velocemente, su larga scala e in modo più sicuro che altrove. Insieme, continuiamo a innovare per rendere AWS il posto migliore in cui eseguire GPU NVIDIA nel cloud”.
Il Progetto Ceiba, una collaborazione tra Amazon Web Services (AWS) e NVIDIA, è destinato a rivoluzionare il mondo dell’intelligenza artificiale (AI) costruendo il più grande supercomputer AI nel cloud. Questo supercomputer all’avanguardia, ospitato esclusivamente su AWS, alimenterà gli sforzi di ricerca e sviluppo di NVIDIA nell’AI, spingendo i confini di ciò che è possibile in campi come i modelli di linguaggio di grandi dimensioni (LLM), la grafica, la simulazione, la biologia digitale, la robotica, i veicoli autonomi e la previsione climatica.
Il recente ritardo nei lanci dei chip di intelligenza artificiale di Nvidia , causato da difetti di progettazione scoperti all’ultimo minuto, rappresenta un serio problema sia per l’azienda che per i suoi clienti principali come Meta , Google e Microsoft.
Il fondo speculativo Elliott Management ha dichiarato che Nvidia è in una bolla perché il tema dell’intelligenza artificiale che sostiene il prezzo delle sue azioni è sopravvalutato.
Secondo una lettera del secondo trimestre vista dal Financial Times, Elliott Management ha detto che le mega-cap tecnologiche, come Nvidia, sono in una “terra di bolle” e che l’hedge fund dubita che queste aziende continueranno a comprare GPU di Nvidia in grandi quantità.