Google DeepMind ha recentemente annunciato la formazione di un nuovo team dedicato allo sviluppo di “world models”, sistemi di intelligenza artificiale progettati per simulare ambienti fisici complessi. Questa iniziativa, guidata da Tim Brooks ex co-responsabile del progetto Sora di OpenAI mira a rivoluzionare settori come lo sviluppo di videogiochi, l’addestramento di robot e l’avanzamento verso l’Intelligenza Artificiale Generale (AGI).
I “world models” rappresentano un’evoluzione significativa nell’ambito dell’IA, poiché consentono la creazione di ambienti digitali che rispecchiano le dinamiche del mondo reale. Questa capacità è fondamentale per sviluppare sistemi di IA in grado di comprendere e interagire con il mondo fisico in modo più naturale ed efficiente.L’obiettivo di DeepMind è utilizzare vasti insiemi di dati video e multimodali per addestrare questi modelli, migliorando così la comprensione e l’adattabilità dell’IA a scenari reali.
La formazione di questo team si integra strategicamente con altri progetti di IA di Google, tra cui Gemini, Veo e Genie. Questi progetti offrono capacità distintive—come la generazione di video e la creazione di ambienti 3D interattivi—che possono sinergizzare con i risultati derivanti dai “world models”. Questa convergenza rappresenta non solo una crescita tecnica, ma anche un vantaggio strategico nel panorama competitivo della ricerca sull’IA.
L’iniziativa di DeepMind arriva in un momento di intensa competizione nello sviluppo dell’AGI. Giganti come OpenAI, Nvidia e startup emergenti come World Labs, fondata dalla pioniera dell’IA Fei-Fei Li, stanno portando avanti sforzi paralleli. Lo sviluppo di “world models” è visto come un banco di prova per la supremazia nell’AGI, combinando innovazione nella simulazione fisica in tempo reale e nell’esecuzione intelligente dei compiti.
In particolare, Nvidia ha recentemente presentato la piattaforma Cosmos, progettata per accelerare lo sviluppo dell’IA fisica attraverso la simulazione di scenari reali per robot e veicoli autonomi. Questa piattaforma utilizza prompt testuali, immagini o video per creare ambienti virtuali e addestra modelli di IA con dati sintetici per l’apprendimento per rinforzo. Questa innovazione aiuta robot e veicoli autonomi a comprendere ambienti fisici complessi, potenzialmente portando a un’adozione diffusa.
Allo stesso modo, World Labs si concentra sulla costruzione di modelli di intelligenza spaziale su larga scala per percepire, generare e interagire con il mondo 3D, evidenziando il potenziale dell’intelligenza spaziale come tecnologia fondamentale.
La mossa di Google DeepMind per sviluppare “world models” sottolinea l’importanza cruciale di questa tecnologia emergente nel futuro dell’IA. La capacità di simulare ambienti fisici complessi non solo migliorerà l’addestramento e le prestazioni dei sistemi di IA, ma aprirà anche nuove possibilità in settori come l’intrattenimento interattivo, la robotica e oltre. Con l’aumento della competizione nel campo dell’AGI, l’approccio di DeepMind potrebbe rappresentare un passo significativo verso la realizzazione di sistemi di IA più intelligenti e versatili.
Date una occhiata ai Jobs:
https://boards.greenhouse.io/deepmind/jobs/6503217…https://boards.greenhouse.io/deepmind/jobs/6456664