DeepMind, la divisione di intelligenza artificiale di Alphabet, ha recentemente presentato due modelli avanzati di IA, Gemini Robotics e Gemini Robotics-ER, progettati per potenziare le capacità dei robot nell’interazione con l’ambiente fisico.
Questi modelli rappresentano un significativo passo avanti nella creazione di macchine in grado di comprendere e agire in contesti complessi, avvicinandosi sempre più al concetto di robotica generale. Gemini Robotics, evoluzione del modello linguistico Gemini 2.0, integra visione, linguaggio e azione per consentire ai robot di adattarsi a nuove situazioni senza necessità di addestramento specifico.
Questa capacità di generalizzazione permette alle macchine di eseguire compiti complessi, come piegare la carta o rimuovere tappi da bottiglie, rispondendo efficacemente a comandi vocali e interagendo con l’ambiente circostante in modo più naturale.
Parallelamente, Gemini Robotics-ER è stato sviluppato per migliorare il ragionamento incarnato, dotando i robot di una comprensione spaziale avanzata e della capacità di prendere decisioni sicure in ambienti complessi.
Questo modello consente alle macchine di interpretare situazioni intricate e di agire in modo autonomo, ampliando le applicazioni della robotica in settori come la logistica, la produzione e l’assistenza personale.
Un aspetto fondamentale di questi modelli è la loro adattabilità a diverse piattaforme hardware. Durante le dimostrazioni, i robot equipaggiati con Gemini Robotics hanno eseguito compiti come piegare una volpe origami, organizzare una scrivania e realizzare una schiacciata a basket, evidenziando la versatilità e la destrezza raggiunte grazie all’integrazione dei nuovi modelli di IA.
DeepMind ha inoltre avviato collaborazioni strategiche con aziende leader nel settore della robotica, tra cui Apptronik, Agile Robots, Agility Robotics, Boston Dynamics ed Enchanted Tools. Queste partnership mirano a sfruttare i progressi ottenuti per sviluppare robot umanoidi avanzati, capaci di operare in vari contesti industriali e di servizio, accelerando l’adozione di soluzioni robotiche intelligenti su larga scala.
La sicurezza rimane una priorità per DeepMind, che ha implementato un approccio multilivello per garantire comportamenti affidabili e prevedibili nei robot.
È stato introdotto un nuovo benchmark, denominato ASIMOV, progettato per identificare e mitigare potenziali comportamenti pericolosi, assicurando che l’integrazione dell’IA nelle macchine avvenga in modo responsabile e sicuro.
L’introduzione di Gemini Robotics e Gemini Robotics-ER segna una svolta significativa nel campo della robotica, avvicinando la possibilità di disporre di robot generalisti in grado di apprendere e adattarsi autonomamente a una vasta gamma di compiti.