Andrey Karpathy: “Guardare i LLM come chatbot è come guardare i primi computer come calcolatrici. Stiamo assistendo all’emergere di un nuovo paradigma di calcolo, e siamo solo all’inizio.” (23/09)

Carlos E. Perez: “AIOS costituisce una piattaforma olistica per liberare veramente il potenziale degli agenti LLM nel mondo reale.”

Sistema operativo dell’agente LLM. arXiv prestampa arXiv:2403.16971 .

AIOS (LLM Agent Operating System) è un nuovo framework di orchestrazione degli agenti che incorpora modelli di linguaggio di grandi dimensioni nei sistemi operativi, creando un sistema operativo con un “cervello” capace di “comprendere”.

AIOS è progettato per una distribuzione ottimale delle risorse, facilitando i cambi di contesto, l’esecuzione simultanea, i servizi di strumenti per gli agenti, il controllo degli accessi e fornendo un ricco set di strumenti per gli sviluppatori.

AIOS si basa su diversi agenti chiave che orchestrano gli altri. È composto da:

  • un Gestore di Agenti per la priorizzazione delle richieste degli agenti,
  • un Gestore di Contesto per la gestione del contesto di interazione,
  • un Gestore di Memoria per la memoria a breve termine,
  • un Gestore di Archiviazione per la conservazione dei dati a lungo termine,
  • un Gestore di Strumenti per la gestione degli strumenti API esterni,
  • e un Gestore di Accessi per l’applicazione delle politiche di privacy e controllo degli accessi.

Questi agenti comunicano con l’SDK di AIOS in modalità interattiva, insieme a compiti non-LLM provenienti dal Kernel del sistema operativo (con il pianificatore di processi, il gestore di memoria, ecc).

Questa architettura permette ad AIOS di integrare funzionalità AI complesse nei sistemi operativi tradizionali, consentendo lo sviluppo di applicazioni più intelligenti, reattive ed efficienti che possono sfruttare tutta la potenza dei LLM insieme alle risorse e capacità del sistema operativo convenzionale.

Perché è importante.

Questo approccio rappresenta un cambiamento nel modo in cui interagiamo con le macchine, con agenti implementati a livello di Sistema Operativo che svolgono compiti complessi.

Questa tendenza è dimostrata anche dai modelli ReALM di Apple, capaci di comprendere non solo la conversazione, ma anche le informazioni sullo schermo e sui lavori in background. Stiamo entrando in una nuova era del computing intelligente.