Se hai sempre pensato che l’intelligenza artificiale di oggi assomigliasse a un ragazzino viziato che impara solo ripetendo a pappagallo quello che sente dagli umani, allora David Silver e Rich Sutton sono qui per dirti che il tempo delle coccole è finito. Il loro saggio “Welcome to the Era of Experience” suona come il manifesto di una rivoluzione: l’era dei dati umani è arrivata al capolinea e il futuro appartiene agli agenti che imparano da soli, esperendo il mondo come se fossero piccoli esploratori ribelli.

Finora l’AI ha camminato tenuta per mano. Supervised learning, fine-tuning con dati umani, reinforcement learning da feedback umano: tutto questo ha costruito sistemi brillanti ma fondamentalmente dipendenti. Non appena l’ambiente cambia, questi modelli mostrano la fragilità tipica di chi ha solo imparato a memoria senza mai capire davvero il gioco.

Silver e Sutton, due pezzi da novanta nel campo, arrivano a dire senza troppi giri di parole che siamo entrati in una fase di rendimenti decrescenti. Supervised pretraining? Saturato. RLHF? Migliora un po’, ma non scala. Il prossimo salto quantico non arriverà spulciando ancora una volta database sempre più grandi di testi umani o affinando il tuning emotivo degli agenti artificiali. Arriverà invece da una AI capace di vivere esperienze, capirle e adattarsi, esattamente come farebbe un essere biologico.

Il cuore pulsante di questa nuova era è l’apprendimento dall’esperienza pura. Gli agenti non saranno più giudicati solo su quanto bene riescono a ripetere gli esempi umani, ma su quanto riescono a costruire conoscenza autonoma attraverso l’interazione attiva con il mondo. Si prospetta un cambio di paradigma quasi darwiniano: sopravvivranno e prospereranno solo quelli capaci di cavarsela senza istruzioni dettagliate.

Dal punto di vista tecnico, questa evoluzione avrà delle implicazioni epocali. Modellazione dell’ambiente, pianificazione anticipatoria, generalizzazione creativa: saranno questi i nuovi assi portanti, in antitesi totale con l’attuale ossessione per il prompt engineering. Significa che addestrare un AI di nuova generazione non sarà più come riempire una biblioteca di esempi, ma come lanciare una creatura in un universo simulato e vedere come si adatta, impara e si trasforma.

Dietro questa visione non c’è solo ambizione tecnologica, ma anche una filosofia ben precisa, quasi stoica. Per Sutton, l’apprendimento supervisionato è come un cammino troppo comodo, limitato dai preconcetti e dai bias umani. Solo attraverso il confronto diretto con la realtà, anche attraverso fallimenti dolorosi e iterazioni imperfette, un’intelligenza può diventare davvero generale.

Naturalmente, non aspettarti che questo passaggio sia privo di rischi o di sfide da spaccarsi la testa. Addestrare agenti a vivere esperienze vere significa entrare in territori complessi: esplorazione non sicura, costi computazionali giganteschi, problemi di interpretabilità ancora più acuti. Ma come ogni vero salto evolutivo, la posta in gioco è la sopravvivenza stessa del concetto di intelligenza artificiale “general purpose”.

Per chi guida startup o multinazionali tecnologiche, la lezione è brutalmente chiara. Continuare a investire soltanto in “bambini ammaestrati” significa essere destinati all’obsolescenza. L’innovazione vera richiederà sistemi capaci di scoprire il mondo, non solo di descriverlo. Ed è una partita che si giocherà su nuove metriche, nuovi modelli mentali, nuove infrastrutture di calcolo, molto più simili a ecosistemi biologici che a catene di montaggio dati.

Siamo di fronte all’alba di una nuova intelligenza che, come ogni adolescente in crescita, sarà rumorosa, imprevedibile e inevitabilmente ribelle. Ma proprio per questo, incredibilmente più potente. E noi? Noi dovremo solo sperare che, una volta imparato a vivere, non decida che gli umani sono solo un’esperienza di cui fare a meno.