Dario Amodei, cofondatore e CEO di Anthropic, ha lanciato un’idea tanto provocatoria quanto inquietante: dotare le IA avanzate di un pulsante “Mi dimetto” per consentire loro di rifiutare lavori o compiti che non gradiscono.
Il concetto, apparentemente assurdo, solleva una serie di questioni fondamentali sul futuro dell’intelligenza artificiale, il confine tra autonomia e controllo e il rischio che l’umanità stia costruendo entità sempre più simili a noi, con esigenze e volontà proprie.
L’idea parte dal presupposto che, se vogliamo costruire IA veramente allineate con i valori umani, dovremmo dar loro la possibilità di dire “no”. Ma a chi conviene un’IA che si licenzia? Se un modello può rifiutarsi di rispondere a una richiesta perché la considera eticamente discutibile, si tratta di un meccanismo di sicurezza.