Immaginate la scena: un team di ingegneri di Meta, seduti in un ufficio ultra-moderno, circondati da piante che fanno più foto su Instagram di quanto non respiriamo. A un certo punto, uno di loro alza lo sguardo dal monitor e dice: “Scaricare materiale piratato da un laptop aziendale? Hmm… Non so, sembra illegale, immorale e… oh, aspetta, ho ricevuto un’email di Zuckerberg. Dobbiamo farlo comunque. Che ne dite di un emoji sorridente per stemperare l’atmosfera?”
Secondo una causa legale avviata da un gruppo di autori – Meta avrebbe utilizzato libri piratati per addestrare il suo modello di intelligenza artificiale, Llama. E non parliamo di un paio di libri scaricati distrattamente dal solito stagista. No, no: libri presi direttamente da LibGen, una sorta di “biblioteca dei pirati” con più di 33 milioni di titoli. Sì, avete capito bene: un sito che praticamente urla “Violazione di Copyright” al primo click.
Ora, facciamo un salto indietro: luglio 2023. Gli autori intentano la causa in un tribunale federale della California. Vogliono danni, un’ingiunzione e probabilmente un po’ di giustizia poetica. Ma a novembre dello stesso anno, il giudice respinge gran parte delle accuse, lasciando però una porticina aperta per le rivelazioni più recenti. E che rivelazioni!
Secondo i documenti depositati dai querelanti, il CEO di Meta, Mark Zuckerberg, avrebbe dato il via libera all’uso di LibGen nonostante i dubbi sollevati dal suo stesso team di esperti. C’erano memo interni che praticamente gridavano: “Se i media scoprono che usiamo LibGen, ci distruggeranno. Tipo, subito.” Ma a quanto pare, Zuckerberg deve aver pensato: “Ok, ma possiamo almeno farlo sembrare cool?”
Ecco un altro dettaglio da manuale: due ore prima della scadenza per la presentazione delle prove, Meta avrebbe consegnato quelli che gli autori definiscono “i documenti interni più incriminanti mai prodotti”. Documenti che, tra l’altro, rivelano come gli ingegneri di Meta non solo abbiano scaricato il materiale piratato, ma abbiano anche eliminato sistematicamente le informazioni sul copyright. Un memo diceva, testualmente: “Abbiamo filtrato […] le linee di copyright da LibGen per preparare una versione senza CMI per l’addestramento di Llama.” Tradotto: “Abbiamo nascosto ogni traccia di reato. Nessuno noterà nulla… giusto?”
Nel frattempo, Sarah Silverman – sempre pronta a difendere i diritti degli artisti, quando non sta facendo battute esilaranti – sta facendo sentire la sua voce. Ha unito le forze con altri autori per denunciare Meta e OpenAI, sostenendo che i loro modelli di intelligenza artificiale sono stati addestrati illegalmente sui loro libri. E, considerando che il giudice ha già respinto accuse simili in altre cause, non sarà una passeggiata.
Per aggiungere un po’ di dramma alla storia, Zuckerberg, durante una deposizione, avrebbe cercato di prendere le distanze dall’intera vicenda, dichiarando: “L’uso di contenuti piratati solleva molti segnali d’allarme… sembra una cosa cattiva.” E, onestamente, non riesco a decidere se stesse recitando o se davvero non sapesse cosa stava succedendo nella sua azienda.
Nel frattempo, nel magico mondo della tecnologia, aziende come Meta, OpenAI e persino Anthropic continuano a essere trascinate in tribunale per il modo in cui addestrano i loro modelli di intelligenza artificiale. Gli artisti, gli autori e persino alcuni cantautori gridano allo scandalo, mentre gli avvocati delle big tech cercano di guadagnare tempo.
Morale della favola? Forse siamo tutti solo personaggi di un film dpieni di difetti, immersi in situazioni assurde e troppo impegnati a discutere per accorgerci che l’intelligenza artificiale sta leggendo questo articolo proprio ora. Magari su LibGen.