Il New York Times ha intentato una causa contro Microsoft e OpenAI, accusando entrambe di violazione del copyright e di aver utilizzato abusivamente la proprietà intellettuale del giornale per addestrare modelli linguistici di grandi dimensioni, i LLM che sono alla base di ChatGPT e di Copilot.

Secondo l’editore infatti milioni di suoi articoli sarebbero stati utilizzati per addestrare i chatbot delle due aziende che ora sarebbero potenzialmente in grado di competere direttamente con i contenuti del quotidiano. Sebbene il New York Times abbia affermato in una dichiarazione di riconoscere il potenziale in termini di utilità dell’Intelligenza Artificiale Generativa per il pubblico e per il giornalismo, ha aggiunto che, se utilizzato per scopi commerciali, il materiale giornalistico richiede il permesso del detentore dei diritti di copyright.

Questi strumenti, si afferma nell’articolo del New York Times che riporta la notizia, “sono stati creati e continuano a utilizzare giornalismo indipendente e contenuti che sono disponibili solo perché noi e i nostri colleghi li abbiamo segnalati, modificati e verificati a costi elevati e con notevole esperienza” e quindi “se Microsoft e OpenAI desiderano utilizzare il nostro lavoro per scopi commerciali, la legge [riferendosi alle norme sul copyright] richiede che ottengano prima il nostro permesso. Non l’hanno fatto”.

Il dettaglio non è di poco conto perché, come sappiamo, le società che sviluppano sistemi di AI non dichiarano espressamente su quali contenuti sono stati allenati i propri algoritmi e anche perché lo studio legale Susman Godfrey che assiste il New York Times in questo procedimento è lo stesso che rappresenta anche l’autore Julian Sancton e altri scrittori in una causa separata contro OpenAI e Microsoft che accusa le società di utilizzare materiali protetti da copyright senza autorizzazione per addestrare diverse versioni di ChatGPT.

In un’udienza al Congresso lo scorso mese di maggio, Sam Altman, CEO di OpenAi, si è mantenuto abbastanza vago su questo tema, affermando che i modelli utilizzati da ChatGPT sono addestrati su un’ampia gamma di dati che includono contenuti disponibili al pubblico, contenuti concessi in licenza e contenuti generati da revisori umani.

La causa arriva due settimane dopo che un altro importante editore, Axel Springer, che edita il quotidiano tedesco Bild oltre che Politico e Business Insider, ha invece raggiunto un accordo economico proprio con OpenAi per l’utilizzo dei propri contenuti da parte di ChatGPT, accordo che invece il New York Times dichiara non essere riuscito a siglare.

La denuncia del New York Times è quindi da questo punto di vista importante perché capiremo quali saranno gli orientamenti della Corte sul tema del copyright atteso che le società di Intelligenza Artificiale si sono sempre rifatte alla dottrina del Fair Use che consente a una parte di utilizzare un’opera protetta da copyright senza il permesso del proprietario del copyright per scopi quali critiche, commenti, notizie, insegnamento, borse di studio o ricerca.

Adesso, man mano che gli strumenti di intelligenza artificiale continuano ad avanzare in termini di capacità e portata, la tradizionale applicazione del Fair Use potrebbe essere messa in discussione e un’interpretazione più restrittiva del suo utilizzo potrebbe ridurre drasticamente il modo in cui l’intelligenza artificiale generativa viene addestrata e utilizzata portando addirittura all’obbligo di rimozione del materiale che viola il diritto d’autore sulla base del Digital Millennium Copyright Act (DMCA).