Con un colpo di scena in stile open-source, la Wikimedia Foundation ha deciso di affrontare di petto uno dei problemi più spinosi dell’era AI: il sovrasfruttamento dei contenuti da parte degli scraper automatizzati. Lo fa non chiudendo, ma aprendo meglio: nasce così un dataset pensato appositamente per l’addestramento dei modelli di intelligenza artificiale.
Categoria: Editoria
Editoria e Diritto d’Autore

Il tema della violazione del diritto d’autore a causa delle tante e recenti applicazioni basate sull’intelligenza artificiale sta assumendo una dimensione più che rilevante a livello globale e locale. Da un lato, l’AI generativa offre opportunità straordinarie per artisti e creativi; dall’altro, solleva interrogativi etici e giuridici sulla tutela delle opere, come evidenziato dal recente rilascio di un aggiornamento di ChatGPT che consente di generare immagini nello stile di Studio Ghibli, la celebre casa di animazione fondata da Hayao Miyazaki. Il leggendario regista, oggi 84enne, aveva già espresso il suo disappunto nel 2016, definendo “assolutamente disgustosa” l’idea di una creazione AI ispirata alle sue opere. Ora, che il tema sia particolarmente delicato e al limite della legalità lo riconosce implicitamente lo stesso Sam Altman, fondatore di OpenAI, intervenuto sul tema dichiarando che l’azienda sta “rifiutando alcune creazioni che non potrebbero essere consentite, stiamo aggiustando questo aspetto il prima possibile”.

L’industria del doppiaggio in Italia è da sempre un’eccellenza riconosciuta a livello globale. Eppure, l’avanzata dell’intelligenza artificiale generativa minaccia di trasformare radicalmente questo settore, sollevando questioni cruciali su diritti d’autore, proprietà intellettuale e tutela del lavoro umano. A lanciare l’allarme è la Commissione Cultura della Camera, che ha presentato una risoluzione, con l’obiettivo di proteggere i professionisti del doppiaggio dall’uso indiscriminato delle loro voci da parte dei modelli di AI.

Il tema del copyright e dei diritti d’autore in relazione all’intelligenza artificiale è un argomento complesso che tocca questioni legali, etiche e creative, ma anche aspetti tecnici legati alla struttura stessa degli LLM. Con il rilascio di modelli di AI sempre più sofisticati, capaci di generare testi, musica, immagini e altri contenuti, il dibattito su come vengano utilizzati i dati per “addestrare” questi sistemi e le implicazioni per i detentori dei diritti su queste opere è di grande attualità.
Quando ci si domanda se sia possibile tentare di rimuovere libri, articoli, immagini, musica e quant’altro dai modelli di AI – come spesso richiedono i detentori dei diritti stessi – la risposta è che nella pratica è un task estremamente difficile e spesso impossibile da realizzare in modo efficace.

Una nuova battaglia legale scuote il mondo della tecnologia e dell’editoria. Questa volta arriva dalla Francia, dove editori e autori hanno intentato una causa contro Meta Platforms Inc., accusando il colosso tech di aver utilizzato senza autorizzazione i loro libri per addestrare i propri modelli di AI generativa. La denuncia, depositata questa settimana presso un tribunale parigino specializzato in proprietà intellettuale, rappresenta una delle prime azioni legali di questo tipo in Francia e si inserisce all’interno di quella più ampia ondata globale di contenziosi sull’uso dei dati per l’addestramento dell’AI.