Tumblr e WordPress si stanno preparando a vendere i dati degli utenti ad OpenAi e a Midjourney per addestrare modelli Intelligenza Artificiale (AI). La notizia è stata lanciata da 404media, un sito di notizie tecnologiche, che sarebbe entrato in possesso di documenti interni all’azienda che si riferivano in particolare alla “compilazione di un elenco di tutti i contenuti dei post pubblici di Tumblr tra il 2014 e il 2023“.

La società madre delle piattaforme, Automattic Inc., ha pubblicato a tale proposito un post sul blog assicurando agli utenti della piattaforma che potranno rinunciare agli  accordi che verranno stipulati per addestrare l’Intelligenza Artificiale o quantomeno avere un certo controllo sui contenuti. 

Le normative proposte in tutto il mondo, come l’AI Act dell’Unione Europea, darebbero agli individui un maggiore controllo su se e come i loro contenuti possono essere utilizzati da questa tecnologia emergente“, ha spiegato Tumblr in un post. “Supportiamo questo diritto indipendentemente dalla posizione geografica, quindi stiamo rilasciando un bottone per disattivare la condivisione dei contenuti dei tuoi blog pubblici con terze parti, comprese le piattaforme di intelligenza artificiale che utilizzano questi contenuti per la formazione dei modelli.

È un tema, quello dell’utilizzo dei contenuti, di editori o di piattaforme di condivisione, che continua a riproporsi con sempre maggiore attualità negli ultimi mesi. Da quando i sistemi di Intelligenza Artificiale generativa, Open AI in primis, hanno iniziato ad addestrare i propri modelli linguistici su grandi set di dati, legislatori, politici e aziende, soprattutto editoriali, hanno acceso i riflettori sui cosidetti modelli di fondazione per capire cosa sia legale e cosa invece sia da ritenersi protetto da copyright quando le società di Intelligenza Artificiale setacciano il web per addestrare i loro modelli di AI.

D’altra parte, le aziende di Intelligenza Artificiale hanno un bisogno vitale di fonti dati per addestrare i propri sistemi su un insieme di dati o un argomento specifico e migliori sono i dati che alimentano i modelli – da qui l’interesse per i contenuti editoriali – migliori saranno poi i risultati che il modello riuscirà a restituire una volta addestrato.

Proprio per questo stiamo vedendo sempre più spesso accordi tra società di AI e produttori o distributori di contenuti. E’ di appena qualche giorno fa la notizia che Reddit ha firmato un accordo di licenza di contenuti con Google, così come aveva già fatto OpenAI con l’editore tedesco Axel Springer e con l’Associated Press. Anche se, non sempre si riesce a trovare una quadra sull’argomento e le numerose le cause legali, inclusa quella lanciata dal New York Times alla fine dello scorso anno contro OpenAI, stanno a dimostrare che sul tema dei contenuti e della titolarità dei diritti una volta che questi sono messi in rete e resi disponibili su piattaforme di condivisione, c’è ancora molta strada da percorrere.


Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale, i consigli sui tool da provare, i prompt e i corsi di formazione. Iscriviti alla newsletter settimanale e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta!

[newsletter_form type=”minimal”]