Recenti ricerche indicano che l’intelligenza artificiale generativa (IA) potrebbe rappresentare una minaccia significativa per piattaforme come Reddit e altri siti di domande e risposte. Uno studio pubblicato nel mese di settembre 2024 nella rivista scientifica PNAS Nexus evidenzia preoccupazioni riguardo al fatto che i modelli di linguaggio di grandi dimensioni potrebbero compromettere l’integrità e l’affidabilità dei contenuti generati dagli utenti su queste piattaforme.
Tag: reddit
OpenAI addestrerà il suo modello di intelligenza artificiale sui contenuti della piattaforma di discussione sociale Reddit, hanno annunciato congiuntamente giovedì le due società.
Reddit si è garantito “uno spazio importante per la conversazione su Internet” e ha affermato che l’accordo amplierà la gamma di materiale nel modello linguistico di grandi dimensioni (LLM) di OpenAI, aiutandolo a migliorare l’esperienza dell’utente.”
WordPress e Tumblr venderanno i dati degli utenti per addestrare modelli di Intelligenza Artificiale
Tumblr e WordPress si stanno preparando a vendere i dati degli utenti ad OpenAi e a Midjourney per addestrare modelli Intelligenza Artificiale (AI). La notizia è stata lanciata da 404media, un sito di notizie tecnologiche, che sarebbe entrato in possesso di documenti interni all’azienda che si riferivano in particolare alla “compilazione di un elenco di tutti i contenuti dei post pubblici di Tumblr tra il 2014 e il 2023“.
La società madre delle piattaforme, Automattic Inc., ha pubblicato a tale proposito un post sul blog assicurando agli utenti della piattaforma che potranno rinunciare agli accordi che verranno stipulati per addestrare l’Intelligenza Artificiale o quantomeno avere un certo controllo sui contenuti.
“Le normative proposte in tutto il mondo, come l’AI Act dell’Unione Europea, darebbero agli individui un maggiore controllo su se e come i loro contenuti possono essere utilizzati da questa tecnologia emergente“, ha spiegato Tumblr in un post. “Supportiamo questo diritto indipendentemente dalla posizione geografica, quindi stiamo rilasciando un bottone per disattivare la condivisione dei contenuti dei tuoi blog pubblici con terze parti, comprese le piattaforme di intelligenza artificiale che utilizzano questi contenuti per la formazione dei modelli.“
È un tema, quello dell’utilizzo dei contenuti, di editori o di piattaforme di condivisione, che continua a riproporsi con sempre maggiore attualità negli ultimi mesi. Da quando i sistemi di Intelligenza Artificiale generativa, Open AI in primis, hanno iniziato ad addestrare i propri modelli linguistici su grandi set di dati, legislatori, politici e aziende, soprattutto editoriali, hanno acceso i riflettori sui cosidetti modelli di fondazione per capire cosa sia legale e cosa invece sia da ritenersi protetto da copyright quando le società di Intelligenza Artificiale setacciano il web per addestrare i loro modelli di AI.
D’altra parte, le aziende di Intelligenza Artificiale hanno un bisogno vitale di fonti dati per addestrare i propri sistemi su un insieme di dati o un argomento specifico e migliori sono i dati che alimentano i modelli – da qui l’interesse per i contenuti editoriali – migliori saranno poi i risultati che il modello riuscirà a restituire una volta addestrato.
Proprio per questo stiamo vedendo sempre più spesso accordi tra società di AI e produttori o distributori di contenuti. E’ di appena qualche giorno fa la notizia che Reddit ha firmato un accordo di licenza di contenuti con Google, così come aveva già fatto OpenAI con l’editore tedesco Axel Springer e con l’Associated Press. Anche se, non sempre si riesce a trovare una quadra sull’argomento e le numerose le cause legali, inclusa quella lanciata dal New York Times alla fine dello scorso anno contro OpenAI, stanno a dimostrare che sul tema dei contenuti e della titolarità dei diritti una volta che questi sono messi in rete e resi disponibili su piattaforme di condivisione, c’è ancora molta strada da percorrere.
Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale, i consigli sui tool da provare, i prompt e i corsi di formazione. Iscriviti alla newsletter settimanale e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta!
Se avete pubblicato un post su Reddit, probabilmente state alimentando il futuro dell’Intelligenza Artificiale. Secondo quanto riportato da Bloomberg infatti, Reddit – la piattaforma di social news, intrattenimento e forum – avrebbe firmato un contratto che consente ad una società di AI della quale non è ancora noto il nome (ma che si pensa possa essere OpenAI o anche Google), di addestrare i suoi modelli sui contenuti del sito. La notizia arriva mentre la piattaforma di social media si avvicina al lancio della sua offerta pubblica iniziale (IPO), che potrebbe avvenire già il mese prossimo.
L’accordo dovrebbe avere un valore di 60 milioni di dollari all’anno e potrebbe in teoria servire da modello per futuri accordi con altre società di Intelligenza Artificiale.
Va osservato che, dopo un periodo in cui le aziende di Intelligenza Artificiale utilizzavano i dati di addestramento senza chiedere espressamente l’autorizzazione del titolare dei diritti – un tema che peraltro è ancora aperto con il dibattito tra diritto d’autore e fair use – alcune aziende tecnologiche hanno recentemente iniziato a stipulare accordi in base ai quali acquisiscono l’accesso ai contenuti utilizzati per l’addestramento di modelli di intelligenza artificiale simili a GPT.
Lo scorso mese di dicembre, ad esempio, OpenAI ha firmato un accordo con l’editore tedesco Axel Springer (l’editore di Politico e Business Insider) per l’accesso ai suoi articoli. Sempre OpenAI, che peraltro ha stretto accordi anche con altre organizzazioni, inclusa l’Associated Press, non è riuscita invece a ad accordarsi con il New York Times che ha promosso una causa nei suoi confronti per violazione del diritto d’autore.
Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale, i consigli sui tool da provare, i prompt e i corsi di formazione. Iscriviti alla newsletter settimanale e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta! ✉