La chiusura del progetto Wordfreq, che mirava a monitorare e analizzare l’uso della lingua su varie piattaforme, è stata attribuita principalmente alla contaminazione dei suoi dati da parte dell’intelligenza artificiale generativa.

Monitorare e analizzare l’uso della lingua su varie piattaforme è fondamentale per comprendere le tendenze linguistiche, supportare la ricerca accademica e valutare l’apprendimento delle lingue. Questi dati offrono preziose informazioni su come la lingua si evolve in risposta a cambiamenti culturali e sociali, facilitano l’adattamento della comunicazione nei contesti digitali e aiutano a distinguere tra contenuti significativi e quelli generati automaticamente. Google ad esempio ha già reso pubblica la frequenza delle parole tramite il suo servizio ngram, che utilizza la letteratura pubblicata come riferimento/fonte

Questa situazione riflette problemi più ampi nel campo dell’elaborazione del linguaggio naturale (NLP) e solleva preoccupazioni significative sulla affidabilità della ricerca linguistica in un’era dominata dai contenuti generati dall’IA.