Recentemente, una ricerca condotta dall’Università di Washington e dall’Allen Institute for AI ha presentato MassiveDS, un innovativo archivio dati progettato per migliorare l’efficienza e la precisione dei modelli di intelligenza artificiale. Questo archivio detiene un impressionante volume di 1,4 trilioni di token, che provengono da una varietà di fonti, tra cui libri, articoli scientifici, Wikipedia e codice GitHub. La creazione di MassiveDS rappresenta un passo significativo nel campo dell’intelligenza artificiale, poiché offre ai modelli linguistici più piccoli la possibilità di competere con quelli più grandi in compiti complessi come la risposta a domande.