La competizione per sviluppare modelli linguistici di grandi dimensioni (LLM) sta finalmente guadagnando terreno in Europa, che finora era rimasta ai margini di questa rivoluzione tecnologica. Mentre OpenAI continua a dominare, inseguita da concorrenti agguerriti come Google Gemini, l’Europa inizia a mostrare segni di risveglio grazie a realtà emergenti come la startup francese Mistral, l’italiana Babelscape e il progetto Minerva sostenuto dalla Sapienza di Roma e il progetto iberico sostenuto dal BSC. Tuttavia, il panorama è vasto e complesso, richiedendo un esame approfondito delle iniziative che stanno cercando di ridefinire il ruolo dell’Europa nell’IA generativa.
Mistral: La Sfida Francese a GPT-4
La startup francese Mistral ha recentemente lanciato il suo modello linguistico Mistral-Large, che sorprende per le sue prestazioni comparabili a GPT-4 nonostante un numero significativamente inferiore di parametri. Il modello, accompagnato dal chatbot Le Chat, rappresenta un passo strategico verso l’indipendenza tecnologica europea. Microsoft ha investito 15 milioni di euro, rendendo Mistral disponibile su Azure.
La forza di Mistral risiede nella combinazione di eccellenza ingegneristica e una formazione avanzata acquisita in laboratori di ricerca americani come Google AI e Meta AI. Il co-fondatore Cédric O, ex ministro francese per il Digitale, garantisce un solido supporto politico. L’approccio alla gestione dei dati è innovativo: modelli più piccoli ma estremamente efficienti, addestrati con una cura meticolosa nella selezione e pulizia dei dati. Questo ha permesso a Mistral di raccogliere 490 milioni di euro in finanziamenti, con una valutazione aziendale superiore ai 2 miliardi.
Minerva 7LB: L’Iniziativa Italiana di Navigli
L’Italia si distingue anche per Minerva 7LB, sviluppato dal consorzio di ricerca Navigli in collaborazione con l’Università La Sapienza di Roma. Minerva 7LB è progettato per elaborare dati multilingue con un focus su lingue europee meno diffuse e settori scientifici complessi. Il progetto integra tecnologie di punta basate su supercomputer italiani ed è supportato da finanziamenti dell’Unione Europea. Minerva 7LB è considerato uno dei modelli più promettenti grazie alla sua capacità di adattamento a contesti scientifici e culturali specifici.
Poro: L’Avanzata Finlandese per le Lingue a Bassa Risorsa
In Finlandia, il progetto Poro, sviluppato da Silo AI in collaborazione con l’Università di Turku e HPLT, rappresenta un modello linguistico aperto focalizzato sulle lingue europee meno diffuse. Addestrato su un dataset di 1.000 miliardi di token e con 34,2 miliardi di parametri, Poro supera tutti i modelli esistenti in finlandese, inclusi Mistral e Llama.
L’approccio innovativo di Poro consiste nell’accoppiare lingue a bassa risorsa con lingue ad alta risorsa come l’inglese, migliorando la comprensione interlinguistica. Questo metodo ha permesso di raggiungere prestazioni elevate in finlandese senza compromessi per l’inglese. Poro è anche il primo LLM addestrato sul supercomputer EuroHPC LUMI, dimostrando la possibilità di utilizzare architetture basate su chip AMD.
Italia: Magiq e Modello Italia
L’Italia ha lanciato due progetti di rilievo: Magiq, sviluppato da My Maia e Synapsia, e Modello Italia, una collaborazione tra iGenius e Cineca. Magiq è progettato per comprendere le sfumature culturali italiane, con applicazioni specifiche nel chatbot Maia Life Copilot. Modello Italia, invece, punta a costruire un LLM interamente italiano, open-source e conforme alle normative sulla privacy e sulla sicurezza nazionale.
Con il supporto di Cineca, il modello sarà addestrato su dati privi di copyright e sarà disponibile entro l’estate. Questa iniziativa mira a garantire la sovranità tecnologica dell’Italia e la competitività delle sue aziende.
Spagna: Un Modello Multilingue per l’Intero Mondo Ispanofono
La Spagna ha annunciato un progetto ambizioso per sviluppare un LLM open-source multilingue che supporti non solo lo spagnolo (castigliano), ma anche il basco, il catalano, il galiziano e il valenciano. Questo progetto è una collaborazione tra il BSC, la Rete Spagnola di Supercalcolo e l’Accademia Reale di Spagna.
Il progetto sfrutta l’infrastruttura del supercomputer MareNostrum 5 e coinvolge paesi dell’America Latina per una portata globale. Una volta rilasciato, l’LLM potrà essere utilizzato per migliorare applicazioni industriali e istituzionali, offrendo un’alternativa europea competitiva ai modelli statunitensi.
Verso un’Intelligenza Artificiale Europea
Queste iniziative rappresentano una sfida diretta al monopolio americano nel settore degli LLM. La diversità linguistica e culturale dell’Europa potrebbe diventare un vantaggio competitivo se supportata da adeguate infrastrutture tecnologiche e investimenti strategici. La partita è appena iniziata, ma l’Europa sembra finalmente pronta a giocare un ruolo da protagonista nella corsa globale all’intelligenza artificiale.
Newsletter – Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale: iscriviti alla newsletter di Rivista.AI e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta!