EvolutionaryScale, un laboratorio di ricerca all’avanguardia sull’intelligenza artificiale, ha presentato ESM3, un rivoluzionario modello di intelligenza artificiale generativa per la progettazione di proteine ​​che simula milioni di anni di evoluzione per creare nuove proteine, rivoluzionando potenzialmente campi che vanno dalla scoperta di farmaci alla sostenibilità ambientale.

Il modello di linguaggio open source ESM3 1.4B di EvolutionaryScale è ora disponibile al pubblico su AWS tramite Amazon SageMaker JumpStart e AWS HealthOmics, con l’intera famiglia in arrivo a breve. Amazon SageMaker JumpStart è un hub di machine learning con modelli di fondazione, algoritmi integrati e soluzioni di machine learning predefinite implementabili in pochi clic. AWS HealthOmics è un servizio specifico che aiuta le organizzazioni sanitarie e di Life Science ad analizzare i dati biologici.

ESM3 rappresenta un notevole progresso nei modelli di linguaggio proteico, con 98 miliardi di parametri e un addestramento su un vasto dataset di 2,78 miliardi di sequenze proteiche. Questo modello di terza generazione integra annotazioni di sequenza, struttura e funzione come input, garantendo un’accuratezza senza precedenti nell’identificazione e validazione delle proteine. Addestrato con 1 trilione di teraflop, più potenza di calcolo di qualsiasi altro modello noto in biologia, ESM3 utilizza GPU NVIDIA H100 e il cluster Andromeda per la sua robusta infrastruttura computazionale.

  • Primo modello generativo che ragiona simultaneamente su sequenza, struttura e funzione delle proteine
  • Abilita la richiesta interattiva per la creazione di proteine
  • Addestrato su diversi organismi e biomi per una comprensione completa delle proteine
  • Capace di auto-miglioramento basato sul feedback e sulla progettazione di proteine ​​con funzionalità specifiche.

Le collaborazioni con i leader del settore sono cruciali per l’accessibilità e lo sviluppo futuro di ESM3. Amazon Web Services (AWS) sta lavorando per rendere disponibile l’intera famiglia di modelli ESM3 a centinaia di migliaia di ricercatori in tutto il mondo, comprese nove delle prime dieci aziende farmaceutiche globali. NVIDIA sta ottimizzando ESM3 per migliorare le prestazioni di formazione e inferenza attraverso NVIDIA BioNeMo NIM, supportato dalla licenza software NVIDIA AI Enterprise.

Per raggiungere i suoi ambiziosi obiettivi, EvolutionaryScale ha ottenuto oltre 142 milioni di dollari in finanziamenti iniziali da investitori come Lux Capital, Amazon, NVentures (la divisione di capitale di rischio di NVIDIA), Nat Friedman e Daniel Gross. Questo significativo sostegno finanziario favorirà l’espansione e l’applicazione dell’ESM3 in vari ambiti scientifici.

Il modello open source ESM3 1.4B di EvolutionaryScale sarà disponibile in Amazon SageMaker JumpStart inizialmente negli Stati Uniti orientali (Ohio) e in tutte le regioni AWS HealthOmics disponibili, ad eccezione dell’Asia Pacifico (Singapore). Per saperne di più, leggi il blog e il comunicato stampa. Per iniziare a usare ESM3, visita il sito Web SageMaker JumpStart e il repository GitHub di AWS HealthOmics.

In un’eccezionale dimostrazione delle sue potenzialità, ESM3 ha creato una nuova variante della proteina fluorescente verde (GFP), un risultato che normalmente richiederebbe 500 milioni di anni di evoluzione naturale. Questa nuova GFP mostra una dissimilarità del 58% rispetto alla proteina fluorescente più vicina conosciuta, replicando le caratteristiche bioluminescenti osservate nelle meduse e nei coralli. La creazione di questa variante GFP evidenzia il potenziale di ESM3 nel velocizzare la ricerca scientifica, simulando lunghi processi evolutivi in una frazione del tempo.

Le applicazioni di ESM3 coprono una vasta gamma di campi scientifici, dalla scoperta di farmaci alla scienza dei materiali e alla sostenibilità ambientale. Nel campo farmaceutico, la capacità del modello di generare nuove proteine potrebbe accelerare lo sviluppo di terapie innovative e anticorpi. Le potenzialità di ESM3 si estendono anche alle applicazioni ambientali, con la possibilità di progettare proteine per la cattura del carbonio e creare enzimi capaci di decomporre la plastica nociva. La natura interattiva del modello permette ai ricercatori di utilizzarlo per progetti proteici specifici, fungendo da collaboratore virtuale nella risoluzione di sfide biologiche complesse. Questa versatilità rende ESM3 uno strumento rivoluzionario nelle scienze della vita, con il potenziale di trasformare l’approccio all’ingegneria proteica e alla ricerca biologica.

Guarda: https://www.youtube.com/watch?v=aPCqzrscY4w