Evoluzione dell’IA nella Radiologia
L’IA è stata applicata nell’imaging medico per decenni, ma la sua crescita esponenziale è avvenuta recentemente. Secondo i dati più recenti, fino a luglio 2023, 692 dispositivi medici abilitati all’IA hanno ricevuto l’autorizzazione al mercato, con oltre il 75% di questi dedicati alla radiologia. Questa crescita ha spinto i regolatori a sviluppare linee guida più rigorose per garantire che i dispositivi siano validati in contesti clinici realistici e che i rischi, come i bias nei dati, siano adeguatamente identificati e mitigati.
Applicazioni dell’IA in Radiologia
Le applicazioni dell’IA in radiologia possono essere classificate in cinque categorie principali:
- Delineazione Automatica: Identificazione di strutture anatomiche in un’immagine.
- Rilevamento delle Anomalie: Identificazione di lesioni o anomalie in immagini mediche.
- Miglioramento dell’Immagine: Tecniche per migliorare la qualità delle immagini diagnostiche.
- Identificazione di Firmature Specifiche per Malattie: Riconoscimento di schemi indicativi di patologie.
- Predizione degli Esiti: Utilizzo delle immagini per prevedere gli esiti clinici.
Queste categorie mostrano come l’IA possa non solo automatizzare compiti esistenti, ma anche fornire informazioni nuove e significative per il trattamento dei pazienti.
Durante il primo ACR Data Science Summit in presenza dal 2019, Paul J. Chang, MD, professore e vicepresidente di informatica radiologica presso l’Università di Chicago, ha tenuto un discorso principale che ha fornito una mappa fondamentale per comprendere lo stato attuale dell’IA in radiologia e le sue prospettive future.
Chang ha suggerito l’uso della radiomica, ossia algoritmi di intelligenza artificiale per estrarre caratteristiche dalle immagini che sarebbero invisibili all’occhio nudo, come lo strumento di cui la radiologia ha bisogno per migliorare la qualità dei suoi risultati — per essere più contributiva, collaborativa e per superare i rapporti in stile “messaggio in una bottiglia” e fornire informazioni più rilevanti e utilizzabili ai medici di riferimento. Nel suo intervento, ha affermato che implementando un sistema a supporto della radiomica, che ha definito un modello collaborativo uomo-macchina, potremmo non solo migliorare l’efficienza, ma anche la qualità dei rapporti.
Il Gartner Hype Cycle
I modelli di rischio condiviso a capitazione richiedono ai radiologi di fare di più con meno risorse. Questa richiesta ha creato uno slancio per nuove tecnologie volte ad aumentare produttività ed efficienza. Il Gartner Hype Cycle spiega come la tecnologia si evolva nel tempo. Un “trigger tecnologico” provoca un rapido aumento della visibilità della tecnologia, raggiungendo infine un “picco di aspettative gonfiate”, per poi declinare verso il “fondale della disillusione”, seguito da una crescita a un ritmo più moderato sulla “pendenza dell’illuminazione”, prima di raggiungere infine il “livello di produttività”.
7 anni fa, molti sostenevano che la radiologia sarebbe stata presto sostituita dall’IA. Contrariamente a queste previsioni, tuttavia, il deployment clinico dell’IA è ancora nelle sue fasi iniziali. Attualmente ci troviamo nel “fondale della disillusione”, in parte a causa della mancanza di una prospettiva strategica aziendale e della mancanza di governance dell’IA a livello istituzionale. Un sondaggio dell’ACR Data Science Institute® del 2020, pubblicato nel JACR® nel 2021, ha notato che:
- Solo il 30% dei radiologi utilizza l’IA nella pratica clinica attuale.
- Oltre il 70% dei rispondenti non ha piani per investire nell’IA.
- L’80% di coloro che non utilizzano l’IA non vede “alcun beneficio”.
In effetti, contrariamente alle nostre radici nell’adozione tecnologica, i radiologi sono consumatori tardivi dell’IA rispetto ad altri settori aziendali.
Il Fondale della Disillusione
Ci sono quattro motivi principali per cui ci troviamo nel fondale:
- Mancanza di fiducia nelle prestazioni e nella generalizzabilità dell’IA. La validazione dei sistemi di IA è stata difficile, dato che “deep” in “deep learning” significa anche “oscuro”. I metodi di validazione sono stati considerati statisticamente “leggeri”, e non possiamo sempre essere certi che questi modelli possano essere “generalizzati”. Inoltre, la maggior parte degli algoritmi di radiologia diagnostica basati su immagini mostra prestazioni inferiori nella realtà.
- I casi d’uso sono considerati “nice to have” ma non “must haves”. Quando le applicazioni di IA in radiologia sono guidate dalla disponibilità dei dati e non da casi d’uso concreti, si crea un circolo vizioso: la maggior parte delle istituzioni non investirà nell’infrastruttura IT necessaria senza un “casi d’uso decisivo”, ma il “casi d’uso decisivo” non può essere creato senza l’infrastruttura IT necessaria. Sfortunatamente, un’infrastruttura IT subottimale rappresenta un vincolo per l’adozione dell’IA nei livelli di sviluppo, validazione, implementazione, supporto e governance. Dobbiamo selezionare casi d’uso che considerino le priorità del C-suite relative al ritorno sugli investimenti, al costo totale di proprietà e ai requisiti normativi.
- Spesso il flusso di lavoro esistente non riesce a sfruttare al meglio l’IA. Le macchine e gli esseri umani si incontrano “ai margini” e lavorano separatamente anziché insieme, il che limita severamente il potenziale dell’IA. I modelli attuali non supportano i requisiti del ciclo di vita dell’IA necessari, come l’apprendimento continuo e le esigenze di robusta qualità, come la mitigazione della deriva dell’IA.
- La maggior parte delle istituzioni manca della capacità di supportare e gestire l’IA in modo scalabile e sostenibile. La governance dell’IA a livello aziendale non è ancora implementata nella maggior parte delle istituzioni.
La Pendenza dell’Illuminazione
La “pendenza dell’illuminazione” può essere raggiunta costruendo infrastrutture che consentano all’IA di funzionare in modo ottimale. L’infrastruttura IT in radiologia e l’integrazione operano a un livello molto meno sofisticato rispetto alla maggior parte degli altri modelli di integrazione aziendale. La maggior parte degli altri modelli utilizza un’architettura orientata ai servizi (SOA), uno stile di design software che fornisce servizi attraverso un protocollo di comunicazione su una rete.
Collegare un’applicazione a dati o funzionalità di un altro sistema richiede integrazioni complesse, punto a punto. Senza il livello di logica aziendale intermedio di SOA, l’infrastruttura attuale dipende dal radiologo per integrare set di informazioni disparati, come quelli provenienti da PACS e EMR. Questo pone un enorme onere su tutti coloro che sono coinvolti nel processo: il radiologo, gli sviluppatori IT e la manutenzione dei sistemi IT.
Per costruire integrazioni di flusso di lavoro, l’IA non può continuare a essere un sistema “periferico” rispetto ai sistemi IT legacy esistenti. I sistemi attuali devono supportare i requisiti del ciclo di vita dell’IA, come l’apprendimento continuo e le strategie di mitigazione della deriva. La gestione delle immagini e i PACS devono essere ridefiniti e disruptati per raggiungere un’orchestrazione intelligente e ottimizzata del flusso di lavoro.
In parole semplici, le pratiche radiologiche e i centri accademici sono ora chiamati a competere in un ambiente dove gli obiettivi sono misurabili. I miglioramenti in termini di efficienza, produttività, qualità e sicurezza devono avvenire rapidamente.
Il concetto di Precision e Recall è fondamentale per valutare le performance dei modelli di intelligenza artificiale (AI) applicati alla radiologia, così come in altri campi della medicina. Questi due metriche sono spesso in relazione con il trade-off tra precisione e richiamo, e sono essenziali per comprendere come un sistema di AI possa influenzare le decisioni cliniche.
1. Definizioni di Precision e Recall
- Precision (Precisione): rappresenta la proporzione di risultati positivi corretti (vero positivo, TP) rispetto a tutti i risultati positivi previsti dal modello (vero positivo + falso positivo, TP + FP). In altre parole, misura quanto il modello sia accurato quando prevede una condizione positiva. Una precisione alta significa che la maggior parte dei risultati positivi forniti dal modello è corretta.
[{Precision} = \frac{TP}{TP + FP}] - Recall (Richiamo): rappresenta la proporzione di risultati positivi corretti rispetto a tutti i risultati positivi reali (vero positivo + falso negativo, TP + FN). In altre parole, misura la capacità del modello di identificare correttamente tutte le istanze positive. Un alto richiamo indica che il modello riesce a catturare la maggior parte dei casi positivi.
[{Recall} = \frac{TP}{TP + FN}]
2. Trade-off tra Precision e Recall
Il trade-off tra precisione e richiamo è una considerazione critica in applicazioni mediche, inclusa la radiologia. Aumentare uno tende a ridurre l’altro. Ad esempio:
- Modelli con alta precisione: Questi modelli forniscono pochi falsi positivi, il che significa che quando segnalano un caso come positivo, è probabile che lo sia realmente. Tuttavia, potrebbero perdere alcuni veri positivi, riducendo così il richiamo. Questo può essere vantaggioso in situazioni in cui un falso positivo potrebbe portare a procedure invasive o inutili.
- Modelli con alto richiamo: Questi modelli identificano la maggior parte dei veri positivi, ma possono anche generare un numero maggiore di falsi positivi. In radiologia, questo può significare che più casi vengono segnalati per ulteriori indagini, aumentando il carico di lavoro per i clinici e potenzialmente causando ansia ai pazienti.
3. Implicazioni Cliniche
Dal punto di vista del clinico, la scelta tra precisione e richiamo dipende dal contesto clinico specifico:
- Diagnosi precoce: In condizioni in cui la diagnosi precoce è critica (ad esempio, tumori), potrebbe essere più importante avere un alto richiamo per non perdere casi potenzialmente letali, anche a costo di avere un po’ più di falsi positivi.
- Procedure invasive: In altri casi, dove le conseguenze di un falso positivo sono significative (ad esempio, biopsie o interventi chirurgici), potrebbe essere preferibile un modello con alta precisione.
4. Conclusioni
L’ottimizzazione dei modelli di AI in radiologia richiede una comprensione approfondita di precisione e richiamo e del loro trade-off. I clinici devono considerare le implicazioni delle decisioni basate su questi modelli e scegliere metriche che meglio rispondano alle loro esigenze cliniche e agli obiettivi del trattamento. In questo modo, l’AI può diventare un potente alleato nel miglioramento della diagnosi e del trattamento dei pazienti, contribuendo a un’assistenza più sicura ed efficace.
Regolamentazione dei Dispositivi Medici Abilitati all’IA
La regolamentazione dei dispositivi medici abilitati all’IA è in continua evoluzione. I regolatori stanno cercando di bilanciare l’innovazione con la necessità di garantire la sicurezza e l’efficacia dei dispositivi. Le linee guida recenti richiedono che gli sviluppatori identifichino e mitigino i rischi associati ai dispositivi IA e che questi siano validati in contesti clinici realistici.
Con i recenti progressi dell’intelligenza artificiale (IA), i dispositivi medici con apprendimento automatico (ML) sono sempre più diffusi nell’assistenza sanitaria.
Questo studio analizza dispositivi medici IA/ML approvati dalla FDA negli Stati Uniti, aggiornati al 19 ottobre 2023. Abbiamo analizzato 691 dispositivi IA/ML approvati, esaminando percorsi di autorizzazione, tempi di approvazione, regolamentazione, specialità medica, decisioni, cronologia dei richiami, ecc.
Dal 2018, le approvazioni sono aumentate significativamente, con una predominanza della radiologia, grazie ai dati clinici abbondanti. Lo studio evidenzia l’uso del percorso di autorizzazione 510(k), che si basa sull’equivalenza sostanziale e spesso evita nuove sperimentazioni cliniche.
Si nota una sottorappresentazione dei dispositivi pediatrici, suggerendo opportunità di espansione. La limitazione geografica delle sperimentazioni, prevalentemente negli Stati Uniti, indica la necessità di sperimentazioni globali più inclusive.
Questa analisi mappa il panorama attuale dei dispositivi medici IA/ML, individuando tendenze, lacune e aree per future esplorazioni, pratiche cliniche e approcci normativi. In conclusione, la analisi illumina lo stato attuale dei dispositivi medici IA/ML approvati dalla FDA e le tendenze prevalenti, contribuendo a una comprensione più ampia.
Secondo l’ultimo aggiornamento del 19 ottobre 2023, la FDA ha elencato 691 dispositivi medici abilitati AI/ML approvati, di cui 108 (circa il 15%) sono stati approvati nell’anno 2023.
La tendenza nel numero di approvazioni all’anno ha iniziato a guadagnare attenzione significativa nel 2016 e da allora si è registrato un aumento del numero di dispositivi approvati ogni anno. Sulla base dei dati attuali, il numero più alto di approvazioni in un anno finora è stato di 139 dispositivi medici abilitati AI/ML approvati dalla FDA nel 2022. Il primo dispositivo medico abilitato AI/ML, PAPNET Testing System, ha ottenuto l’approvazione della FDA nel 1995 tramite Premarket Approval ed è correlato alla sottospecialità di patologia.
Figura 2. Rappresentazione grafica delle tendenze annuali nell’approvazione da parte della FDA di dispositivi medici abilitati all’intelligenza artificiale e all’apprendimento automatico, che evidenzia l’aumento dell’integrazione tecnologica nell’assistenza sanitaria.
La FDA ha approvato dispositivi medici AI/ML in varie sottospecialità mediche (Figura 3). La maggior parte, 531 dispositivi (77%), appartiene alla radiologia, che ha il volume più alto e la crescita più costante di invii di dispositivi AI/ML. La cardiologia segue con 70 dispositivi (10%), poi neurologia con 20 dispositivi e ematologia con 15 dispositivi (Figura 3 ,b). Altre sottospecialità includono gastroenterologia e urologia con 11 dispositivi, oftalmologia con 9 dispositivi, anestesiologia e chimica clinica con 6 dispositivi ciascuna, microbiologia e chirurgia generale e plastica con 5 dispositivi ciascuna, patologia con 4 dispositivi, ospedale generale con 3 dispositivi, ORL con 2 dispositivi e odontoiatria, immunologia, ostetricia e ginecologia e ortopedia con 1 dispositivo ciascuno. I dispositivi correlati all’ORL sono stati elencati solo nel 2022 e 2023 (Figura 4).
Figura 3.
a ) Grafico a barre che mostra il numero di dispositivi approvati, suddivisi in categorie per gruppi medici, sottolineando la diversificazione e l’espansione delle applicazioni AI/ML in diverse specialità mediche; (
b ) Grafico a ciambella che illustra la sostanziale predominanza della radiologia nel numero di approvazioni di dispositivi abilitati AI/ML rispetto ad altre specialità mediche, sottolineando la natura incentrata sull’innovazione del settore.