La pareidolia è un fenomeno psicologico curioso, che porta gli esseri umani a percepire volti e pattern in oggetti inanimati, come la famosa “Madonna” apparsa in un panino alla griglia nel 1994, venduto successivamente per 28.000 dollari. Ma quanto sappiamo veramente di questo fenomeno? E, soprattutto, può essere replicato nelle macchine?

Un nuovo studio del MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) esplora la questione in modo innovativo, introducendo un dataset di immagini etichettate manualmente da esseri umani, che comprende oltre 5.000 esempi di volti pareidolici. Questo studio offre nuove prospettive sulla percezione umana e algoritmica, rivelando differenze interessanti e potenziali legami evolutivi tra la capacità di riconoscere volti animali e il fenomeno della pareidolia.

La Sfida di Riconoscere Volti Falsi

Uno degli aspetti più intriganti di questa ricerca è stato osservare come i modelli di intelligenza artificiale (IA) riconoscono i volti illusori. A differenza degli esseri umani, le IA non sembrano rilevare volti pareidolici con la stessa immediatezza e precisione. Tuttavia, il team ha scoperto che, una volta addestrati a riconoscere volti di animali, gli algoritmi migliorano significativamente nel rilevare volti pareidolici. Questo suggerisce un possibile legame evolutivo tra la capacità di identificare animali pericolosi o da cacciare, e la tendenza umana a vedere volti in oggetti inanimati.

Mark Hamilton, studente di dottorato in ingegneria elettrica e informatica al MIT e affiliato del CSAIL, spiega: “Questo risultato suggerisce che la pareidolia potrebbe non derivare esclusivamente dai comportamenti sociali umani, ma piuttosto da una necessità evolutiva più profonda, come individuare rapidamente un predatore nascosto o capire dove guarda una preda.”

La “Zona Goldilocks” della Pareidolia

Un altro risultato rilevante della ricerca è stato l’identificazione di una “Zona Goldilocks della Pareidolia”, un intervallo di complessità visiva in cui è più probabile che si verifichi il fenomeno della pareidolia. Immagini troppo semplici non contengono abbastanza dettagli per formare un volto, mentre immagini troppo complesse generano “rumore” visivo che ostacola il riconoscimento.

I ricercatori hanno sviluppato un’equazione che modella come sia gli esseri umani che le macchine percepiscono volti illusori. Analizzando questa formula, hanno individuato un “picco pareidolico” che corrisponde a immagini con una complessità visiva ottimale per evocare la percezione di volti. Questo picco è stato convalidato attraverso test sia su soggetti umani che su sistemi di rilevamento facciale basati su IA.

Un Dataset Monumentale

Il dataset “Faces in Things” rappresenta un balzo in avanti rispetto ai precedenti studi sulla pareidolia, che tipicamente si basavano su collezioni di 20-30 immagini. Il nuovo dataset, composto da oltre 5.000 immagini accuratamente etichettate da annotatori umani, permette una comprensione molto più profonda di come sia gli esseri umani che le macchine riconoscono volti illusori.

Per creare questo dataset, il team ha curato circa 20.000 immagini candidate provenienti dal dataset LAION-5B, che sono poi state etichettate con grande attenzione. Gli annotatori hanno delimitato i volti percepiti e hanno risposto a domande dettagliate su ciascun volto, come l’emozione percepita, l’età e se il volto fosse accidentale o intenzionale.

Hamilton racconta che una gran parte del successo di questa raccolta è dovuto a sua madre, una banchiera in pensione, che ha dedicato ore a etichettare le immagini per l’analisi.

Differenze tra Percezione Umana e Algoritmica

Nonostante i progressi, gli algoritmi di intelligenza artificiale non percepiscono i volti pareidolici nello stesso modo degli esseri umani. Mentre noi possiamo vedere volti in prese elettriche, nuvole o fette di pane tostato con naturalezza, le macchine richiedono un addestramento specifico per identificare tali pattern.

Hamilton osserva: “Gli esseri umani interpretano istintivamente oggetti inanimati attribuendo loro tratti umani. Ad esempio, guardando una presa elettrica, potremmo immaginarla mentre canta, e possiamo persino immaginare come si muoverebbero le sue labbra. Gli algoritmi, però, non riconoscono questi volti stilizzati come noi.”

Potenziali Applicazioni Future

La creazione di questo dataset potrebbe portare a miglioramenti significativi nei sistemi di rilevamento facciale, riducendo i falsi positivi, una caratteristica importante per campi come la guida autonoma, l’interazione uomo-computer e la robotica. Inoltre, potrebbe influenzare settori come il design di prodotti, dove la comprensione della pareidolia potrebbe aiutare a creare oggetti dall’aspetto più amichevole o, al contrario, evitare che un prodotto come un dispositivo medico sembri minaccioso.

Hamilton suggerisce anche applicazioni in cui i modelli potrebbero essere utilizzati per migliorare il design di giocattoli o automobili, rendendoli più attraenti per gli utenti attraverso modifiche mirate che evocano reazioni positive.

Prospettive Future

Con la condivisione del dataset “Faces in Things” con la comunità scientifica, i ricercatori prevedono già ulteriori sviluppi. Uno dei possibili obiettivi futuri potrebbe essere addestrare modelli IA di visione-linguaggio a comprendere e descrivere i volti pareidolici, portando così i sistemi a interagire con stimoli visivi in modo più simile a quello umano.

Come afferma Pietro Perona, professore di ingegneria elettrica al Caltech, “È affascinante come gli autori abbiano proposto una domanda così intrigante: perché vediamo volti nelle cose? Pensare a questa domanda potrebbe insegnarci qualcosa di importante su come il nostro sistema visivo generalizza oltre l’addestramento che riceve nel corso della vita.”

Il lavoro del team, supportato dalla National Science Foundation e da altri enti, come la United States Air Force Artificial Intelligence Accelerator, non solo amplia la nostra comprensione del fenomeno della pareidolia, ma potrebbe anche offrire nuove chiavi di lettura per lo sviluppo di IA sempre più avanzate e vicine al comportamento umano.