OpenAI ha finalmente lanciato la Modalità Voce Avanzata con Visione per ChatGPT, presentata sette mesi fa. Questa nuova funzionalità permette agli utenti di ChatGPT Plus, Team e Pro di interagire in tempo reale attraverso il riconoscimento visivo utilizzando l’app ChatGPT. Basta puntare la fotocamera del telefono su un oggetto per ricevere risposte immediate e contestuali.

La funzione consente anche di comprendere ciò che appare sullo schermo del dispositivo tramite la condivisione dello schermo. ChatGPT può spiegare menu di impostazioni complicati o offrire soluzioni per problemi di matematica, trasformando lo smartphone in un vero assistente visivo interattivo.

Per attivare la modalità, tocca l’icona del microfono accanto alla barra di chat, quindi seleziona l’icona del video in basso a sinistra. Per condividere lo schermo, accedi al menu a tre punti e scegli “Condividi Schermo”.

Non tutti avranno accesso immediato. Gli abbonati ChatGPT Enterprise e Edu dovranno aspettare gennaio, mentre l’Europa, inclusi Svizzera, Islanda, Norvegia e Liechtenstein, non ha ancora una data di rilascio ufficiale.

Durante una dimostrazione su “60 Minutes” della CNN, Greg Brockman, presidente di OpenAI, ha messo alla prova la funzione in un quiz di anatomia con Anderson Cooper. Mentre Cooper disegnava parti del corpo su una lavagna, ChatGPT analizzava e commentava le illustrazioni con precisione, anche se con qualche suggerimento artistico sui contorni del cervello.

Nonostante il successo della dimostrazione, la Modalità Voce Avanzata ha mostrato il suo lato umano: durante un problema di geometria ha commesso un errore, evidenziando che l’intelligenza artificiale può ancora essere soggetta a “allucinazioni” cognitive.

Dopo diversi rinvii a causa di problemi tecnici, OpenAI sembra finalmente pronta a rivoluzionare il modo in cui gli utenti interagiscono con le macchine. Nel frattempo, concorrenti come Google e Meta non stanno a guardare: Google ha appena reso disponibile Project Astra, la sua IA conversazionale con visione, a un gruppo selezionato di tester su Android.

Infine, per celebrare le festività natalizie, OpenAI ha introdotto la “Modalità Babbo Natale”, che aggiunge una voce personalizzata di Santa Claus nell’app ChatGPT. Gli utenti possono attivarla toccando l’icona a forma di fiocco di neve accanto alla barra di testo.

Con queste innovazioni, l’IA sta superando il confine tra immaginazione e realtà, trasformando ogni dispositivo in un assistente cognitivo personale.


Newsletter – Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale: iscriviti alla newsletter di Rivista.AI e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta!