Mentre il mondo tech è distratto dai duelli OpenAI-Google, Amazon alza il dito quello con l’anello di Jeff Bezos, probabilmente e dice: “ci siamo anche noi”. Questa settimana ha messo in vetrina un paio di nuove chicche AI: un modello vocale conversazionale chiamato Nova Sonic e una versione aggiornata del suo generatore video, Nova Reel 1.1. Due nomi che sembrano usciti da un catalogo di oggetti per viaggi interstellari, ma che hanno dietro un chiaro messaggio: Amazon non vuole più giocare in difesa.

Nova Sonic è la risposta, in salsa Bezos, a tutto ciò che Gemini Live di Google e Advanced Voice Mode di OpenAI stanno cercando di essere. Ma invece di impacchettare modelli diversi — uno per il riconoscimento vocale, uno per il text-to-speech, un altro per generare la risposta — Amazon ha creato un “modello unificato”. In pratica: tutto in uno, zero rotture di flusso, meno latenza, meno incoerenze. Il risultato, secondo Amazon, è una voce artificiale che non solo parla in tempo reale, ma è anche in grado di captare il tono dell’interlocutore e rispondere con una “naturalezza” che — dicono loro — supera i concorrenti.

Il tutto è già in test su Amazon Bedrock, la piattaforma pensata per sviluppatori e aziende che vogliono usare modelli AI senza perdersi tra librerie, API e rosari di prompt. Nova Sonic è pensato per essere infilato ovunque: dai classici bot da call center (quelli che ti fanno rimpiangere l’essere umano più incompetente del mondo) fino ad agenti intelligenti per turismo, sanità ed educazione. E se Alexa ti sembra recentemente meno idiota del solito, è perché già si sta drogando di pezzi di Nova Sonic. Rohit Prasad — SVP e capo scienziato AGI di Amazon — lo ha confermato a TechCrunch con l’entusiasmo di chi ha appena visto un KPI salire a doppia cifra.

Non contenti di dar voce all’intelligenza artificiale, adesso le vogliono anche far girare film. E qui entra in scena Nova Reel 1.1. L’upgrade promette miglioramenti in qualità e latenza rispetto alla versione precedente (che, spoiler, non era memorabile). Ma la novità interessante è che ora riesce a mantenere una coerenza di stile anche quando si mettono insieme più scene da 6 secondi, fino a creare un video di 2 minuti. Sì, hai letto bene: Amazon ti promette la continuità estetica in una clip di due minuti, che nel mondo AI generativa è quasi come dire “abbiamo insegnato a un piccione a fare il montaggio”.

Sotto il cofano c’è una logica molto chiara: Amazon non vuole più essere “quello bravo a spedire pacchi”. Vuole essere il fornitore di infrastruttura AI per ogni impresa che sogna automazione, customer experience intelligente e contenuti generativi pronti da impacchettare in funnel pubblicitari o chatbot che sembrano meno autistici. La corsa è appena iniziata, ma Bezos e soci hanno l’infrastruttura, i soldi e — adesso — pure la voce.

Se la tua azienda ha un minimo di ambizione AI, il messaggio è chiaro: o sali a bordo di piattaforme come Bedrock, o finisci a chiacchierare con l’ennesimo bot da landing page, quello che ti chiede “come posso aiutarti?” e poi va in crisi se rispondi “con ironia, grazie”.