Cohere ha presentato il suo modello di ricerca AI multimodale di punta, Embed 3, che promette di sbloccare un reale valore commerciale per i dati visivi. Questo nuovo modello non solo genera embedding da testi, ma è anche in grado di elaborare immagini, rendendolo uno strumento fondamentale per le imprese moderne.
Con l’avvento di Embed 3, le aziende possono ora sfruttare efficacemente i vasti archivi di dati contenuti nelle immagini. Questo modello consente la creazione di sistemi che cercano e recuperano rapidamente risorse multimodali importanti, come rapporti complessi, cataloghi di prodotti e file di design. L’obiettivo è migliorare la produttività della forza lavoro attraverso un accesso più facile e veloce alle informazioni necessarie.
Embed 3 si distingue come il modello di embedding multimodale più capace sul mercato, posizionandosi come un elemento essenziale nel toolkit AI delle aziende moderne. Willson Cross, CEO di Borderless AI, ha dichiarato: “Embed 3 è una parte fondamentale del nostro stack di ricerca e recupero, assicurandoci di trovare informazioni rilevanti e fornire risposte accurate nella nostra applicazione HR per gli utenti finali.”
Il funzionamento di Embed 3 si basa sulla traduzione dei dati in lunghe stringhe numeriche che rappresentano il significato intrinseco delle informazioni. Queste rappresentazioni numeriche vengono quindi confrontate tra loro per determinare somiglianze e differenze. Un aspetto innovativo è che Embed 3 colloca sia gli embedding testuali che quelli visivi nello stesso spazio vettoriale, offrendo un’esperienza integrata.
Questa comparazione consente alle applicazioni di recuperare dati aziendali pertinenti a una query dell’utente finale. Oltre a essere un componente fondamentale dei sistemi di ricerca semantica, Embed 3 è utile nei sistemi di generazione aumentata da recupero (RAG), garantendo che modelli generativi come la serie Command R abbiano un contesto aziendale rilevante per informare le loro risposte.
Le aziende possono trarre vantaggio da diverse applicazioni pratiche grazie a Embed 3:
- Grafici e Diagrammi: Gli utenti possono trovare facilmente diagrammi specifici per informare le loro decisioni aziendali semplicemente descrivendo un insight desiderato.
- Cataloghi Prodotti E-commerce: Embed 3 trasforma l’esperienza di ricerca dei prodotti consentendo ai rivenditori di cercare immagini dei prodotti oltre alle descrizioni testuali.
- File e Modelli di Design: I designer possono localizzare rapidamente mockup UI specifici e template visivi basati su descrizioni testuali, semplificando il processo creativo.
In un contesto in cui le aziende sono sempre più chiamate a utilizzare i propri dati per guidare risultati concreti, Embed 3 offre un vantaggio competitivo che accelera la produttività e migliora l’esperienza del cliente.
Embed 3 si posiziona come il modello di embedding multimodale più performante disponibile, con una precisione all’avanguardia in vari compiti di recupero per aziende e sviluppatori. La valutazione dell’accuratezza avviene tramite metriche come Recall@10 per benchmark testo-immagine e NDCG@10 per benchmark testo-testo.
Un aspetto distintivo del modello è la condivisione di uno spazio latente unificato tra i codificatori testuali e visivi. Questo approccio consente agli utenti di includere sia dati testuali che visivi all’interno di un unico database, riducendo notevolmente la complessità rispetto alla gestione di due database separati.
Inoltre, Embed 3 mantiene prestazioni elevate anche su dati reali rumorosi e offre eccellenti capacità multilingue in oltre 100 lingue.
Il nuovo modello Embed 3 con capacità di ricerca delle immagini è già disponibile sulla piattaforma Cohere e su Microsoft Azure AI Studio. Le aziende interessate possono partecipare a un webinar il 12 novembre per scoprire ulteriormente le potenzialità del modello.
Asha Sharma, CVP della piattaforma Azure AI, ha affermato: “Siamo entusiasti di espandere la nostra partnership con Cohere portando il loro ultimo modello multimodale su Azure AI. Questo passo dimostra il nostro impegno a offrire una vasta gamma di strumenti AI alle aziende.”
Embed 3 rappresenta una svolta significativa nella ricerca AI multimodale, fornendo alle imprese gli strumenti necessari per ottimizzare l’uso dei propri dati visivi e testuali. Con questa innovazione, Cohere si posiziona come leader nel settore della tecnologia AI, pronta a soddisfare le esigenze delle aziende moderne.