La società cinese DeepSeek, già al centro dell’attenzione per il rilascio del modello open-source R1, ha lanciato un secondo modello multimodale open-source, Janus Pro-7B, che promette di ridefinire gli standard nell’intelligenza artificiale. Il modello è stato reso disponibile su Hugging Face, una piattaforma leader per l’IA, con l’obiettivo dichiarato di offrire comprensione e generazione unificata. Secondo DeepSeek, il Janus Pro-7B supera i precedenti modelli multimodali unificati e compete, se non addirittura eccelle, rispetto alle prestazioni dei modelli specifici per singoli compiti. Questo lo rende un forte candidato per le applicazioni di prossima generazione nel campo multimodale.


Richard Lawler

DeepSeek says its newest AI model, Janus-Pro can outperform Stable Diffusion and DALL-E 3.

Already riding a wave of hype over its R1 “reasoning” AI that is atop the app store charts and shifting the stock market, Chinese startup DeepSeek has released another new open-source AI model: Janus-Pro.

Può analizzare o produrre solo immagini piccole a una risoluzione di 384×384, ma l’azienda afferma che la versione più grande, Janus-Pro-7b, ha superato modelli comparabili in due test di riferimento per l’IA.

Two graphs showing Janus-Pro performance compared to similar AI models like SDXL and DALL-E 3.

Image: DeepSeek

Il Janus Pro-7B si pone come rivale diretto del modello Dall-E 3 di OpenAI, rilasciato nell’agosto 2023, soprattutto nell’ambito delle capacità multimodali. Non solo può comprendere il linguaggio naturale e le immagini, ma anche generare contenuti con un livello di precisione che sembra allinearsi ai migliori strumenti presenti sul mercato. OpenAI, sostenuta da ingenti investimenti di Microsoft, ha stabilito un solido punto di riferimento nell’IA generativa, ma DeepSeek mira chiaramente a competere su scala globale.

Tuttavia, il lancio del Janus Pro-7B arriva in un momento di volatilità per i mercati tecnologici. L’innovazione rappresentata dal modello R1 ha sollevato preoccupazioni sui costi e sulle implicazioni a lungo termine di modelli IA open-source avanzati. Tali preoccupazioni hanno portato a una significativa correzione in borsa, con una perdita del 15% della valutazione di Nvidia , seguita da un sell-off in altre azioni legate all’intelligenza artificiale, tra cui quelle di Microsoft. Questo sottolinea quanto i mercati siano sensibili alle dinamiche competitive in questo settore emergente.

Non è un caso che DeepSeek abbia rapidamente limitato la registrazione al proprio ecosistema di IA agli utenti con numeri di telefono cinesi. Questo suggerisce una strategia di contenimento del rischio legata al crescente interesse per il loro modello, probabilmente mirata a garantire un controllo più stretto sull’accesso e sull’utilizzo iniziale del sistema. Inoltre, il rapido successo dell’assistente IA basato su R1, che ora domina l’App Store, indica che DeepSeek sta già capitalizzando sulla propria tecnologia per raggiungere una vasta utenza consumer.

Mentre il confronto con OpenAI e Dall-E 3 continua, il Janus Pro-7B rappresenta un ulteriore passo verso la democratizzazione dell’intelligenza artificiale. Tuttavia, questo scenario evidenzia una realtà sempre più competitiva, dove le implicazioni economiche e regolatorie possono influenzare rapidamente sia l’innovazione tecnologica che la fiducia degli investitori. Per gli osservatori, sarà cruciale monitorare come DeepSeek e altre aziende gestiranno il delicato equilibrio tra progresso tecnologico e sostenibilità economica.


Newsletter – Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale: iscriviti alla nostra newsletter gratuita e accedi ai contenuti esclusivi di Rivista.AI direttamente nella tua casella di posta!