xAI ha presentato le ultime versioni dei suoi modelli Grok, Grok-2 e Grok-2 mini, mentre infuria la concorrenza tra le aziende di intelligenza artificiale.

“Siamo entusiasti di rilasciare un’anteprima anticipata di Grok-2, un significativo passo avanti rispetto al nostro precedente modello Grok-1.5, con funzionalità di frontiera in chat, codifica e ragionamento”,

“Allo stesso tempo, stiamo introducendo Grok-2 mini, un piccolo ma capace fratello di Grok-2. Una prima versione di Grok-2 è stata testata sulla classifica LMSYS con il nome ‘sus-column-r’. Al momento di questo post del blog, sta superando sia Claude 3.5 Sonnet che GPT-4-Turbo.”

ha affermato xAI in un post del blog .

Claude 3.5 Sonnet è uno dei modelli di Anthropic, mentre GPT-4 Turbo è stato creato da OpenAI.

Sia Grok-2 che Grok-2 mini sono disponibili in fase di beta testing sul social network X (in precedenza noto come Twitter), ha aggiunto xAI. I due modelli saranno disponibili anche tramite l’API aziendale più avanti nel mese.

LmSYS, ha confermato le affermazioni di xAI. Un aggiornamento della classifica pone Grok-2 davanti a Claude 3.5 Sonnet e subito dietro al più recente GPT-4o di OpenAI e a Gemini 1.5 Pro di Google.

Grok 2 vs altri LLM. Immagine: xAI
Immagine: xAI

Grok 2 si collega a Black Forest Labs tramite API per generare immagini e modificarle per adattarle alle sue capacità.

Disponibile agli utenti 𝕏 Premium e Premium+ .

Grok-2 Permette interazioni in linguaggio naturale, così gli utenti possono usare Grok e Flux.1 come farebbero con ChatGPT e Dall-e 3. Le generazioni di Grok sembrano meno censurate rispetto a quelle di Fal.AI, quindi x.AI potrebbe aver modificato il prompt di sistema per rendere Grok più permissivo o restrittivo secondo le politiche di X.

Grok-2 mini è il modello piccolo ma capace che offre un equilibrio tra velocità e qualità delle risposte. Rispetto al suo predecessore, Grok-2 è più intuitivo, orientabile e versatile in un’ampia gamma di attività, che tu stia cercando risposte, collaborando alla scrittura o risolvendo attività di codifica.

Generazione di Immagini.

Nei nostri test preliminari, Grok 2 Mini ha superato i concorrenti nella generazione di testo, emergendo come il vincitore assoluto.

È il miglior modello per il realismo se richiesto con parole chiave specifiche, poiché la posizione delle parole è fondamentale. Per chi cerca realismo senza prompt specifici, MidJourney o Flux locale sono buone alternative.

Grok 2 Mini ha difficoltà con composizioni complesse o immagini artistiche con elementi creativi specifici, un limite per utenti specializzati. Leonardo eccelle nello stile artistico e Ideaogram nella consapevolezza spaziale.

Stable Diffusion è ideale per generazioni senza censure, mentre Flux è perfetto come generatore di immagini open source locale con capacità di testo, realismo e comprensione naturale immediata.

Per i principianti, usare Flux tramite l’interfaccia di Grok 2 è utile per le interazioni in linguaggio naturale, cosa non possibile con versioni locali o provider come Fal.AI o Replicate.

La scelta del miglior modello dipende dai requisiti specifici del compito, con Grok 2 Mini preferito per realismo specifico, scenari ricchi di testo e generazioni sensibili. Per altre esigenze, ci sono modelli migliori.

Notizie della Settimana.

All’inizio della settimana, OpenAI supportata da Microsoft ha lanciato una nuova versione del modello GPT-4, con pochi dettagli forniti. Diversi investitori hanno finanziato xAI, raggiungendo una valutazione di 24 miliardi di $ a maggio dopo aver raccolto 6 miliardi di $ in un nuovo round di finanziamenti.

Tra gli investitori ci sono Valor Equity Partners, Vy Capital, Andreessen Horowitz, Sequoia Capital, Fidelity Management & Research Company, Prince Alwaleed Bin Talal e Kingdom Holding. Ark Investment Management, guidata da Cathie Wood, possiede una quota di xAI.

Il mese scorso, Elon Musk ha annunciato che avrebbe proposto al consiglio di Tesla un investimento di 5 miliardi di $ in xAI, dopo che l’idea aveva ricevuto quasi due terzi dei voti favorevoli in un sondaggio online.