Midjourney ha lanciato un importante aggiornamento per il suo editor di immagini, migliorando notevolmente l’interfaccia web rispetto all’editor tradizionale su Discord. Questa evoluzione non solo rende la piattaforma più intuitiva, ma indica anche una mossa strategica verso la creazione di un’interfaccia indipendente per la generazione di immagini, in linea con concorrenti come Leonardo e Ideogram.
Tag: midjourney
Stability AI ha annunciato il lancio di Stable Diffusion 3, l’ultima versione del suo modello AI per la generazione di immagini.
Stability AI ha affermato che il nuovo modello, che non è ancora ampiamente disponibile, migliora la qualità dell’immagine, funziona meglio con istruzioni contenenti più argomenti e può inserire testo più accurato come parte dell’immagine generata. L’aspetto tipografico è sempre stato il tallone d’achille non solo dei precedenti modelli di Stable Diffusion ma anche dei rivali come DALL-E 3 e Midjourney che hanno lavorato proprio su questo aspetto nelle loro versioni più recenti.
L’annuncio arriva pochi giorni dopo che il più grande rivale di Stability AI, OpenAI, ha presentato Sora , un nuovissimo modello di intelligenza artificiale in grado di generare video quasi realistici e ad alta definizione da semplici istruzioni di testo.
Non è chiaro quando Stable Diffusion 3 verrà rilasciato al pubblico, ma fino ad allora chiunque sia interessato può iscriversi a una lista d’attesa
Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale, i consigli sui tool da provare, i prompt e i corsi di formazione. Iscriviti alla newsletter settimanale e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta!
L’evoluzione dell’Intelligenza Artificiale (AI) ha aperto nuovi orizzonti creativi, influenzando profondamente il modo in cui concepiamo e produciamo immagini. In questo contesto, esploreremo una serie di tool di Intelligenza Artificiale all’avanguardia, focalizzandoci sulla loro capacità di trasformare testo in immagini sorprendenti e ridefinire i limiti dell’espressione visiva.
Partendo da uno stesso identico prompt vedremo come i vari algoritmi di Intelligenza Artificiale interpretano lo sviluppo di immagini.
Prompt
1) Midjourney
2) Dall-E
3) Adobe Firefly
4) LensGo
5) Merlin
6) Dream AI
7) Stable Diffusion
8) ArtFlow.AI
9) Leonardo
10) Freepik
A voi quale piace di più?
L’avvento dell’Intelligenza Artificiale generativa ha rivoluzionato il modo in cui concepiamo e creiamo immagini. Attraverso modelli avanzati, come DALL-E, Midjourney e Adobe Firefly, l’AI sta dando vita a nuove possibilità nell’ambito della produzione visiva.
Midjourney: un viaggio nel mondo dell’Intelligenza Artificiale generativa per la creazione di immagini
Midjourney, uno dei pionieri nell’ambito della creazione di immagini da testo, ha dimostrato progressi costanti nelle versioni successive. Tuttavia, l’accesso gratuito a questa potente risorsa è stato recentemente interrotto dagli sviluppatori, suscitando domande sulla disponibilità di alternative altrettanto valide. Fortunatamente, il panorama offre numerose alternative competitive, superando non solo in capacità di creazione, ma anche in personalizzazione e accessibilità dell’interfaccia.
DALL-E: un passo avanti nell’universo dell’immagine
DALL-E, sviluppato da OpenAI (la stessa azienda dietro ChatGPT), emerge come una delle alternative più interessanti a Midjourney. Questo generatore di immagini si distingue per la sua abilità nella creazione di immagini fotorealistiche, benché richieda una maggiore precisione nell’inserimento del testo di partenza, rispetto al suo predecessore.
Il punto forte di DALL-E è la sua capacità di mescolare concetti, qualità e stili, consentendo la creazione di immagini uniche. Dagli ampliamenti delle immagini alla manipolazione dei colori e degli stili degli elementi, questo strumento offre un’ampia gamma di possibilità, sebbene richieda un impegno più approfondito.
Adobe Firefly: l’ambiziosa incursione di Adobe nel mondo dell’Intelligenza Artificiale
Adobe Firefly rappresenta l’audace ingresso di Adobe nel dominio della generazione di contenuti attraverso modelli IA, integrato persino in Google Bard per la creazione di immagini. Questo progetto ambizioso offre un set di funzioni impressionanti, tra cui la creazione d’immagini da testo, l’upscale delle immagini, la ricolorazione vettoriale, effetti di testo, l’inpainting, lo sketch-to-image, e altro ancora.
Attualmente in fase beta, alcune funzioni di Adobe Firefly sono ancora in sviluppo. Per utilizzarlo, basta accedere al sito di Adobe Firefly con il proprio account Adobe, seguire il tutorial e approvare i termini di utilizzo. Inserendo un prompt di testo in inglese, si possono generare immagini in diverse varianti, selezionando il tipo di contenuto desiderato: arte, grafica, foto.
L’intelligenza generativa sta apportando cambiamenti rivoluzionari nel modo in cui concepiamo e creiamo immagini, e con opzioni come DALL-E, Midjourney e Adobe Firefly, si prospetta un futuro affascinante nell’evoluzione dell’arte visiva.
Secondo un’analisi condotta da un’esperto di intelligenza artificiale, Chase Lean, messe a confronto le tre applicazioni, Firefly 2 genera foto più realistiche rispetto a Midjourney e DALL-E. Eccelle anche nelle riprese di prodotti, nel design di interni, nella generazione di testi e nelle foto di animali selvatici, mentre Midjourney ha prodotto foto di paesaggi di qualità superiore con un’illuminazione più suggestiva.
Vediamo le sue simulazioni.
Midjourney ha rilasciato la versione V6 anche se non si tratta di un rilascio definitivo ma di una versione alpha messa a disposizione della community affinché gli utenti possano testarla.
Diversi i miglioramenti introdotti dal nuovo modello che ora è in grado di seguire i prompt in modo molto più preciso, inclusi prompt più lunghi, la possibilità di specificare colori e altri dettagli in un’immagine, la composizione controllata utilizzando il linguaggio naturale, l’aggiunta di testo, una migliore comprensione delle sfumature grammaticali e la possibilità di aggiungere cornici e bordi alle immagini tramite testo descrittivo. Anche gli upscaler sono stati migliorati, per un incremento di 2 volte della risoluzione.
Midjourney V6 però è molto diverso da quello della versione V5 e sarà quindi necessario imparare di nuovo il modo in cui comporre i prompt di richiesta.
In ogni caso, la versione V6, il terzo modello di Midjourney addestrato da zero sui supercluster AI del research lab in lavorazione da 9 mesi, è in grado di generare immagini molto più realistiche della versione più recente, v5.2
Il sito di fotografia PetaPixel ha provato a mettere a confronto i risultati delle due versioni.
1° Prompt: “Albert Einstein che fa un esperimento scientifico”
2° Prompt: “Un ritratto di Marie Curie nel suo laboratorio”
I risultati della v6 sono spettacolari, con un’enorme quantità di dettagli in ogni immagine e una luce eccellente. Pur riconoscendo che i risultati della versione 5.2 non sono negativi, è indubbio che la complessità delle scene nella v6 è davvero impressionante.
La community sta ovviamente testando le nuove funzionalità, sopratutto per quel che riguarda l’inserimento di testo all’interno delle immagini, una funzionalità generalmente ritenuta più debole sulla versione precedente.