Midjourney ha rilasciato la versione V6 anche se non si tratta di un rilascio definitivo ma di una versione alpha messa a disposizione della community affinché gli utenti possano testarla.
Diversi i miglioramenti introdotti dal nuovo modello che ora è in grado di seguire i prompt in modo molto più preciso, inclusi prompt più lunghi, la possibilità di specificare colori e altri dettagli in un’immagine, la composizione controllata utilizzando il linguaggio naturale, l’aggiunta di testo, una migliore comprensione delle sfumature grammaticali e la possibilità di aggiungere cornici e bordi alle immagini tramite testo descrittivo. Anche gli upscaler sono stati migliorati, per un incremento di 2 volte della risoluzione.
Midjourney V6 però è molto diverso da quello della versione V5 e sarà quindi necessario imparare di nuovo il modo in cui comporre i prompt di richiesta.
In ogni caso, la versione V6, il terzo modello di Midjourney addestrato da zero sui supercluster AI del research lab in lavorazione da 9 mesi, è in grado di generare immagini molto più realistiche della versione più recente, v5.2
Il sito di fotografia PetaPixel ha provato a mettere a confronto i risultati delle due versioni.
1° Prompt: “Albert Einstein che fa un esperimento scientifico”
2° Prompt: “Un ritratto di Marie Curie nel suo laboratorio”
I risultati della v6 sono spettacolari, con un’enorme quantità di dettagli in ogni immagine e una luce eccellente. Pur riconoscendo che i risultati della versione 5.2 non sono negativi, è indubbio che la complessità delle scene nella v6 è davvero impressionante.
La community sta ovviamente testando le nuove funzionalità, sopratutto per quel che riguarda l’inserimento di testo all’interno delle immagini, una funzionalità generalmente ritenuta più debole sulla versione precedente.