Tag: immagini

Getty Images contro l’AI generativa: quando la battaglia per il copyright diventa una serie legale a puntate

il 31 Maggio 2025

Nel grande teatro della proprietà intellettuale, Getty Images recita il ruolo dell’eroe stanco ma determinato, intento a difendere la sua galleria di milioni di immagini da un nemico nuovo, veloce e sfuggente: l’intelligenza artificiale generativa.

Migliori strumenti AI per Generazione Immagini nel 2025

Di Redazione

il 1 Marzo 2025

in AI Database, Arti Creative

In questa directory abbiamo voluto raccogliere i migliori strumenti di Intelligenza Artificiale disponibili al momento per generare immagini nel 2025! Questa pagina contiene un elenco di tool AI per creare contenuti visivi unici, migliorare la qualità e automatizzare flussi di lavoro, ideali per artisti, designer, appassionati e semplici curiosi.

AI Modelli per Immagini Video Vasa-1 di Microsoft: video facciale iperrealistico e sincronizzazione labiale da una singola immagine

Di Dina

il 18 Aprile 2024

in AI

Microsoft ha recentemente introdotto VASA-1, un modello di intelligenza artificiale che produce video realistici di volti parlanti da una singola immagine statica e una clip audio.

Il modello è in grado di produrre video con una risoluzione di 512×512 pixel e una frequenza di 40 fotogrammi al secondo (FPS), con una latenza di soli 170 millisecondi sui sistemi GPU NVIDIA RTX 4090.

L’architettura del modello si basa su un approccio di diffusione.

A differenza dei metodi tradizionali che trattano le caratteristiche facciali separatamente, VASA-1 utilizza un modello basato sulla diffusione per generare dinamiche facciali e movimenti della testa in modo olistico. Questo metodo considera tutte le dinamiche facciali, come il movimento delle labbra, l’espressione e i movimenti degli occhi, come parti di un unico modello completo.

VASA-1 opera all’interno di uno spazio latente del viso districato ed espressivo, che gli permette di controllare e modificare le dinamiche facciali e i movimenti della testa indipendentemente da altri attributi facciali come l’identità o l’aspetto statico.

Il modello è stato addestrato su un set di dati ampio e diversificato, che gli consente di gestire un’ampia gamma di identità facciali, espressioni e modelli di movimento. Questo approccio di addestramento aiuta il modello a funzionare bene anche con dati di input che si discostano da ciò su cui è stato addestrato, come input audio non standard o immagini artistiche.

L’addestramento del modello prevede tecniche avanzate di districamento, che consentono la manipolazione separata delle caratteristiche facciali dinamiche e statiche. Ciò si ottiene attraverso l’uso di codificatori distinti per diversi attributi e una serie di funzioni di perdita attentamente progettate per garantire un’efficace separazione di queste caratteristiche.

VASA-1 è stato rigorosamente testato rispetto a vari benchmark e ha dimostrato di superare significativamente i metodi esistenti in termini di realismo, sincronizzazione degli elementi audiovisivi ed espressività delle animazioni generate.

Nonostante i risultati promettenti, la ricerca riconosce alcuni limiti del modello, come l’incapacità di elaborare le dinamiche di tutto il corpo o di catturare completamente elementi non rigidi come i capelli. Tuttavia, sono previsti lavori futuri per espandere le capacità del modello e affrontare queste aree.

L’Intelligenza Artificiale (AI) per immagini e video ha rivoluzionato molti settori, tra cui il riconoscimento di oggetti, l’analisi delle immagini mediche, la sorveglianza di sicurezza, la creazione di contenuti multimediali e molto altro. Ecco alcuni esempi di come l’AI viene utilizzata per immagini e video:

Altri esempi di Modelli in allegato

Modelli-AI-RIVISTA-AI-1 Download

Newsletter AI – non perderti le ultime novità sul mondo dell’Intelligenza Artificiale, i consigli sui tool da provare, i prompt e i corsi di formazione. Iscriviti alla newsletter settimanale e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta!

[newsletter_form type=”minimal”]

Sora vs DALL-E: generatore di video e di immagini a confronto

Di Redazione

il 20 Febbraio 2024

in AI

Uno degli argomenti mainstream in queste ore è indubbiamente il nuovo modello di AI generativa Sora, appena lanciato da OpenAI. Siccome il suo funzionamento è molto simile allo strumento AI di generazione di immagini DALL-E sempre realizzato da OpenAI, qualcuno ha voluto mettere a confronto i due sistemi per vedere che tipo di output restituissero.

La sfida è semplice: lo stesso prompt di testo utilizzato per creare uno dei video ad alta definizione prodotti da Sora in questa fase di test viene utilizzato per capire quale risultato mostrerà DALL-E.

Di seguito alcune simulazioni:

2. Prompt: An extreme close-up of an gray-haired man with a beard in his 60s, he is deep in thought pondering the history of the universe as he sits at a cafe in Paris, his eyes focus on people offscreen as they walk as he sits mostly motionless, he is dressed in a wool coat suit… pic.twitter.com/HzCqiLZH8g
— Alvaro Cintas (@dr_cintas) February 18, 2024

4. Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/TmqZ8Z2PYJ
— Alvaro Cintas (@dr_cintas) February 18, 2024

6. Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance,… pic.twitter.com/FN8cYmOeW2
— Alvaro Cintas (@dr_cintas) February 18, 2024

8. Prompt: A giant duck walks through the streets in Boston pic.twitter.com/qBdrKB21LH
— Alvaro Cintas (@dr_cintas) February 18, 2024

10. Prompt: A grandmother with neatly combed grey hair stands behind a colorful birthday cake with numerous candles at a wood dining room table, expression is one of pure joy and happiness, with a happy glow in her eye. She leans forward and blows out the candles with a gentle… pic.twitter.com/4WITB23TA9
— Alvaro Cintas (@dr_cintas) February 18, 2024

Scopri di più sulla nostra politica di embedding.

Dall-E, Midjourney e Adobe Firefly a confronto

Di Alessandra Innocenti

il 13 Gennaio 2024

in AI

L’avvento dell’Intelligenza Artificiale generativa ha rivoluzionato il modo in cui concepiamo e creiamo immagini. Attraverso modelli avanzati, come DALL-E, Midjourney e Adobe Firefly, l’AI sta dando vita a nuove possibilità nell’ambito della produzione visiva.

Midjourney: un viaggio nel mondo dell’Intelligenza Artificiale generativa per la creazione di immagini

Midjourney, uno dei pionieri nell’ambito della creazione di immagini da testo, ha dimostrato progressi costanti nelle versioni successive. Tuttavia, l’accesso gratuito a questa potente risorsa è stato recentemente interrotto dagli sviluppatori, suscitando domande sulla disponibilità di alternative altrettanto valide. Fortunatamente, il panorama offre numerose alternative competitive, superando non solo in capacità di creazione, ma anche in personalizzazione e accessibilità dell’interfaccia.

DALL-E: un passo avanti nell’universo dell’immagine

DALL-E, sviluppato da OpenAI (la stessa azienda dietro ChatGPT), emerge come una delle alternative più interessanti a Midjourney. Questo generatore di immagini si distingue per la sua abilità nella creazione di immagini fotorealistiche, benché richieda una maggiore precisione nell’inserimento del testo di partenza, rispetto al suo predecessore.

Il punto forte di DALL-E è la sua capacità di mescolare concetti, qualità e stili, consentendo la creazione di immagini uniche. Dagli ampliamenti delle immagini alla manipolazione dei colori e degli stili degli elementi, questo strumento offre un’ampia gamma di possibilità, sebbene richieda un impegno più approfondito.

Adobe Firefly: l’ambiziosa incursione di Adobe nel mondo dell’Intelligenza Artificiale

Adobe Firefly rappresenta l’audace ingresso di Adobe nel dominio della generazione di contenuti attraverso modelli IA, integrato persino in Google Bard per la creazione di immagini. Questo progetto ambizioso offre un set di funzioni impressionanti, tra cui la creazione d’immagini da testo, l’upscale delle immagini, la ricolorazione vettoriale, effetti di testo, l’inpainting, lo sketch-to-image, e altro ancora.

Attualmente in fase beta, alcune funzioni di Adobe Firefly sono ancora in sviluppo. Per utilizzarlo, basta accedere al sito di Adobe Firefly con il proprio account Adobe, seguire il tutorial e approvare i termini di utilizzo. Inserendo un prompt di testo in inglese, si possono generare immagini in diverse varianti, selezionando il tipo di contenuto desiderato: arte, grafica, foto.

L’intelligenza generativa sta apportando cambiamenti rivoluzionari nel modo in cui concepiamo e creiamo immagini, e con opzioni come DALL-E, Midjourney e Adobe Firefly, si prospetta un futuro affascinante nell’evoluzione dell’arte visiva.

Secondo un’analisi condotta da un’esperto di intelligenza artificiale, Chase Lean, messe a confronto le tre applicazioni, Firefly 2 genera foto più realistiche rispetto a Midjourney e DALL-E. Eccelle anche nelle riprese di prodotti, nel design di interni, nella generazione di testi e nelle foto di animali selvatici, mentre Midjourney ha prodotto foto di paesaggi di qualità superiore con un’illuminazione più suggestiva.

Vediamo le sue simulazioni.

Dall-E, Midjourney e Adobe Firefly: creare immagini con l’Intelligenza Artificiale

Di Redazione

il 31 Dicembre 2023

in AI

La generazione di immagini tramite Intelligenza Artificiale sta rivoluzionando il mondo del design grafico e dell’arte digitale. Midjourney è stato uno dei pionieri in questo campo ed è indubbiamente una delle AI generative di immagini più popolari in assoluto.

Tuttavia la concorrenza sta crescendo rapidamente non solo per quanto riguarda la capacità di creazione, ma anche le possibilità di personalizzazione e l’interfaccia di accesso.

Proviamo a capire le differenze (se ci sono), tra Midjourney, Dall-E e Adobe Firefly mettendole a confronto in 10 prompt.

Stessi prompt, diversi output.

Qual è il vostro preferito?

10)

Midjourney, la versione V6 disponibile in alpha test

Di Redazione

il 21 Dicembre 2023

in AI

Midjourney ha rilasciato la versione V6 anche se non si tratta di un rilascio definitivo ma di una versione alpha messa a disposizione della community affinché gli utenti possano testarla.

Diversi i miglioramenti introdotti dal nuovo modello che ora è in grado di seguire i prompt in modo molto più preciso, inclusi prompt più lunghi, la possibilità di specificare colori e altri dettagli in un’immagine, la composizione controllata utilizzando il linguaggio naturale, l’aggiunta di testo, una migliore comprensione delle sfumature grammaticali e la possibilità di aggiungere cornici e bordi alle immagini tramite testo descrittivo. Anche gli upscaler sono stati migliorati, per un incremento di 2 volte della risoluzione.

Midjourney V6 però è molto diverso da quello della versione V5 e sarà quindi necessario imparare di nuovo il modo in cui comporre i prompt di richiesta.

In ogni caso, la versione V6, il terzo modello di Midjourney addestrato da zero sui supercluster AI del research lab in lavorazione da 9 mesi, è in grado di generare immagini molto più realistiche della versione più recente, v5.2

Il sito di fotografia PetaPixel ha provato a mettere a confronto i risultati delle due versioni.

1° Prompt: “Albert Einstein che fa un esperimento scientifico”

2° Prompt: “Un ritratto di Marie Curie nel suo laboratorio”

I risultati della v6 sono spettacolari, con un’enorme quantità di dettagli in ogni immagine e una luce eccellente. Pur riconoscendo che i risultati della versione 5.2 non sono negativi, è indubbio che la complessità delle scene nella v6 è davvero impressionante.

La community sta ovviamente testando le nuove funzionalità, sopratutto per quel che riguarda l’inserimento di testo all’interno delle immagini, una funzionalità generalmente ritenuta più debole sulla versione precedente.

1. Prompt: A man standing alone in a dark empty area, staring at a neon sign that says "EMPTY" pic.twitter.com/LTcDE9T5eB
— Chase Lean (@chaseleantj) December 21, 2023

3. Prompt: An anime style movie poster with the stylized words "TOMORROW", with a girl looking upwards at the night sky, and cherry blossoms floating in the wind. –s 200

Can't read Japanese ~ don't think it's spelled correctly😂but I still like the vibes. pic.twitter.com/yWqJ8H7lLX
— Chase Lean (@chaseleantj) December 21, 2023

5. Prompt: A clean, minimalistic logo featuring an ice cream cone, with palm trees as the backdrop and the words "ICE CREAM OASIS" –style raw pic.twitter.com/UWgs3FTRIt
— Chase Lean (@chaseleantj) December 21, 2023

7. Prompt: A minimalistic product shot of a bottle of perfume on a clean backdrop with the words "Floral Symphony", surrounded by fragrant white flowers pic.twitter.com/4PFCNcdtzU
— Chase Lean (@chaseleantj) December 21, 2023

9. Prompt: A modern burger advertisement, with the words "THE BIG ONE", featuring a delicious huge beef burger, with tomatoes and lettuce in the background pic.twitter.com/LYSNrg4Gjo
— Chase Lean (@chaseleantj) December 21, 2023

Bonus! pic.twitter.com/O4M4ndrIAT
— Chase Lean (@chaseleantj) December 21, 2023

Intelligenza Artificiale e creazione di immagini

Di Fabio Ricceri

il 16 Ottobre 2023

in Vision

I programmi di Intelligenza Artificiale hanno ormai raggiunto livelli incredibili nella creazione delle immagini. L’IA generativa consente infatti la la creazione di immagini, disegni e illustrazioni ad alta definizione utilizzando descrizioni testuali. È infatti sufficiente scrivere una parola chiave o un testo e l’algoritmo crea un’immagine personalizzata che rappresenta il concetto espresso. L’utente ha la possibilità di specificare lo stile, il colore, la prospettiva e altri dettagli per personalizzare la sua immagine.

Alcuni sistemi, come Midjourney, usano la Generative Adversarial Network (GAN), una rete neurale composta da due moduli chiamati generatore e discriminatore. Il primo è adibito alla produzione delle immagini dal testo, mentre il secondo valuta se le immagini sono realistiche. L’interazione tra i due moduli porta al miglioramento delle prestazioni per la produzione di immagini sempre più precise.

Dall’editing fotografico avanzato alle soluzioni di generazione di immagini, l’IA offre nuove prospettive creative per artisti, designer e creatori di contenuti, consentendo il miglioramento automatico delle immagini, dalla correzione del colore alla rimozione di imperfezioni, offrendo risultati sorprendenti e creando al tempo stesso un’esperienza visiva altamente personalizzata.

Tuttavia, con il potenziale innovativo possono anche emergere anche dei rischi significativi come la manipolazione dell’identità, perché l’IA rende possibile la creazione di foto fake realistiche di personaggi famosi, come è successo all’ex Presidente degli Stati Uniti Donald Trump o anche a Papa Francesco, sollevando preoccupazioni sulla manipolazione dell’identità e la diffusione di informazioni false.

I rischi di abuso possono riguardare, oltre all’eventuale creazione di supporti visivi a supporto delle fake news, anche la sfera reputazionale dei singoli cittadini, mettendone a rischio la privacy, fino a raggiungere quel confine dove la capacità delle società in generale di distingue la differenza tra realtà e finzione assume dei contorni sfocati. E, da questo punto di vista, i rischi possono essere significativi quando si tratta di personaggi famosi o di personalità di primo piano.

Affrontare le straordinarie opportunità offerte dall’IA nella creazione di immagini richiede un approccio bilanciato in grado di combinare l’innovazione tecnologica con un utilizzo non tanto regolamentato quanto etico per garantire che l’IA contribuisca positivamente al nostro mondo visivo senza compromettere verità, integrità e dignità della persona.