text-to-image Archivi

Illustrious, un modello di text-to-image basato su Stable Diffusion XL, ha rapidamente conquistato la comunità dell’arte AI. In soli tre mesi, Civitai, il più grande hub per modelli di arte AI, ha dovuto creare una categoria separata per gestire l’enorme ecosistema di risorse legate a Illustrious.

Il segreto del suo successo risiede in un ritorno alle basi con un tocco innovativo. Mentre modelli più recenti come SD 3.5 e Flux si affidano a descrizioni in linguaggio naturale estese, Onoma AI, gli sviluppatori di Illustrious, hanno adottato un approccio diverso, sfruttando i tag di Danbooru per aiutare il modello a comprendere i concetti senza dover reinventare complessi sistemi di didascalie.

I tag di Danbooru, utilizzati da anni come standard per la categorizzazione delle immagini tra gli appassionati di arte e anime, rappresentano elementi specifici come caratteristiche dei personaggi, abbigliamento, pose o sfondi. Questo consente un controllo preciso sulle immagini generate senza sprecare token preziosi in descrizioni lunghe. Come ha affermato un membro di Discord, “È come avere un artista che capisce esattamente cosa vuoi senza doverlo spiegare in paragrafi; devi solo conoscere i tag giusti.”

Intelligenza Artificiale, Innovazione e Trasformazione Digitale

Tag: text-to-image

Illustrious: L’industria emergente dell’AI nell’arte, Onoma AI