Stable AI rilascia la versione 2.0 del suo strumento di diffusione delle immagini Stable Diffusion AI. Il programma ha molte nuove funzionalità. L’aggiornamento rimuove anche la possibilità di creare immagini pornografiche e rende più difficile copiare lo stile degli artisti, riferiscono gli utenti.
La versione 2.0 di Stable Diffusion ottiene, tra le altre cose, un aggiornamento testo all’immagineModello di diffusione Lo sviluppatore segnala l’IA di stabilità. Il programma utilizza il codificatore di testo OpenCLIP di Laion per questo. Ciò dovrebbe migliorare “significativamente” la qualità delle immagini generate rispetto alle precedenti versioni v1, afferma la società. Nella versione 2.0, il modello può generare immagini con risoluzioni standard di 512 x 512 pixel e 768 x 768 pixel.
Il programma sta ottenendo un nuovo strumento di aggiornamento, che può aumentare la risoluzione delle immagini fino a quattro volte, diciamo da 512 x 512 a 2048 x 2048 pixel. L’aggiornamento aggiunge anche a profondità dell’immagineFunzione. Ciò consente al programma di creare nuove versioni di immagini esistenti preservando le informazioni di profondità dall’immagine precedente. Questa funzione può, secondo Stability AI, creare immagini che “sembrano radicalmente diverse dall’originale”, ma preservano la coerenza e la profondità dell’immagine originale. Il programma ha anche una funzione che consente agli utenti di riutilizzare parti di un’immagine durante la creazione di nuove immagini.
Upscaler in Stable Diffusion 2.0 (a sinistra) e profondità sull’immagine. Fonte: stabilità AI
Tuttavia, la nuova versione ha suscitato scalpore anche tra gli utenti, The Verge scrive, tra gli altri. Ad esempio, il nuovo modulo ottiene un filtro che impedisce la generazione di file SaltareImmagini come immagini pornografiche. Utenti Chiama il cambiamento “svista”anche se altri sottolineano che l’opzione per creare immagini nsfw Può essere aggiunto successivamente con software di terze parti.
Il fondatore di Stability AI, Emad Mostaki, dice a The Verge di averlo scelto per motivi di sicurezza. “Non puoi avere bambini e NSFW in un modello aperto”, afferma il fondatore, riferendosi alla capacità di produrre pornografia infantile con uno strumento open source. “Quindi fuori con i bambini o fuori con il NSFW.” È stato anche possibile creare foto di nudo di persone specifiche utilizzando il software senza autorizzazione.
Gli utenti sui social media si lamentano anche della difficoltà di utilizzare lo stile dell’artista durante la creazione delle immagini. In precedenza, gli utenti potevano utilizzare il nome dell’artista come prompt durante la creazione di un’immagine, ma ora sembra essere meno efficace. Artisti come Greg Rutofsky, la cui tecnica per creare immagini è spesso usata con l’intelligenza artificiale, lamentato prima Informazioni sull’utilizzo di generatori di intelligenza artificiale per questo.
L’utente di Reddit confronta Stable Diffusion 1.5 con l’ultima versione ti aiuta a creare immagini in diversi stili artistici, come quelli di Vincent van Gogh, Pixar e Rutowski. Ciò indica che l’ultima versione è di qualità significativamente inferiore a questa. Mostaque dice a The Verge che la copia di tali stili artistici non è specificamente vietata nella versione 2.0. Dice che la ridotta capacità di copiare gli artisti è dovuta ai cambiamenti nella codifica e al modo in cui il software recupera i dati.
Stable Diffusion è un modello open source che può essere utilizzato per generare immagini basate sull’input di testo. Gli utenti possono eseguire il software su un computer, a differenza di servizi come Dall-E, che sono disponibili solo tramite il cloud. Il software è supportato da più GPU con almeno 8 GB di memoria. il programma Disponibile gratuitamente su github. C’è anche Sono disponibili demo online del generatore di immagini AI.
“Fanatico della TV. Dipendente del web. Evangelista di viaggi. Aspirante imprenditore. Esploratore dilettante. Scrittore.”