I ricercatori dimostrano uno strumento di intelligenza artificiale in grado di elaborare le immagini con due clic del mouse – Professionista IT – Notizie

I ricercatori hanno dimostrato uno strumento di intelligenza artificiale sperimentale in grado di elaborare completamente le immagini in pochissimo tempo. Ad esempio, dovrebbe essere possibile ruotare un volto e regolare le espressioni facciali con due clic del mouse.

Lo strumento, DragGAN, mira ad apportare modifiche specifiche a parti specifiche delle immagini senza modificare l’intera immagine. Ciò richiede agli utenti di indicare due punti sull’immagine; La parte da manipolare e il punto nell’immagine in cui dovrebbe andare quella parte. Lo strumento dovrebbe fare il resto, dicono i ricercatori.

DragGAN consente a chiunque di distorcere un’immagine con un controllo preciso su dove vanno i pixel, manipolando il posizionamento, la forma, l’espressione e il layout di diverse classi come animali, automobili, persone e paesaggi. A differenza, ad esempio, dello strumento Warp in Photoshop, i pixel esistenti non cambiano, ma la rete neurale crea pixel completamente nuovi.

Gli esempi mostrati mostrano, tra l’altro, che lo strumento può aprire la bocca di un leone e quindi far guardare l’animale in una direzione diversa girandogli la testa. Anche i vestiti delle persone, come le maniche, sono allungati e si possono vedere le braccia e le gambe che si muovono. Un altro esempio mostra come i paesaggi vengono completamente modificati.

La maggior parte delle immagini negli esempi sono generate dall’intelligenza artificiale, ma secondo i ricercatori lo strumento dovrebbe essere in grado di gestire anche immagini reali. Lo dimostra un ritratto sorridente del presidente degli Stati Uniti Joe Biden, che in pochi minuti è cambiato in un’espressione scioccata, anche lui con la testa girata.

Secondo i ricercatori, lo strumento è in grado di ottenere “risultati realistici che tracciano continuamente la durezza dell’oggetto, anche per scenari impegnativi, come parti nascoste”. La squadra si prepara Per pubblicare il codice dello strumento su GitHub il mese prossimo.

READ  Leo Al-Kimadi sul palco per la prima volta con il figlio: “Il mio ragazzino”

Al progetto hanno contribuito sei ricercatori che lavorano presso università tedesche e americane. Ha contribuito anche Abhimitra Mika, Research Scientist nella divisione AR di Google.

We will be happy to hear your thoughts

Leave a reply

TGcomnews24