Novità in casa OpenAI con l’introduzione di una funzione molto attesa dagli utenti: la possibilità di modificare, direttamente dal classico editor e senza quindi passare da programmi esterni, le immagini generate attraverso l’intelligenza artificiale.
Lo sapevi che adesso è possibile modificare le immagini generate attraverso l’intelligenza artificiale generativa Dall-E direttamente all’interno del suo editor? Probabilmente no perché questa è una novità assoluta introdotta solo recentissimamente da OpenAI!
La stragrande maggioranza delle informazioni in questione si trova all’interno della pagina di supporto di Dall-E e chiaramente non abbiamo a che fare con gli stessi livelli di profondità di un Photoshop, di un GIMP o di uno strumento della suite Affinity ma comunque parliamo di strumenti particolarmente interessanti.
Come funziona l’editor di Dall-E?
Esistono due maniere per modificare le immagini utilizzando gli strumenti integrati all’interno della nuova interfaccia di Dall-E:
- Il primo metodo prevede l’isolamento di una singola parte dell’immagine, così da utilizzare poi indicazioni testuali specifiche che vadano a toccare soltanto quel segmento dell’immagine
- Il secondo metodo, invece, prevede che le modifiche delle immagini siano fatte in maniera più capillare utilizzando la chat integrata nello strumento di modifica. Parliamo quindi, letteralmente, di dire a Dall-E cosa fare rendendolo però conscio del fatto che deve analizzare l’immagine di partenza per eseguire poi le sue modifiche.
Il discorso dell’isolamento e evidenziazione di una singola parte dell’immagine può senza dubbio apparire come molto interessante proprio perché, in precedenza, ciò era impossibile a meno di non utilizzare in locale un’istanza di Stable Diffusion. Tutto questo è stato integrato in termini molto canonici per quanto riguarda la User Experience, grazie alla presenza di un nuovo bottone a forme di pennello che permette di evidenziare il tutto in maniera diretta. Una volta evidenziato il frammento dell’immagine a cui si è interessati è possibile utilizzare il box di testo per scrivere i prompt che andranno ad arricchire l’immagine.
DALL-E 3 Editor in ChatGPT is rolling out already https://t.co/I03xCBtgk4 — Tibor Blaho (@btibor91) 31 marzo 2024
Questa funzionalità è presente anche su smartphone, semplicemente l’evidenziazione delle varie aree del disegno viene fatta attraverso un pennello comandato dalle dita.
Open AI continua per la sua strada (ma non è da sola)
DALL-E di OpenAI è solo uno dei tanti sistemi di intelligenza artificiale generativa che permettono di creari immagini sulla base di prompt testuali; Dall-E ha il vantaggio di essere particolarmente popolare, tanto da essere lo stesso alla base del generatore di immagini integrato all’interno di Copilot, il chat gpt like (concedeteci una risata) di Microsoft.
Google, chiaramente, non è da meno e con l’intelligenza artificiale generativa integrata dentro Gemini ha dimostrato di sapersi difendere, anche se sembra soffrire molto più di altre situazioni, di bias storici o cognitivi che rendono le immagini generate con questi sistemi meno interessanti. Nello specifico il sistema è stato accusato di utilizzare delle indicazioni sulle sensibilità moderne completamente incompatibili con eventuali richieste di carattere storico.
We’re aware that Gemini is offering inaccuracies in some historical image generation depictions. Here’s our statement. pic.twitter.com/RfYXSgRyfz — Google Communications (@Google_Comms) 21 febbraio 2024
Oltre ai grandi nomi non mancano da prendere in esame piattaforme come Midjourney o agli strumenti open source di Stability AI, tutti capaci di offrire un qualche livello di concorrenza se rimaniamo nella nicchia dell’intelligenza artificiale generativa.
Il percorso di Open AI all’interno del settore delle intelligenze artificiali generative è tutto fuorché concluso, comunque: la compagnia americana, infatti, ha annunciato l’arrivo di Sora, un sistema per la generazione di materiale video e Voice Engine, un sistema per creare da zero una voce utilizzando il machine learning per renderla credibile. Tutti elementi senza dubbio molto interessanti ma anche rischiosi in un contesto come quello attuale in cui sembrano ancora mancare a più riprese gli elementi fondamentali per assicurare tanto al pubblico quanto ai creativi il rispetto degli elementi base della moderna società (sensibilità personale e proprietà privata, nello specifico).