Midjourney 6 è alle porte e fa letteralmente paura | I fotografi maledicono già le Ai

midjourney v6

Prompt più semplici e immagini ancor più dettagliate… Ma con i dubbi di sempre.

Anche per il 2204 gli algoritmi di Ai continueranno a farla da padrone tra gli argomenti più caldi dei dibattiti e delle notizie del settore hi-tech. D’altronde stiamo entrando sempre più nel vivo delle oro applicazioni pratiche in ogni campo, dalle produzioni culturale all’intrattenimento digitale, fino ovviamente all’imaging generation, ambito in cui Midjourney la fa da padrone. Con lo standard 5.2 ormai ampiamente diffuso, la sesta versione dell’algoritmo nella sua fase di rodaggi, e chi l’ha già provato ne parlando in modo assolutamente entusiastico. L’evoluzione sconcertante di Midjourney però si trascina dietro i dubbi di sempre, in primis sulle modalità di addestramento dell’algoritmo che continuano a ricadere in una zona grigia sulla quale occorre far luce al più presto, con l’aiuto di apposite regolamentazioni.

Midjourney 6, ci siamo quasi

La nuova versione di Midjourney promette di avvicinarsi sensibilmente al fotorealismo
La nuova versione di Midjourney promette di avvicinarsi sensibilmente al fotorealismo

Alcuni creativi che utilizzano frequentemente Midjourney si sono detti impressionati dalle potenzialità della nuova versione, attualmente disponibile in beta per i sottoscrittori paganti dell’applicazione accessibile tramite server Discord. L’artista Julie Wieland parla di scenari e dettagli di una sofisticazione strabiliante (la parola utilizzata è “insane”), al netto di una saturazione e contrasto per il momento eccessivi. Ma una differenza notevole rispetto al predecessore è dato dal prompt di comando, che è stato ripensato nei suoi presupposti per così dire “filosofici”. Lo spiega la stessa società Midjourney nel blog ufficiale, anticipando che i creativi dovranno abituarsi a ripensare la formulazione degli input di comando al software per ottenere i massimi risultati.

– Scrivere i prompt di comando in Midjourney V6 è significativamente diverso da V5. Dovrete reimparare a scrivere i prompt.
– Midjourney V6 è molto più sensibile ai vostri prompt. Evitate prompt-spazzatura tipo “award winning, photorealistic, 4k, 8k”.
– Siate espliciti rispetto a ciò che volete ottenere. Potrebbe essere meno immediato ma se siete espliciti ora l’algoritmo vi comprenderà molto meglio.
– Se volete qualcosa di più fotografico/meno artificioso/più letterale probabilmente otterrete un risultato soddisfacente inserendo il comando –style raw.
– Un valore minore del fattore –stylize (il default è 100) risulterà in una miglior comprensione del prompt, mentre valori superiori (massimo 1000) risulteranno in un miglior risultato estetico.
(…)
– La versione 6 è il terzo modello allenato da zero tramite un supercluster di AI. È il lavorazione da circa 9 mesi.
– V6 non è il passo finale, ma gli sviluppatori sperando che tramite esso percepirete gli enormi passi avanti di qualcosa che si intreccia profondamente con la potenza dell’immaginazione collettiva.

Midjourney v6 Community Blog – 21 dicembre 2023

Non sarà troppo perfetto?

Immagine generata da Midjourney V6 e pubblicata da un utente su X.
Immagine generata da Midjourney V6 e pubblicata da un utente su X.

Le creazioni che hanno iniziato a circolare in rete prodotte grazie a Midjourney 6 sono talmente spettacolari che c’è chi si pone il problema se non siano anche troppo realistiche. Nel senso, generano immagini talmente dettagliate da superare in livello di definizione le immagini cui siamo abituati, anche quelle catturate da videocamere ad altissima risoluzione. Alcuni volti sono tanto minuziosamente dettagliati da apparire quasi iperrealistici, nel senso di troppo realistici, conferendoci cioè un’attenzione ai dettagli, alla porosità della pelle, e ad altri minuscoli particolari che la visione d’insieme del nostro occhio normalmente non cogli nella vita di tutti i giorni, o su cui comunque tende a non soffermarsi.

Va detto che per ovviare a questo grado di dettaglio quasi eccessivo si può istruire adeguatamente l’algoritmo affinché ci restituisca immagini non troppo nitide o dettagliate, oltre che ovviamente sbizzarrirci con la fantasia per creare immagini avulse da ogni contesto di verosimiglianza. In ogni caso il fatto stesso che oggigiorno siamo arrivati a ritenere quasi disturbante il grado di precisione e dettaglio fornito da uno strumento come Midjourney V6 fa riflettere sull’incredibile evoluzione che gli algoritmi di AI stanno conoscendo in questi anni, tanto che fatichiamo a star loro dietro.

Probabilmente questo non sarebbe stato possibile senza il ricorso a metodi poco trasparenti di addestramento degli algoritmi stessi, che non manca di suscitare polemiche nonché cause legali, come quella intentata recentemente dal New York Times nei confronti di Open AI, che a parere della testata americana avrebbe violato il suo copyright attingendo in modo illecito al suo database di articoli per darli in pasto all’algoritmo di ChatGPT senza corrispondere un compenso al NYT e soprattutto senza riceverne autorizzazione. Allo stesso modo Midjourney non ha mai del tutto chiarito i suoi metodi di web-scraping con cui ha fatto man bassa di immagini presenti sul web per addestrare Midjourney, procedimento che per quanto ne sappiamo potrebbe essere ricorso anche all’utilizzo di immagini protette da diritto d’autore. Il problema è che queste aziende sono consapevoli di muoversi in una zona grigia che vive di un vuoto legislativo in cui tutti si muovono senza regole chiare, e dunque di sentono legittimate ad operare senza dover dar conto a nessuno delle proprie azioni.

Il Far West delle AI comunque potrebbe non durare ancora a lungo, è giusto che venga incasellato in regolamenti chiari e condivisi da tutte le parti in causa, e probabilmente in molti casi non è nemmeno necessario che siano le sentenze dei tribunali a stabilire regole chiare, poiché basterà che le parti in causa si siedano attorno ad un tavole per dialogare. Nel mondo dei videogiochi questa cosa sta iniziando ad accadere, ne abbiamo una prova dal recente accordo siglato tra SAG-AFTRA – il più importante sindacato di attori americano – e Replica Studio – compagnia specializzata nello sviluppo di modelli vocali AI-based – in merito all’utilizzo delle voci per addestrare gli algoritmi di AI vocale, che d’ora in poi avverrà all’interno di un regolamento condiviso che offra garanzia di una compensazione equa dell’attore che “vende” la propria voce alla società che la campiona. Questi sono esempi positivi che dimostrano come non serva guardare alle AI con spavento, ma anzi occorra sedersi al tavolo negoziale ed instaurare con le aziende produttrici dei confronti costruitivi che possano portare a benefici reciproci.