Vai al contenuto

Midjourney


Messaggi raccomandati

Da tempo sento parlare di opere artistiche realizzate dall'AI. Ora, per carità, so perfettamente che non è che siano proprio realizzate dall'AI nel senso artistico, ma in realtà sono basate su un calcolo probabilistico eccetera eccetera.
Tuttavia i risultati spesso e volentieri sono interessanti, anche se spesso inquietanti. Nel video di Supper's Ready dei Genesis, la mitica suite del 1972 tratta dall'album Foxtrot, ad esempio l'AI raffigura i cavalli dell'Apocalisse in modo ancora più inquietante di come potrebbe concepirli il più visionario degli artisti.

Oggi ho visto che pure architetti anche famosi la usano per avere input trasversali, diciamo così, alla progettazione. Ovviamente so perfettamente che l'AI non può mai sostituire un progetto fatto con tutti i crismi, tuttavia è una cosa che m'interessa molto e che trovo molto stimolante.
Mi sono collegato al sito di Midjourney e, francamente, se dicessi che ci ho capito qualcosa mentirei spudoratamente.
Ecco... mi piacerebbe che qui se ne parlasse, se magari chi lo ha usato anche occasionalmente potesse dire la sua, eccetera.
Ecco la fatidica domanda: qualcuno qui dentro lo ha mai usato o sa dare informazioni più dettagliate?

Link al commento
Condividi su altri siti

In settembre, dopo aver letto di questi "nuovi strumenti" per la creazione di immagini, ho provato sia Midjourney che Stable Diffusion Dreamstudio che Dall-E.

https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F

https://stability.ai/blog/stablediffusion2-1-release7-dec-2022

https://openai.com/dall-e-2/

 

https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F

Il funzionamento di Midjourney non è semplicissimo, dovendo lavorare all'interno di una specie di forum-social con messaggi, ma provo a semplificare così:

Con l'iscrizione si ottiene un certo numero di "credits" gratuiti coi quali "pagare" la generazione delle immagini. La richiesta (prompt) va inviata come testo all'interno di un nuovo messaggio da inviare in una delle sezioni newcomer-rooms, aggiungendo /imagine all'inizio del testo.

L'immagine inizierà a rivelarsi all'interno del messaggio, in quattro varianti, una volta finita l'elaborazione delle anteprime bisognerà sceglierne una e di nuovo proseguire elaborando quella, fino a quando, soddisfatti di un risultato lo si sceglierà per ottenere la versione ad alta definizione. Allora erano 1024x1024 pixel, ma credo che oggi siano di più. Dico "credo" perché dopo aver esaurito i miei credits gratuiti non ne ho acquistati altri.

E' un po' disorientante dover stare attento a dov'è finito il proprio messaggio con le immagini, perché nel frattempo vengono pubblicati quelli di altri utenti.

C'è però una versione ad abbonamento mensile in cui si può lavorare non in pubblico ma all'interno di un proprio spazio privato.

Da allora le cose potrebbero essere cambiate, ma io non ho più frequentato.

Qui un catalogo di immagini realizzate con Midjourney richiedendo lo stile di certi artisti: https://docs.google.com/spreadsheets/d/1cm6239gw1XvvDMRtazV6txa9pnejpKkM5z24wRhhFz0/edit#gid=438712621

 

https://stability.ai/blog/stablediffusion2-1-release7-dec-2022

Anche con Dreamstudio si ottengono un po' di credits gratuiti e poi si paga, ma il funzionamento è più semplice perché non è un forum ma ha una interfaccia tipo app.

Si scrive il prompt in una casella, scegliendo le dimensioni e molte altre variabili, agendo su dei cursori. Più grande è l'immagine richiesta e più alte le variabili più credits bisognerà pagare. Qui si possono vedere molti esempi di ciò che si ottiene con StableDiffusion Dreamstudiohttps://lexica.art

Cliccando su una immagine si può leggere il prompt usato per generarla.

Qui ho acquistato altri credits, anche perché con la versione 2 hanno abbassato i prezzi e ora con 10$ si ottengono 1000 credits coi quali si creano Approximately 5.000 images with default settings. I default settings però sono 512x512 pixel (0,2 credits), mentre per avere una immagine di 1024x1024 pixel si pagano 1,9 credits.

C'è anche una versione Demo ridotta e gratuita, senza le opzioni di quella principale, ma spesso bisogna aspettare il proprio turno perché risulta "too busy".

L'ultima versione 2.1 https://huggingface.co/spaces/stabilityai/stable-diffusion

Qui la versione 1 https://huggingface.co/spaces/stabilityai/stable-diffusion-1

 

https://openai.com/dall-e-2/

Ho poi provato anche Dall-E che però mi è sembrato meno accurato dei precedenti nei risultati. Qui si hanno 15 credits gratuiti ogni mese.

 

Le differenze...

Ho notato che con Midjourney si ottengono risultati piacevoli e ben composti anche usando prompts molto approssimativi. Ma lo stile è riconoscibile e i colori spesso si ripetono, ad esempio quell''accoppiata rosso-bruno + blu-petrolio si vede dappertutto. 

Con Dreamstudio bisogna scrivere richieste molto più precise, aggiungendo più particolari, o stili (es fotografia, dipinto, disegno, acquerello...) o colori, altrimenti il risultato può essere banale. Ho notato che la versione 2.1 dà risultati più realistici della 1, ma anche molto meno bizzarri e inaspettati.

Dall-E richiede ancora più precisione nei prompt, perché tende a produrre immagini più simili a fotomontaggi che a illustrazioni o dipinti.

 

Modificato da Trystero
Link al commento
Condividi su altri siti

Aggiungo qualche considerazione estetica e etica.

 

Scorrendo le immagini generate da milioni di persone in questi ultimi mesi (ad esempio https://lexica.art ) la parola che mi è venuta in mente è kitsch, non solo nel suo significato più diffuso, ovvero “cattivo gusto”, ma come surrogato dell’esperienza artistica, tolta dal suo contesto e resa facile, innocua e rassicurante.

 

La qualità estetica del kitsch è quella di predigerire l’arte per lo spettatore e di risparmiargli la fatica, fornirgli una scorciatoia per i piaceri dell’arte in modo da lasciar da parte ciò che è necessariamente difficile nell’arte genuina” (Clement Greenberg)

Nel regno del Kitsch impera la dittatura del cuore. I sentimenti suscitati dal Kitsch devono essere, ovviamente, tali da poter essere condivisi da una grande quantità di persone. Per questo il Kitsch non può dipendere da una situazione insolita, ma è collegato invece alle immagini fondamentali che le persone hanno inculcate nella memoria.” (Milan Kundera)

 

Non penso solo alla innumerevole quantità di languide fanciulle coi fiori nei capelli (o muscolosi guerrieri barbuti) coi capelli al vento in pose art nouveau o preraffaellite o fantasy, immersi in boschi translucenti popolati draghi o maghi sotto cieli tempestosi. O alle decine di migliaia di città sci-fi e  post-apocalittiche in fiamme invase da zombie e truci militari e automobili distrutte. O ai ritratti/caricature di attrici, attori, politici, cantanti, comunque tutti famosi, in pose improbabili e/o su sfondi impossibili.

Non è solo questo. E’ che per loro stessa natura questi software possono solo mangiare, digerire e espellere immagini preesistenti, possono solo assemblare, filtrare, ricomporre il già visto. Deja-vu.

 

Per chi è curioso, qui c'è parte dell'immenso catalogo di immagini (12 milioni su 2,3 miliardi) che sono state date in pasto a queste AI per "educarle" a riconoscere e ricreare scene e soggetti: https://laion-aesthetic.datasette.io/laion-aesthetic-6pls/images

https://waxy.org/2022/08/exploring-12-million-of-the-images-used-to-train-stable-diffusions-image-generator/

 

Quindi non si tratta di operazioni concettuali come quelle di Duchamp (l’orinatoio che diventa “Fontana” o la Gioconda coi baffi) o di Andy Warhol (le lattine di Campbell Soup o i ritratti di Marylin Monroe o i rifacimenti dell’Ultima Cena) o di Lichtenstein (i particolari ingranditi di fumetti).

Qui il riciclo è meccanico, impersonale, spesso casuale e variabile aggiungendo o togliendo un aggettivo dal testo che si inserisce.

Per questo accontenta tutti indistintamente e strappa il wow di meraviglia a grandi e piccini. Ma proprio per questo immagino anche che niente di geniale possa uscire da quei software, perché sono una imitazione dell’arte.

 

Però nonostante tutto sono affascinato, ma più dal funzionamento di queste A.I. che dai risultati immediatamente fruibili.

Invece che cercare di ottenere immagini sensazionali, fantasy, glamour, sci-fi, ho cercato di capirne il meccanismo. In Stable Diffusion - DreamStudio ho quindi provato a mantenere lo stesso “prompt” variandone solo alcune parole, oppure aumentando “steps” o varando “scale” e “seed” (la base sulla quale viene generata l’immagine richiesta). In Midjourney (che come un caleidoscopio comunque sforna immagini gradevoli anche usando parole a caso) ho fatto meno esperimenti, avendo subito esaurito quella decina di generazioni gratuite. Su Dall-E ho lavorato poco perché mi è sembrato molto meno interessante dei due già citati.

Per proseguire aspetterò le prossime versioni di questi software, che già iniziano ad essere installabili sui propri computer e non solo usabili nei browser web. E già alcuni permettono di inserire le proprie immagini (foto o illustrazioni) per sottoporle a variazioni e elaborazioni, funzione che mi sembra molto più interessante e creativa.

 

In ogni caso, penso anche al futuro degli illustratori, a chi realizza copertine di libri o dischi o a immagini di impatto per cataloghi e manifesti… 
Bisognerà adeguarsi e imparare a creare immagini inserendo dei “prompt” in questi programmi, che a breve potranno generare immagini pazzesche ad altissima definizione, con spese irrisorie rispetto alla grafica manuale, ma anche alla computergrafica 3D come è stata utilizzata finora.

Alle case editrici infatti basterà mettere uno stagista davanti a uno di questi programmi AI, con sunti delle trame dei libri, per ottenere in pochi giorni le copertine per un anno di edizioni. 
 

 

Modificato da Trystero
Link al commento
Condividi su altri siti

15 ore fa, Trystero ha scritto:

E’ che per loro stessa natura questi software possono solo mangiare, digerire e espellere immagini preesistenti, possono solo assemblare, filtrare, ricomporre il già visto. Deja-vu.

 

... immagino anche che niente di geniale possa uscire da quei software, perché sono una imitazione dell’arte.

 

Alle case editrici infatti basterà mettere uno stagista davanti a uno di questi programmi AI, con sunti delle trame dei libri, per ottenere in pochi giorni le copertine per un anno di edizioni. 
 

 

Grazie del preziosissimo contributo, ed è proprio il tipo di contributo che chiedevo.

Naturalmente mi prenderò il mio tempo (non ne ho poi molto a disposizione... 😢) per andare a curiosare ai link.

Ho estrapolato questi 3 passaggi perchè mi ci ritrovo in modo particolare. In effetti sono perfettamente conscio che il software non fa l'arte, ma imita l'arte, anche se è bravo a farlo. Ora nel mio campo trattasi di pura curiosità, in quanto mi andrebbe di prendere in giro il software, dando come input che so:

 

"gatto alieno su 5 zampe che pedala su un pinzinoccolo giuggiolato a vapore davanti ad una statua raffigurante Isippide da Pinzimonio mentre gioca con uno scassafluzzo volante, con un bosco di rapafratti viola sullo sfondo, il tutto nello stile di Frank Frazetta ma con un ombra a metà tra Walt Disney e Piero della Francesca"...

 

il tutto per vedere cosa cavolo inventa e sganasciarmi dal ridere 😂 oppure stupirmi. Amo venir sorpreso.
Un po' come con il software musicale Band-In-A-Box, nel quale si inseriscono sequenze di accordi, si sceglie uno stile da una libreria e viene fuori un brano in pochi secondi. Solo che io spesso e volentieri mi diverto a dargli sequenze di accordi del tutto a caso, senza nessun filo logico. Tante volte il risultato fa ridere i polli, ma altre si rimane stupiti di come invece il software trovi un senso e lo faccia risaltare.

 

La frase finale sulle case editrici è emblematica e anche inquietante: chi mai avrà voglia di pagare un illustratore professionista quando potrà ottenere in tempi velocissimi un prodotto valido e "sufficientemente" artistico? In particolare le edizioni di fantascienza e fantasy, che in questo campo scommetto si stanno già attrezzando. Al grafico basterà dare una serie di input e voilà, tutto pronto e scodellato con spesa irrisoria. Magari ci sarà da fare un ritocco qua e uno là, con Fotosciòp o GIMP, ma vuoi mettere con una illustrazione da zero?


Essendo io anche illustratore so perfettamente che mi sta franando il terreno sotto i piedi e che nessuno ormai mi chiederà illustrazioni fra pochi anni se non mesi, tuttavia non riesco a fare a meno di essere incuriosito dalla faccenda...

Link al commento
Condividi su altri siti

Cita

Essendo io anche illustratore so perfettamente che mi sta franando il terreno sotto i piedi e che nessuno ormai mi chiederà illustrazioni fra pochi anni se non mesi, tuttavia non riesco a fare a meno di essere incuriosito dalla faccenda...

Lo stesso vale per me, anch'io lavoro come grafico e ho realizzato tante copertine, soprattutto di dischi. E come te sono curioso e mi piace capire come funzionano questi software coi quali inevitabilmente dovremo fare i conti.

Dicevo della differenza tra le diverse versioni di Stable Diffusion Dreamstudio, qui ci sono due schermate ottenute con lo stesso prompt.

Io preferisco i risultati bizzarri della versione 1, ma la 2 produce scene più realistiche, quasi cinematografiche.

 

 

StableDiffusion_1_demo.jpg

StableDiffusion_2_demo.jpg

 

In due immagini della v2 si nota in basso una firma deformata, indizio che rivela come certi elementi provengano da immagini (foto, dipinti...) prese da banche immagini. Altre volte mi sono trovato con i watermarks (sempre deformati) di GettyImages o Shutterstock, e capisco che queste ditte non abbiano preso molto bene l'arrivo di queste AI:

https://www.theverge.com/2022/9/21/23364696/getty-images-ai-ban-generated-artwork-illustration-copyright

https://voonze.com/midjourney-co-getty-images-also-prohibits-works-by-ai-image-generators/

 

Modificato da Trystero
Link al commento
Condividi su altri siti

Mi sembra anche logico che Getty o Shutterstock proibiscano l'utilizzo delle loro immagini. Basterebbe che il software di AI "conosca" tutte le immagini nella loro banca dati e che le riconosca immediatamente, anche se rovesciate o con i colori cambiati... non credo ci voglia molto a fare un upgrade simile con una sorta di collegamento perenne con loro. Magari ci arriveremo.

 

Beato te che hai fatto copertine di dischi... è sempre stato il mio sogno, mi sono proposto a mille porte ma nessuno mi ha mai c..ato di striscio. E poi vedo certe copertine horror che ti raccomando. Ma è un discorso legato a qualsiasi lavoro, che sempre più spesso viene affidato al famoso "nipote del cognato, che è bravo col computer e che il lavoro lo fa gratis".

Link al commento
Condividi su altri siti

2 ore fa, Gryphon ha scritto:

Beato te che hai fatto copertine di dischi... è sempre stato il mio sogno

Sono queste: https://www.diegocuoghi.it/grafica/dischi/index.html

 

Cita

Mi sembra anche logico che Getty o Shutterstock proibiscano l'utilizzo delle loro immagini.

Quello che proibiscono è l'inserimento di immagini prodotte con AI nei loro cataloghi: "banned the upload and sale of illustrations generated using AI"

Sarebbe stata una valanga incontrollabile e con problemi di copyright nel caso qualche particolare fosse riconoscibile.

 

Modificato da Trystero
Link al commento
Condividi su altri siti

1 ora fa, @Maurizio ha scritto:

(anche perché è un tema che non riguarda o non riguarderà solo l'illustrazione e la grafica...)

Infatti queste sono le applicazioni più ovvie. Di sicuro inventeranno qualosa nei prossimi mesi: l'architettura si è già messa su questa scia.
Ho visto dei servizi in TV ma non riesco a trovare la cosa on line, se qualcuno sa dirmi dove, lo ringrazio.

Anche se più che altro è per ispirazione o per riferimento: un conto è fare un rendering di un'idea, un altro conto è un progetto vero e proprio.

Prossimamente toccherà alla musica, mi sa... una manna per creatori di jingle o di colonne sonore. "Vorrei fare un pezzo lungo 1'34" che inizia in REm, poi con un tema folk irlandese ibridato con Stravinskij arriva ad un climax dissonante"...

Link al commento
Condividi su altri siti

2 ore fa, Gryphon ha scritto:

Complimenti... anche nomi notissimi, vedo... 🙂

Grazie, quello delle copertine di dischi è stato il lavoro più bello che ho fatto, anche se poi il "pane quotidiano" arrivava dai lavori per i cataloghi delle ceramiche.
E proprio pensando alle tante copertine temo che in futuro molte verranno prodotte con le AI. Tanto per fare un esempio che non è il mio genere, serve una copertina per un gruppo heavy-psycho-metal con il solito teschietto? eccole https://lexica.art/?q=8f53a379-1d6d-4d27-a599-1d972fe9807f

 

Link al commento
Condividi su altri siti

5 ore fa, Gryphon ha scritto:

Prossimamente toccherà alla musica, mi sa... una manna per creatori di jingle o di colonne sonore. 

 

Ah ma ci siamo arrivati da un po', ci sono già svariate colonne sonore anche cinematografiche che sono state realizzate senza l'ausilio di musicisti, utilizzando librerie già pronte dove sono campionati ad altissima qualità migliaia di frasi, note e frammenti esecutivi di ogni strumento orchestrale, per cui per chi non può permettersi la London Symphony Orchestra può usare questi Virtual Instruments, come sono chiamati nel settore.  😅

Link al commento
Condividi su altri siti

1 ora fa, @Maurizio ha scritto:

 

Ah ma ci siamo arrivati da un po', ci sono già svariate colonne sonore anche cinematografiche che sono state realizzate senza l'ausilio di musicisti, utilizzando librerie già pronte dove sono campionati ad altissima qualità migliaia di frasi, note e frammenti esecutivi di ogni strumento orchestrale, per cui per chi non può permettersi la London Symphony Orchestra può usare questi Virtual Instruments, come sono chiamati nel settore.  😅

Questo lo so, infatti li uso pure io... 😉
Io parlavo di un passo oltre (oppure indietro, dipende dai punti di vista): cioè dare in una specie di prompt un indirizzo di genere, stile o che, ad una AI e quella crea (o qualcosa del genere) un brano, sulla falsariga di quel che accade con le illustrazioni...

Modificato da Gryphon
Link al commento
Condividi su altri siti

4 ore fa, Trystero ha scritto:

E proprio pensando alle tante copertine temo che in futuro molte verranno prodotte con le AI. Tanto per fare un esempio che non è il mio genere, serve una copertina per un gruppo heavy-psycho-metal con il solito teschietto? eccole https://lexica.art/?q=8f53a379-1d6d-4d27-a599-1d972fe9807f

Ecchecavolo... indubbiamente notevoli. Molte di quelle col teschio più che heavy metal (genere che non frequento né m'interessa farlo) mi ricordano le copertine psichedeliche dei Grateful Dead, anche se più fredde e meno... come dire? meno "appealing".

Tuttavia interessanti, inutile dire.
Mi sono divertito a inserire nella ricerca elfi, gnomi, statue, auto, Disney, Roger Dean, mostri, cascate, spazio, pianeti, orchi, paesaggi fantasy, demoni, coniglietti... e tutte le volte i risultati non sono mancati, anche interessanti. Ho notato una tendenza a riprodurre sempre Evangeline Lilly nelle bellezze femminili, non so perché... forse perché deve aver particolarmente colpito la fantasia di qualcuno.
Quel che non capisco è se quelle illustrazioni sono state create da tizi in carne e ossa o se sono tutte generate da zero dall'AI? Uno che si sarà preso la briga di dare delle specifiche c'è stato?

Ho notato cose che ad un essere umano non potrebbero essere mai venute in mente (ragazze con 4 orecchi, 4 fianchi, 6 occhi, mostri con 2 bocche, auto a due piani con 3 calandre, mostri mezzo animale mezzo piante, eccetera).

E con che software? Quello di cui stiamo parlando?

 

Schermata 2023-01-11 alle 20.44.04.png

Schermata 2023-01-11 alle 20.45.05.png

Modificato da Gryphon
Link al commento
Condividi su altri siti

Quale essere umano avrebbe mai potuto concepire queste auto? Tra l'altro nella prima si vedono proprio degli artefatti grossi come una casa.
Intendiamoci: interessante comunque, pagherei per averle immaginate e disegnate io.

 

 

Schermata 2023-01-11 alle 20.51.50.png

Modificato da Gryphon
Correzione testo.
Link al commento
Condividi su altri siti

  • 4 mesi dopo...

Comunque ora non so come funzioni Midjourney.
Io ho trovato altri siti / app che non hanno più bisogno di scrivere strani codici del tipo <prompt: gtzu78 wDVX pippo> ma basta proprio descrivere ciò che si ha in mente, dare invio e stare ad aspettare.

In particolare mi sembrano interessanti Images.AI e Wombo.AI.

Mi sono fatto una casistica interessante, che immagino conoscerete pure voi... del tipo, le mani sono inguardabili (a 4 o a 6 dita o anche più, oppure due pollici con tre falangi, oppure dita senza unghie o con due 😖 ), spesso e volentieri spunta o una gamba un braccio in più, la simmetria dei vestiti o anche delle automobili è assente (un faro da una parte e due dall'altra...), gli edifici sono improbabili con elementi messi un po' a casaccio (porte al 3° piano, terrazzi ciechi, abbaini dove è impossibile che esistano eccetera).

In compenso l'AI ha capito benissimo cosa siano le auto americane degli anni '50, i cottage inglesi e le case balloon frame americane.

Le luci sono sempre perfette e azzeccatissime, va detto, così come l'AI è brava nel riprodurre nebbie, mari mossi, tempeste.

Le cose migliori le produce nel campo fantasy, horror o comunque del non realistico. Se digitate, che so, "un castello volante su un mare in tempesta" il risultato potrebbe stupirvi favorevolmente. I mostri poi sono stupefacenti, specialmente su Wombo, degni del peggior incubo di Lovecraft.

 

Immaginatevi la scena: un cliente (editore o altro) ci telefona e ci chiede con una scadenza ravvicinatissima una copertina o comunque un'illustrazione horror / fantasy / fantascienza eccetera. Andate sul sito e digitate nel prompt il tema dell'illustrazione. Aspettate i risultati... 30 secondi ed ecco pronta. Non vi piace? date un secondo invio e ne avrete un'altra che bi piacerà di più. E se poi c'è qualcosa che non torna come le cose suddette (mani, braccia eccetera), basterebbero 10 minuti su fotosciòp per ricostruire la mano, cancellare la gamba in più e via discorrendo. Ecco fatto, tutto in un'oretta al massimo.
Presentiamo il lavoro al committente, lui l'apprezza, vi dice pure "bravo" e poi vi fa:

"Più che 10€ non ti darò certo, visto che ha fatto tutto l'AI"

Difficile dargli torto...

 

Modificato da Gryphon
errore di digitazione mio
Link al commento
Condividi su altri siti

Partecipa alla conversazione

Puoi pubblicare ora e registrarti più tardi. Se hai un account, accedi ora per pubblicarlo con il tuo account.

Ospite
Rispondi a questa discussione...

×   Hai incollato il contenuto con la formattazione.   Rimuovere la formattazione

  Sono consentiti solo 75 emoticon max.

×   Il tuo collegamento è stato incorporato automaticamente.   Mostra come un collegamento

×   Il tuo contenuto precedente è stato ripristinato.   Pulisci editor

×   Non puoi incollare le immagini direttamente. Carica o inserisci immagini dall'URL.

×
×
  • Crea Nuovo...