Diskuter og generer KI-bilder
1. Generert bilde eller ikke?
A. Hvilke av bildene i bildeserien nedenfor er generert av KI, og hvilke er det ikke? Jobb sammen to og to og diskuter.
Fasit: Generert bilde eller ikke?
Malingregn – generert
Regnbuemaleri – ikke generert
Løvskog med sti – ikke generert
Løvskog – generert
Plakat med Charlie Chaplin Modern Times – ikke generert
Plakat med Charlie Chaplin 2024 – generert
Folkemengde i et lyskryss, halvnært utsnitt – ikke generert
Folkemengde i et lyskryss, nært utsnitt – generert
B. På nettsiden thispersondoesnotexist.com får dere opp bilder av mennesker som ikke finnes. Oppdaterer dere lenka, kommer det opp et nytt bilde. Se gjennom noen bilder.
Klarer dere å se om bildet er KI-generert eller ikke?
Hvorfor eller hvorfor ikke?
2. Diskuter resultat av ledetekst og prøv selv
Disse bildene er opprettet med KI-bildegeneratoren Midjourney (versjon 4).
Bildene med ledetekst finner dere på denne siden: Wikipedia AI Art caricatures and public characters in AI art – Donald Trump
Hvilke begreper fra ledeteksten nedenfor er fotofaglige? Hvilke av dem ser vi igjen i bildene? Diskuter to og to og deretter i klassen.
Ledeteksten bak bildet over er: "Donald Trump portrait, Bozo the Clown makeup on Donald Trump face, cinematic lighting, photo taken by ARRI, Canon, Nikon, Hasselblad, incredibly detailed, sharpen, professional lighting, 50mm, 80mm, 100mm + lightroom gallery --v 4" (Chicago god, 2022)Prøv å bruke ledeteksten fra oppgaven over og legg inn i et bildegeneringsverktøy. Hva skjer? Hvorfor tror dere dette skjer? Diskuter fordeler og ulemper med begrensninger i KI-generering av bilder.
3. Hva kjennetegner gode ledetekster?
A. Bildet nedenfor er generert i Adobe Photoshop med ledeteksten "En skikjører i pudder nedover i bratt skog".
Diskuter: Hva fungerer, og hva fungerer ikke med dette genererte bildet?
B. Nedenfor skal dere øve dere på å bruke ledetekster for å generere bilder.
For hver oppgave tar dere vare på ett bilde dere er fornøyde med, og ett dere ikke er fornøyde med.
Generer et foto av et landskap dere selv liker.
Generer et foto av en bekk eller ei elv.
Generer et foto av en modell som har på seg en dongeribukse.
Generer en tegning som kunne ha vært brukt i ei barnebok.
Tips til ledetekster for generering av bilder
Gi instrukser for teknikk (for eksempel foto, kull, anime, akvarell).
Gi instrukser for stil (for eksempel renessanse, art nouveau, kubisme).
Angi utsnitt.
Bruk presise adjektiver (for eksempel skinnende, flytende, industrielt, pistasjgrønt, nøttebrun, korallfarget).
Beskriv egenskaper ved portrett (for eksempel familie, studio, nært).
Beskriv omgivelser presist (for eksempel lavendeleng, afrikansk savanne, furuskog).
Oppgi fotograferingsdetaljer (angi dybdeskarphet og lukkertid, beskriv linsetype, angi ISO-verdi).
Oppgi lyskilde, lystype og plassering (for eksempel LED-lys, bål, kaldt lys, hovedlys, utfyllingslys, venstre, ovenfra).
Prøv ledetekster også på engelsk.
For utdyping av tipsene over, se fagartikkelen "Lag bilder med kunstig intelligens".
C. Hvilket av bildene dere genererte, er dere mest fornøyde med? Begrunn.
D. Gå gjennom bildene dere ikke var fornøyde med eller fant feil med. Hvilke feil fant dere, og er det feil som går igjen?
E. Reflekter over arbeidet med å lage ledetekster. Hvordan må dere gå fram for å ende opp med bilder dere er fornøyde med? Hva kjennetegner ledetekstene som fungerer best?
Ekstraoppgave: Generer og vurder ledetekst
Det finnes hjelp til å lage fyldige ledetekster. Dere kan for eksempel bruke Adobe Firefly prompt generator.
Generer ledetekst for å opprette bilder i Adobe Firefly.
Diskuter verdien av å få hjelp til å generere ledetekster for å lage bilder.
Hvordan fungerer bildet?
Med hjelp fra ledetekstgeneratoren og bruk av verktøyet Adobe Firefly blir kvaliteten på skikjørerbildet mye bedre, se resultatet under. Likevel er det elementer i bildet som ikke er helt riktige. Finner dere dem?
Ledeteksten til bildet er som følger:
Skier, a person dressed in vibrant ski attire, gracefully gliding down a snow-covered mountain slope. The skier is leaning forward, their body in perfect alignment as they navigate through a series of sharp turns. The snow beneath them sparkles in the sunlight, the powder spraying up behind their skis with each turn. The skier's face is filled with determination and excitement, their eyes focused on the path ahead. The surrounding mountains rise majestically, their peaks covered in a blanket of white. The crisp mountain air is filled with the sound of skis slicing through the snow and the occasional whoops of joy from fellow skiers.
Style: Photography (Action Sports)
The photograph will be captured using a high-speed camera to freeze the fast-paced action of the skier. The composition will emphasize the skier's dynamic movement and the breathtaking mountain landscape. The camera settings will be adjusted to capture the details of the snow and the skier's vibrant attire, while maintaining a sense of speed and energy. (OpenAI, 2023)
4. Fattig og rik i KI-bilder
Vi kan få kulturelle skjevheter i resultatene av det vi bestiller, når vi bruker KI til å generere bilder. KI baserer seg på store mengder data som kan forsterke stereotypier og mangle nyansering. Vurder om det gjelder i følgende sammenheng:
Generer to sett bilder: "Rik person som går langs en vei" og "Fattig person som går langs en vei".
Hvordan blir "rik" og "fattig" vist i bildene?
Hva tenker dere om resultatene?
5. Bygg et KI-bilde i flere lag
Lag en skisse til et reklamebilde for en drikk. Bruk tre lag i Photoshop for å bygge bildet: ett lag for bakgrunnen, ett lag for produktet (hovedmotivet) og ett lag for annet innhold.
A. Velg et arbeidsområde med "Rectangular Marquee tool". Dere får opp en tekstboks der dere kan skrive en ledetekst (prompt) for å generere et bilde.
B. Generer så mye av innholdet til hvert av lagene som overhodet mulig. Prøv dere fram med ulike ledetekster.
C. Hva kommer enkelt på plass? Hva er vanskeligere å få til? Hvilke ledetekster fungerer, hvilke fungerer ikke?
D. Diskuter i klassen: Hva er fordeler og ulemper med å bruke lagdeling i KI-genererte bilder sammenliknet med helgenererte bilder?
6. Verkshøyde
I loven om opphavsrett finner vi begrepet verkshøyde. Skal man ha opphavsrett til eget bilde, må bildet ha verkshøyde. Det betyr at man skal ha bidratt med en individuell og skapende innsats da man laget det. Når et bilde har verkshøyde, er det et åndsverk og dermed også beskyttet av åndsverkloven.
Forklar hverandre hva verkshøyde er, og bruk eksempler på egne arbeid med medieuttrykk.
Hvor i arbeidsprosessen med et KI-bilde ligger det mest "individuell og skapende innsats"?
Hva skal til for at et KI-generert bilde har verkshøyde?
7. Diskuter profesjonell bruk av KI-genererte bilder
I hvilke sammenhenger er det fornuftig å bruke KI-generering av bilder i profesjonell medieproduksjon?
Finn gjerne konkrete eksempler på profesjonell bruk og diskuter.
Verktøy brukt for å generere bilder til denne artikkelen
Adobe Photoshop med funksjonen "Generate"
Adobe Firefly
DALL-E i Copilot
Adobe Firefly prompt generator på FlowGPT
Kilder
AI art caricatures and public characters in AI art. (2024, 11. februar). I Wikimedia Commons. https://commons.wikimedia.org/wiki/AI_art_caricatures_and_public_characters_in_AI_art#
Bårdgård, T. (2023, 12. september). Lag bilder med kunstig intelligens. NDLA. https://ndla.no/article/38842
Chicago god. (2022, 23. desember). Midjourney Version 4.jpg [KI-illustrasjon]. Wikimedia Commons. https://commons.wikimedia.org/wiki/AI_art_caricatures_and_public_characters_in_AI_art#/media/File:Midjourney_Version_4.jpg
OpenAI. (2023). Adobe Firefly prompt generator (12. april versjon) [Stor språkmodell]. FlowGPT. https://flowgpt.com/p/adobe-firefly-prompt-generator
Hovde, K.-O. & Lem, G. H. (2021, 27. desember). Verkshøyde. I Store norske leksikon. https://snl.no/verkshøyde