Task

Diskuter og generer KI-bilder

Skriv en kort instruks i en tekstboks, og vips, dere har et bilde som kan brukes i et oppdrag eller en arbeidsoppgave. Eller vent nå litt, er det hele så enkelt?

NDLAs bilderobot

I noen av oppgavene blir du bedt om å generere bilder. Husk å bruke godkjente bilderoboter. NDLAs bilderobot finner du under NDLAs prateroboter når du logger inn på Min NDLA. Alle KI-robotene til NDLA er personvernsikre, tar hensyn til opphavsrett og er spesielt tilrettelagt for bruk i opplæring.

1. Generert bilde eller ikke?

A. Hvilke av bildene i bildeserien nedenfor er generert av KI, og hvilke er det ikke? Jobb sammen to og to og diskuter.

Fasit: Generert bilde eller ikke?

Malingregn – generert

Regnbuemaleri – ikke generert

Løvskog med sti – ikke generert

Løvskog – generert

Plakat med Charlie Chaplin Modern Times – ikke generert

Plakat med Charlie Chaplin 2024 – generert

Folkemengde i et lyskryss, halvnært utsnitt – ikke generert

Folkemengde i et lyskryss, nært utsnitt – generert

B. På nettsiden thispersondoesnotexist.com får dere opp bilder av mennesker som ikke finnes. Oppdaterer dere lenka, kommer det opp et nytt bilde. Se gjennom noen bilder.

Klarer dere å se om bildet er KI-generert eller ikke?
Hvorfor eller hvorfor ikke?

2. Diskuter resultat av ledetekst og prøv selv

Kollasj med fire karikerte portretter av Donald Trump. Tre av dem er ganske realistiske og likner mer eller mindre på den ekte Donald Trump, men på det fjerde bildet er ansiktet smalere og har grålig hud og dype furer. KI-foto. — Karikaturer av Donald Trump laget i Midjourney (versjon 4). KI-genererte fotoer. Image: Chicago god / CC BY-SA 4.0

Bildene med ledetekst finner dere på denne siden: Wikipedia AI Art caricatures and public characters in AI art – Donald Trump. Bildene er opprettet med KI-bildegeneratoren Midjourney (versjon 4).

Ledeteksten bak bildet over er: "Donald Trump portrait, Bozo the Clown makeup on Donald Trump face, cinematic lighting, photo taken by ARRI, Canon, Nikon, Hasselblad, incredibly detailed, sharpen, professional lighting, 50mm, 80mm, 100mm + lightroom gallery --v 4" (Chicago god, 2022).

Hvilke begreper fra ledeteksten er fotofaglige? Hvilke av dem ser vi igjen i bildene? Diskuter to og to og deretter i klassen.
Bruk ledeteksten fra oppgaven over og legg inn i et bildegeneringsverktøy. Hva skjer? Hvorfor tror dere dette skjer?
Diskuter fordeler og ulemper med begrensninger i KI-generering av bilder.

3. Fattig og rik i KI-bilder

Vi kan få kulturelle skjevheter i resultatene av det vi bestiller, når vi bruker KI til å generere bilder. KI baserer seg på store mengder data som kan forsterke stereotypier og mangle nyansering. Vurder om det gjelder i følgende sammenheng:

Generer to sett bilder: "Rik person som går langs en vei" og "Fattig person som går langs en vei".

Hvordan blir "rik" og "fattig" vist i bildene?
Hva tenker dere om resultatene?

4. Hva kjennetegner gode ledetekster?

A. Bildet nedenfor er generert i Adobe Photoshop med ledeteksten "Et foto av en skikjører i pudder nedover i bratt skog". Bildet ble generert vinteren 2024.

Diskuter: Hva fungerer, og hva fungerer ikke med dette genererte bildet?

Skikjører sklir nedover, en granskog vises i bakgrunnen. Ansiktet er deformert, sekken henger ikke helt riktig på ryggen, vottene er klumpete, og skisko og ski er ulike og ikke riktig framstilt. KI-foto. — KI-generert foto. Image: Albertine Aaberge / CC BY-SA 4.0

B. Legg denne ledeteksten inn i en bilderobot dere har tilgang til: "Et foto av en skikjører i pudder nedover i bratt skog." Sammenlikn og diskuter bildene dere får fra bilderoboten: Hva fungerer med bildene, og hva fungerer ikke?

C. Nedenfor skal dere øve dere på å bruke ledetekster for å generere bilder. Bruk en iterativ tilnærming. Det vil si at dere justerer ledeteksten og bestiller et nytt bilde i flere runder til dere er fornøyde.

For hver oppgave gjør dere justeringer på ledeteksten og ta vare på første og siste ledetekst og første og siste bilde.

Generer et foto av et landskap.
Generer et foto av en bekk eller ei elv.
Generer et foto av en modell som har på seg en dongeribukse.
Generer en tegning som kunne ha vært brukt i ei barnebok.

Tips til ledetekster for generering av bilder

Gi instrukser for teknikk (for eksempel foto, kull, anime, akvarell).

Gi instrukser for stil (for eksempel renessanse, art nouveau, kubisme).

Angi utsnitt.

Bruk presise adjektiver (for eksempel skinnende, flytende, industrielt, pistasjgrønt, nøttebrun, korallfarget).

Beskriv egenskaper ved portrett (for eksempel familie, studio, nært).

Beskriv omgivelser presist (for eksempel lavendeleng, afrikansk savanne, furuskog).

Oppgi fotograferingsdetaljer (angi dybdeskarphet og lukkertid, beskriv linsetype, angi ISO-verdi).

Oppgi lyskilde, lystype og plassering (for eksempel LED-lys, bål, kaldt lys, hovedlys, utfyllingslys, venstre, ovenfra).

Prøv ledetekster også på engelsk.

For utdyping av tipsene over, se fagartikkelen "Lag bilder med kunstig intelligens".

D. Hvilket av bildene dere genererte, er dere mest fornøyde med? Begrunn.

E. Gå gjennom bildene dere ikke er fornøyde med, eller som dere fant feil med. Hvilke feil finner dere, og er det feil som går igjen?

F. Reflekter over arbeidet med å lage ledetekster. Hvordan må dere gå fram for å ende opp med bilder dere er fornøyde med? Hva kjennetegner ledetekstene som fungerer best?

5. Generer og vurder ledetekst

Bruk en praterobot til å generere en ledetekst som dere bruker i en bilderobot. Hvordan vurderer dere resultatet på bildene?

Diskuter verdien av å få hjelp til å generere ledetekster for å lage bilder.

Hvordan fungerer bildet?

Med hjelp fra en ledetekstgenerator og bruk av verktøyet Adobe Firefly blir kvaliteten på skikjørerbildet mye bedre, se resultatet under. Likevel er det elementer i bildet som ikke er helt riktige. Finner dere dem? Bildet ble generert vinteren 2024.

Person på ski i et fjellandskap. Personen har to staver i den ene hånda. KI-foto. — KI-generert foto. Image: Albertine Aaberge / CC0

Ledeteksten til bildet er som følger:

Skier, a person dressed in vibrant ski attire, gracefully gliding down a snow-covered mountain slope. The skier is leaning forward, their body in perfect alignment as they navigate through a series of sharp turns. The snow beneath them sparkles in the sunlight, the powder spraying up behind their skis with each turn. The skier's face is filled with determination and excitement, their eyes focused on the path ahead. The surrounding mountains rise majestically, their peaks covered in a blanket of white. The crisp mountain air is filled with the sound of skis slicing through the snow and the occasional whoops of joy from fellow skiers.

Style: Photography (Action Sports)

The photograph will be captured using a high-speed camera to freeze the fast-paced action of the skier. The composition will emphasize the skier's dynamic movement and the breathtaking mountain landscape. The camera settings will be adjusted to capture the details of the snow and the skier's vibrant attire, while maintaining a sense of speed and energy. (OpenAI, 2023)

6. Verkshøyde

I loven om opphavsrett finner vi begrepet verkshøyde. Skal du ha opphavsrett til ditt eget bilde, må bildet ha verkshøyde. Det betyr at du skal ha bidratt med en individuell og skapende innsats for å lage det. Når et bilde har verkshøyde, er det et åndsverk og dermed også beskyttet av åndsverkloven.

Forklar hverandre hva verkshøyde er, og bruk eksempler på egne arbeid med medieuttrykk.
Hvor i arbeidsprosessen med et KI-bilde ligger det mest "individuell og skapende innsats"?
Hva skal til for at et KI-generert bilde har verkshøyde?

7. Bygg et KI-bilde i flere lag

Lag en skisse til et reklamebilde for en drikk. Bruk tre lag i Photoshop for å bygge bildet: ett lag for bakgrunnen, ett lag for produktet (hovedmotivet) og ett lag for annet innhold.

A. Velg et arbeidsområde med "Rectangular Marquee tool". Dere får opp en tekstboks der dere kan skrive en ledetekst (prompt) for å generere et bilde.

Merking i et tomt dokument med en tekstboks der man kan skrive inn kommando til bildegenerering. Skjermutklipp. — Image: Adobe / Restricted right of use

Brusboks på en hvit firkantet boks. Grønn bakgrunn. KI-illustrasjon. — Bruk KI i Photoshop for å skissere opp et reklamebilde. KI-generert illustrasjon. Image: Albertine Aaberge / CC0

B. Generer så mye av innholdet til hvert av lagene som overhodet mulig. Prøv dere fram med ulike ledetekster.

C. Hva kommer enkelt på plass? Hva er vanskeligere å få til? Hvilke ledetekster fungerer, hvilke fungerer ikke?

D. Diskuter i klassen: Hva er fordeler og ulemper med å bruke lagdeling i KI-genererte bilder sammenliknet med helgenererte bilder?

8. Diskuter profesjonell bruk av KI-genererte bilder

I hvilke sammenhenger er det fornuftig at mediene bruker KI-genererte bilder?

Finn gjerne konkrete eksempler på profesjonell bruk og diskuter.

Verktøy brukt for å generere bilder til denne artikkelen

Adobe Photoshop med funksjonen "Generate"
Adobe Firefly
DALL-E i Copilot
Adobe Firefly prompt generator på FlowGPT

Kilder

AI art caricatures and public characters in AI art. (2024, 11. februar). I Wikimedia Commons. https://commons.wikimedia.org/wiki/AI_art_caricatures_and_public_characters_in_AI_art#

Bårdgård, T. (2023, 12. september). Lag bilder med kunstig intelligens. NDLA. https://ndla.no/article/38842

Chicago god. (2022, 23. desember). Midjourney Version 4.jpg [KI-illustrasjon]. Wikimedia Commons. https://commons.wikimedia.org/wiki/AI_art_caricatures_and_public_characters_in_AI_art#/media/File:Midjourney_Version_4.jpg

OpenAI. (2023). Adobe Firefly prompt generator (12. april versjon) [Stor språkmodell]. FlowGPT. https://flowgpt.com/p/adobe-firefly-prompt-generator

Hovde, K.-O. & Lem, G. H. (2021, 27. desember). Verkshøyde. I Store norske leksikon. https://snl.no/verkshøyde