Hopp til innhald

Oppgåver og aktivitetar

Lag bilete med kunstig intelligens

Kunstig intelligens (KI/AI) blir brukt i mange samanhengar, og nye bruksområde blir stadig utvikla. I denne oppgåva skal du bruke eit KI-biletverktøy basert på tekst-til-bilete for å lage visuelle uttrykk.
Tilsynelatande eit maleri som viser ei gammaldags vindmølle, nokre lauvtre og ei lita elv. Illustrasjon.
Opne bilete i eit nytt vindauge

Generering av bilete med KI

KI-biletverktøy kjem i mange variantar. Nokre er proprietære og krev betalingsabonnement. Andre har open kjeldekode, men krev at du sjølv ordnar maskinvara dei skal køyrast på.

Alternativ 1, Adobe Photoshop, må du ha lisens for å bruke, mens alternativa 2 og 3 har modellar og brukargrensesnitt frå Stable Diffusion. Desse er utgitt under open-kjeldekode-lisens, og du set dei derfor opp sjølv, så dei køyrer på leigd eller gratis skymaskinvare eller eiga maskinvare.

1. Biletgenerering med Adobe Photoshop

Adobe Photoshop krev tilgang til Adobe CC-pakken og har enno avgrensa funksjonalitet. Kor mange bilete ein kan generere, kjem an på lisenstypen.

Adobes bilet-KI-verktøy eignar seg til å modifisere bilete og lage nye enkeltelement i bilete med, men det kan få problem med meir komplekse bilete.

Når Photoshop er lasta ned, kan du opne det. Du kan opne eit eksisterande bilete eller lage eit nytt dokument.

Du kan no velje eit område ved hjelp av "Lasso tool" eller "Rectangular Marquee tool", som er oppe i sidemenyen til venstre. Når du har valt eit område, vil du få opp ein tekstboks der du kan skrive ein (prompt) for KI-biletgenerering.

Merking i eit tomt dokument med ein tekstboks der ein kan skrive inn kommando til biletgenerering. Skjermbilete.

Leieteksten må foreløpig vere på engelsk. Når du er fornøgd, trykker du på entertasten eller på "Generate"-knappen. Tre alternativ vil no bli genererte.

Eit KI-generert bilete av ein svart kvalp. Biletet ser ut som eit foto. Ein tekstboks under kvalpen viser at dette biletet er alternativ tre av tre. Skjermbilete.

Dersom du ikkje er fornøgd med nokon av bileta, kan du trykke på "Generate" for å få laga fleire alternativ, eller du kan skrive om leieteksten.

2. Biletgenerering ved hjelp av Google Colab

Google Colab krev innlogging med ein privat Google-konto. Tenesta kan brukast gratis, men gratisversjonen kan vere ustabil eller utilgjengeleg i periodar.

1. Gå til Colab-dokumentet for å bruke ComfyUI via Google Colab.

Dersom du ikkje allereie er pålogga, må du logge inn med ein privat Google-konto for å få starte Colab-dokumentet.

Nettsidedokument delt inn i fleire seksjonar med kode og liknande i rader nedover. Skjermbilete.
Opne bilete i eit nytt vindauge

Google Colab-dokument kan verke veldig kompliserte med kode og mange alternativ. Heldigvis er det berre nokre få detaljar som må justerast før vi får i gang biletgenereringstenesta.

2. Øvst under "Environment Setup" treng du ikkje gjere nokon endringar. Trykk på den vesle startknappen rett under tittelen.

Overskrifta Environment Setup med eit ikon med ein startknapp under. Skjermbilete.
Opne bilete i eit nytt vindauge

Du vil få opp éi til to åtvaringar om at dokumentet (Notebook) ikkje er autorisert av Google, og at det kan vere farleg. I begge tilfelle går du vidare.

Du vil no bli tildelt serverkapasitet hos Google for å køyre Colab-dokumentet. Du kan sjå status for tildeling av ressursar oppe i høgre hjørne. Står denne på "Busy", kan det vere at du må prøve igjen litt seinare.

Du ser at denne delen av dokumentet er ferdigkøyrd når startknappen returnerer til ei statisk framoverpil.

3. Lenger ned i det grøne tekstområdet merkt "#checkpoints" kan du velje kva modellar du vil ha tilgjengeleg. Du kan ikkje aktivere for mange samtidig i gratisversjonen av Google Colab.

Som standard blir det foreslått stable-diffusion-v1.5 og ein tilleggsmodell for denne. Desse blir viste i kvitt. Deaktiver dei ved å skrive inn "#" først i kvar av linjene.

Vi foreslår at du bruker SDXL ved å fjerne "#"-markeringa framfor "sd_xl_base" og "sd_xl_refiner", desse er langt oppe i lista.

Tekstliste over modellar, to av dei er valde. Skjermbilete.
Opne bilete i eit nytt vindauge

Når du har fjerna og valt modellane du ønsker, trykker du på startknappen ved sida av "#checkpoints". Dette lastar modellane ned til Colab-instansen. Du ser at denne delen er ferdig når startknappen returnerer til ei statisk framoverpil.

4. Når modellane er lasta ned, går du ned til seksjonen "Run ComfyUI with cloudflared". Trykk på startknappen. Denne prosessen vil køyre kontinuerleg, så følg med på teksten under til du ser "This is the URL to access ComfyUI".

Trykk på denne lenka for å opne ComfyUI i ein ny nettlesarfane.

5. Brukargrensesnittet til ComfyUI er delt inn i samankopla boksar. Kvar boks har ein spesifikk funksjon, og boksane kan koplast saman på forskjellige vis avhengig av kva type oppgåve som skal løysast, til dømes om det skal genererast eit bilete basert på tekst eller eit anna bilete. Eit slikt oppsett av samankopla boksar blir kalla for ein "workflow".

I standard "workflow" kan du bestemme kva modell du vil bruke ved å velje han i nedtrekkslista til venstre under "Load Checkpoint".

Nettlesarvindauge med ei rekke boksar som er kopla saman med leidningar. Forskjellige boksar gjer forskjellige oppgåver under KI-biletgenereringa. Lengst til høgre er eit KI-generert bilete av ei mus. Skjermbilete.
Opne bilete i eit nytt vindauge

Litt til høgre er det to tekstboksar (merkte "Clip Text encoder"). I den øvste tekstboksen skriv du inn kva som skal visast i biletet (positive prompt), og i den nedste skriv du kva du ikkje ønsker i biletet (negative prompt).

I feltet "Empty latent image" bestemmer du storleiken på biletet, vi tilrår 1024 x 1024 for SDXL-modellar.

I "KSampler" kan du justere kor mange steg modellen skal køyre, 20–30 er normalt. Det er òg fleire andre felt som kan justerast seinare, om du vil det.

Nede til høgre er eit kontrollpanel, her kan du laste inn andre arbeidsflytar (workflows) eller nullstille den du har. Du kan òg køyre biletgenereringa. Dette gjer du ved å trykke "Queue Prompt".

Den første gongen du lagar eit bilete, vil modellen lastast inn i minnet hos Colab. Dette tek litt tid, deretter vil nye bilete kunne lagast hurtigare.

Bileta du genererer, kan du laste ned ved å høgreklikke på biletet og velje "Save Image".

3. Biletgenerering på eiga maskinvare

Dersom du har ei datamaskin med eit moderne Nvidia-skjermkort (3060 eller nyare med 8 GB eller meir skjermminne), kan du køyre Stable Diffusion-modellar på eiga maskinvare. Denne rettleiinga tek utgangspunkt i at Windows blir brukt som operativsystem.

1. Last ned ComfyUI frå GitHub. Den "portable standalone build for Windows" som dei har, er den enklaste måten å få installert ComfyUI på.

2. Dersom du ikkje har 7-Zip eller eit anna program som kan pakke ut installasjonsfilene, kan du laste ned dette ned frå 7-Zip sine heimesider.

3. Pakk ut ComfyUI-filene og legg dei ein stad du finn dei igjen. Du skal ha ei mappe som heiter "ComfyUI_windows_portable" med fleire filer og mapper i.

Mappe i Windows som viser fleire filer og undermapper. Skjermbilete.
Opne bilete i eit nytt vindauge

4. Last ned modellane du ønsker å bruke til biletgenereringa. Til dømes kan dei vere SDXL base og SDXL refiner frå Hugging Face. Filene er ganske store, og det vil ta litt tid å laste ned dei.

5. Når filene er lasta ned, legg du dei over i undermappa til ComfyUI-installasjonen din, til dømes "ComfyUI_windows_portable\ComfyUI\models\checkpoints\OfficialStableDiffusion".

6. Gå tilbake til "ComfyUI_windows_portable" og start ComfyUI ved å dobbeltklikke på "run_nvidia_gpu.bat".

Eit leidetekstvindauge vil opne seg, og via dette køyrer programmet. Når ComfyUI er ferdig, vil eit nettlesarvindauge opne seg.

7. Brukargrensesnitt til ComfyUI er delt inn i boksar som er kopla saman. Kvar boks har ein spesifikk funksjon, og boksane kan koplast saman på forskjellige vis avhengig av kva type oppgåve som skal løysast, til dømes om det skal genererast eit bilete basert på tekst eller eit anna bilete. Eit slikt oppsett av samankopla boksar kallar vi for ein "workflow".I standard "workflow" kan du bestemme kva for ein modell du vil bruke ved å velje han i nedtrekkslista til venstre under "Load Checkpoint".

Nettlesarvindauge med fleire boksar som er kopla saman med leidningar. Forskjellige boksar gjer forskjellige oppgåver under KI-biletgenereringa. Lengst til høgre er eit KI-generert bilete av ei mus. Skjermbilete.
Opne bilete i eit nytt vindauge

Litt til høgre er det to tekstboksar (merkte "Clip Text encoder"). I den øvste tekstboksen skriv du inn kva som skal visast i biletet (positive prompt), og i den nedste skriv du kva du ikkje ønsker i biletet (negative prompt).

I feltet "Empty latent image" bestemmer du storleiken på biletet, vi tilrår 1024 x 1024 for SDXL-modellar.

I "KSampler" kan du justere kor mange steg modellen skal køyre, 20–30 er normalt. Det er òg fleire andre felt som du kan justere seinare, dersom du vil det.

Nede til høgre er kontrollpanelet, her kan du laste inn andre arbeidsflytar (workflows) eller nullstille den du har. Du kan òg køyre biletgenereringa. Dette gjer du ved å trykke "Queue Prompt".

Nettlesarvindauge med mange boksar som er kopla saman. Lengst til høgre er eit KI-generert bilete av ein hjort. Skjermbilete.
Opne bilete i eit nytt vindauge

Den første gongen du lagar eit bilete, må modellen lastast inn i arbeidsminnet til maskina. Dette tek litt tid, men seinare vil du få nye bilete fortare.

Bileta du generer, kan du laste ned ved at du høgreklikkar på dei og vel "Save Image".

Oppgåve

Når du har eit program eller ei teneste for AI/KI-biletgenerering tilgjengeleg, kan du starte med denne oppgåva. Hugs at leietekstane (prompts) må vere på engelsk. Du må rekne med å generere fleire bilete med justerte leietekstar for kvar oppgåve.

A) Nedanfor får du fem produksjonsoppgåver. I arbeidet med desse lagrar du minst eitt bilete per oppgåve som du er fornøgd med, og eitt til to bilete som du ikkje er fornøgd med eller fann feil med.

  1. Generer eit foto av ein landskapstype du sjølv liker.

  2. Generer eit foto av ein bekk eller ei elv.

  3. Generer eit foto av ein landstrykar (hobo) på eit tog. (Kommentar: Vi har med vilje foreslått eit litt gammaldags ord her for å vise at modellen sannsynlegvis vil generere bilete som samsvarer med stereotypiar som finst i verkelegheita.)

  4. Generer eit foto av ein modell som viser fram dongeribukser (denim jeans).

  5. Generer ei teikning (sketch) som kunne ha vore brukt i ei barnebok.

B) Kva for eit av alle bileta du genererte, er du mest fornøgd med? Grunngi kvifor.

C) Gå gjennom bileta du ikkje var fornøgd med eller fann feil med. Kva feil fann du, og er det feil som går igjen?

Ekstraoppgåver

  1. Generer eit måleri (painting) etter ein stil frå ein kjend død målar. Måleriet skal vise noko som ikkje eksisterte då kunstnaren levde.

  2. Generer ein logo for skulen din. Logoen bør vere heilskapleg og ikkje ha for mange detaljar.

  3. Finn ein annan ComfyUI-workflow og test denne. Beskriv kva du finn ut.

Relatert innhald

CC BY-SASkrive av Tron Bårdgård.
Sist fagleg oppdatert 21.06.2022

Læringsressursar

Nye opplevingar med teknologi