Ledetekster og generering av KI-bilder - Teknologiforståelse (IM-IKM vg1) - NDLAHopp til innhold
Veiledning
Ledetekster og generering av KI-bilder
Gode KI-genererte bilder avhenger av en godt skrevet ledetekst (prompt). Her får du tips og eksempler på hvordan du lager vellykkede ledetekster ved bildegenerering.
Hvordan ledetekst blir til genererte KI-bilder
KI-modeller for bildegenerering trenes opp ved hjelp av en stor mengde ekte bilder med tilhørende stikkord (tags). Stikkordene er ofte enkle og som oftest på engelsk, som "tiger, cub, walking, looking at camera", og de beskriver det sentrale i hvert bilde.
Når en KI-modell har sett de samme stikkordene mange ganger (fordelt på forskjellige bilder), vil den klare å koble dem med det som vises, og finner ut hvilke variasjoner som er naturlige innenfor hvert stikkord.
Et eksempel er at hunder kan ha ulike størrelser og fasonger, men alle hunderaser har fire bein, hale, to ører og en snute. Hvis du er mer spesifikk, for eksempel med stikkordet dalmatiner, vil modellen få med det mer spesifikke for dalmatinere, som de mørke flekkene, den korte pelsen og størrelsen.
Å formulere ledetekster
Foreløpig er de fleste KI-bildemodeller trent på engelske stikkord (tags). Med mindre en spesifikk modell eller tjeneste reklamerer med språkstøtte til andre språk, anbefaler vi derfor at du bruker engelske stikkord når du skal lage ledeteksten din.
For å lage gode ledetekster må du vite hvilke stikkord du ønsker modellen skal fokusere på når den genererer.
Her er noen tips til hvordan du kan arbeide med ledetekster:
Skriv nøyaktige beskrivelser.
Ikke lag for lange ledetekster.
Generer flere bilder med samme ledetekst.
Gjør små variasjoner i ledeteksten og generer nye bilder for hver gang; test deg fram.
Studer andres ledetekster og bilderesultater for å få inspirasjon til hva som kan være med i en ledetekst.
Språkmodellen vil generere ulike bilder for hver bestilling selv om du ikke endrer ledeteksten, og forskjellige KI-modeller vil respondere ulikt på de samme ledetekstene.
Beskrivelse av bildetype og stil
Hva vil du lage? Skal det se ut som et fotografi, et oljemaleri eller kanskje en akvarell? Skal bildet være i farger, gråskala eller svart-hvitt? Er det en bestemt stil du ønsker at bildet skal ha?
8-bit art, abstract expressionism, African art, Art Deco, Art Nouveau, Baroque, Byzantine art, Chinese brush painting, classical art, conceptual art, Constructivism, Cubism, cyberpunk art, Dadaism, digital art, Egyptian art, Expressionism, fantasy art, fashion illustration, Fauvism, Futurism, geometric abstraction, Gothic art, hyperrealism, Impressionism, modern art, Pop Art, Renaissance, Rococo, romantic landscape, Romanticism, street art, surrealism, symbolism, tattoo art, vaporwave, watercolour painting
Spesifikk og generell beskrivelse av motiv
Hvilket motiv vil du ha på bildet? Her kan du enten være veldig spesifikk, for eksempel "photo of a large black dog and a small brown dog walking together", eller du kan være mer generell: "photo of two dogs on a trip".
For mange beskrivelser kan forvirre modellen og gjøre at bildene ikke blir gode. Forsøk derfor å være konsis og avgrens hva du ønsker å vise i bildet.
Presise adjektiver
Kombinerer du valg av motiv med presise adjektiver, øker sannsynligheten for et godt resultat av bildegenereringen.
Hvis en eller flere personer skal vises i bildet, bør du skrive nøyaktige beskrivelser. Dersom motivet er i bevegelse, bør du beskrive bevegelsen.
Eksempler på portrettbeskrivelser
action shot, beauty shot, candid action shot, candid portrait, character portrait, close-up portrait, couple portrait, dramatic portrait, environmental portrait, family portrait, formal portrait, full body portrait, glamour portrait, group portrait, half-body portrait, headshot, high-key portrait, informal portrait, lifestyle portrait, low-key portrait, profile portrait, self-portrait, silhouette portrait, studio portrait, three-quarter portrait
Beskriv omgivelsene til motivet
Hva er omgivelsene i bildet? Hvordan iscenesetter du motivet ditt? Er det en storby eller ei sandstrand? Husk at du også kan definere bakgrunnen for motivet som uklar eller hvit.
Eksempler på omgivelser
abandoned carnival, African savannah, alien landscape, Alpine meadow, Amazon rainforest, ancient ruins, ancient temple, Antarctic ice shelf, Arabian desert, Arctic tundra, autumn woods, bamboo forest, canyon river, castle drawbridge, castle ruins, castle on a hill, cherry blossom grove, coastal cliffs, coral atoll, countryside farm, crystal caves, cyberpunk alley, cyberpunk dystopia, dark alley at night, deep space nebula, desert dunes, desert mirage, desert oasis, enchanted forest, fields of lavender, firefly-lit garden, forgotten cemetery, frozen wasteland, futuristic cityscape, ghostly shipwreck, Gothic cathedral, Gothic cemetery, Greek island village, Greek ruins, haunted forest, haunted mansion, hidden gorge, hidden waterfall, industrial factory, Japanese tea garden, lush forest, Martian landscape, Mayan pyramids, medieval castle, Mediterranean villa, misty swamp, modern art gallery, mountain lake, Nordic fjords, northern lights, old fishing village, pirate cove, rainbow waterfall, redwood forest, Renaissance courtyard, Roman amphitheatre, rustic cabin, rustic covered bridge, rustic windmill, savannah, savannah grasslands, sci-fi space station, snow-covered mountains, space colony, starlit night sky, steampunk city, Stonehenge, subterranean labyrinth, suburban neighbourhood, sunflower fields, sunset pier, Swiss Alps, tornado storm, treetop canopy, tropical beach, underground bunker, underground caves, underwater coral reef, underwater grotto, urban alleyway, Viking longship, vineyard in fall, volcanic crater, Wild West saloon, Zen garden
Plassering av detaljer i ledetekster
Prøv deg fram for å finne en plassering av detaljene i bildet du genererer. Detaljer om farger, type belysning, fokuspunkt og stemning havner ofte mot slutten av en ledetekst. Ofte kan det gi gode resultater å plassere viktige detaljer tidlig i ledeteksten.
Fotofaglige detaljer
Fotofaglige beskrivelser som dybdeskarphet (narrow, shallow eller deep depth of field) kan være hjelpsomt. Også beskrivelser hentet fra kamerainnstillinger, som lukkertid "F.1.8" eller "F.20", beskrivelse av linsetype eller ISO-verdier kan legges inn i bestillingen av et bilde.