Øv deg på maskinlæring med Teachable Machine

Maskinlæring er en gren av kunstig intelligens (KI) og handler om at maskiner selv tilegner seg evnen til å utføre oppgaver eller løse problemer. I stedet for å gi datamaskinen detaljerte instruksjoner om hva den skal gjøre, får den store datasett med algoritmer som analyserer og utforsker sammenhenger i datasettet.
Teachable Machine til veiledet maskinlæring
Du skal bruke Teachable Machine (TM) og øve deg på veiledet maskinlæring. I utviklingen av modellen må vi gjennom tre steg: samle inn data, trene modellen og teste modellen. Aller først må du opprette et prosjekt.
Du skal bruke TM for å lage en maskinlæringsmodell som kan gjenkjenne bilder av katter og hunder. Gå til Teachable Machine. Opprett et nytt prosjekt. Velg "Image Project" og "Standard image model".
A. Samle inn data
Først må du ha et datasett som består av bilder av katter og hunder. Du kan eventuelt velge å bruke bilder av andre dyr eller av bestemte gjenstander.
Søk etter bilder av hunder og katter, og last dem ned. Du kan velge hvor mange bilder du vil ha, men vi anbefaler at du har minst 20 av hver. Jo flere bilder du har, jo bedre vil modellen bli til å gjenkjenne mønstre og greie å skille mellom bilder av hund og katt.
Sett av noen bilder, fem–seks i hver kategori, som treningsdata. Bruk resten av bildene, altså den største andelen av bildene, som testdata.
Tips
Vil du trene opp en virkelig god modell, kan du laste ned et datasett fra kaggle.com. Her finner du datasett med flere hundre bilder av hunder, katter og annet.
B. Tren modellen
Nå kan du legge inn testdataene i TM. Du trenger to grupper. Du kan kalle den ene gruppa for "Katter" og den andre gruppa for "Hunder". Legg så bildene dine inn i riktig gruppe, og trykk på "Train Model"-knappen. Teachable Machine vil da analysere dataene dine og lage en modell.

C. Test modellen

Når modellen er ferdig å trene, kan du teste den for å se hvordan den fungerer. Finn fram bildene du har satt av til testing. Du kan velge "Webcam", da må du holde opp bildene foran webkameraet, eller du kan velge "File" og dra ett og ett bilde inn i "Preview"-boksen. Du får de beste resultatene ved å gjøre det siste.
For hvert bilde du tester, får du opp modellens beregning i prosent på hvor sikker den er på om bildet er katt eller hund, ut fra datasettet den er trent på.
Test: Hvilken skjevhet har treningsdataene?
Når det er systematiske skjevheter i treffsikkerheten på en maskinlæringsmodell, sier vi at den har skjevheter eller bias.
Finn bilder av hunder eller katter av ulik rase eller med forskjellig farge på pelsen. Test bildene i modellen du har laget, og skriv ned resultatene.
Er modellen like treffsikker på alle bildene, eller er det forskjeller? Se på treningsbildene og bildet du tester, hva kan forklaringen være?
Undersøk om noen hunderaser er overrepresenterte i forhold til andre i treningsdataene, og om det kan være grunnen til at de lettere blir gjenkjent.
Skjevheter i datasett
Tenk deg at treningsbildene var av kvinner og menn og av mennesker med ulike etnisiteter.
Hvordan kan kulturell skjevhet (bias) i maskinlæringsmodeller som skal gjenkjenne mennesker, være problematiske? Diskuter med en medelev og kom fram til eksempler.
I denne oppgaven skal du trene en modell som skal gjenkjenne håndgestene som brukes i leken stein, saks, papir. Målet er å lage modellen så treffsikker som mulig. For å få til dette trenger modellen mange ulike bilder av håndgestene.
Lag en ny modell for bildegjenkjenning og opprett tre kategorier: "Stein", "Saks" og "Papir".
Bruk webkameraet ditt for å ta bilder av de ulike håndgestene. Ta bilder av hver håndgest fra ulike vinkler og med ulike utsnitt.
Det er en fordel om du peker webkameraet ditt mot en nøytral bakgrunn når du trener og tester modellen. Hvis det er ting som skjer i bakgrunnen på bildene dine, kan dette gi dårligere resultater.
Tren modellen og test den. Klarer du å lage den 100 prosent treffsikker?
Vi finner skjevheter i alle maskinlæringsmodeller. I denne oppgaven skal du prøve å oppdage skjevheter i NDLA sin bilderobot eller tilsvarende verktøy, som for eksempel Microsoft Copilot.
Bilderoboten i NDLA bruker bildegenereringsmodellen DALL-E 3. I treningsprosessen til DALL-E har den registrert og behandlet informasjonen om millioner av bilder fra internett. Den er derfor best på å generere bilder som likner på bildene den har "sett" mest av.
Hvilke bilder tror du bildegenereringsmodellen har sett mye av, og hvilke har den sett mindre av? Diskuter med en medelev og skriv ned stikkord.
Prøv å generere noe som er typisk norsk og noe som er typisk amerikansk. Hvilke bilder er best og/eller mest troverdige?
Relatert innhold
Kunstig intelligens innebærer at maskinene rundt oss blir stadig "smartere" og i stand til å løse oppgaver som bare mennesker kunne løse tidligere.
Bruk tekst-til-bilde-verktøy basert på kunstig intelligens til å lage forskjellige typer visuelle uttrykk.