Hopp til innhald
Øvelse

Øv deg på maskinlæring med Teachable Machine

Maskinlæring skjer i tre trinn: samle inn data, trene modellen og teste modellen. Teachable Machine hjelper deg med å forstå heile prosessen. Her skal du trene opp ein maskinlæringsmodell til å kjenne igjen bilete.

Kva er maskinlæring?

Maskinlæring er ei grein av kunstig intelligens (KI) og handlar om at maskiner sjølve tileignar seg evna til å utføre oppgåver eller løyse problem. I staden for å gi datamaskina detaljerte instruksjonar om kva ho skal gjere, får ho store datasett med algoritmar som analyserer og utforskar samanhengar i datasettet.

Teachable Machine til rettleidd maskinlæring

Du skal bruke Teachable Machine (TM) og øve deg på rettleidd maskinlæring. I utviklinga av modellen må vi gjennom tre steg: samle inn data, trene modellen og teste modellen. Aller først må du opprette eit prosjekt.

1. Forskjell på katt og hund

Du skal bruke TM for å lage ein maskinlæringsmodell som kan kjenne igjen bilete av kattar og hundar. Gå til Teachable Machine. Opprett eit nytt prosjekt. Vel "Image Project" og "Standard image model".

A. Samle inn data

Først må du ha eit datasett som består av bilete av kattar og hundar. Du kan eventuelt velje å bruke bilete av andre dyr eller av bestemde gjenstandar.

  • Søk etter bilete av hundar og kattar, og last dei ned. Du kan velje kor mange bilete du vil ha, men vi tilrår at du har minst 20 av kvar. Jo fleire bilete du har, jo betre vil modellen bli til å kjenne igjen mønster og greie å skilje mellom bilete av hund og katt.

  • Set av nokre bilete, fem–seks i kvar kategori, som treningsdata. Bruk resten av bileta, altså den største delen av bileta, som testdata

Tips

Vil du trene opp ein verkeleg god modell, kan du laste ned eit datasett frå kaggle.com. Her finn du datasett med fleire hundre bilete av hundar, kattar og anna.

B. Tren modellen

No kan du legge inn testdataa i TM. Du treng to grupper. Du kan kalle den eine gruppa for "Kattar" og den andre gruppa for "Hundar". Legg så bileta dine inn i rett gruppe, og trykk på "Train Model"-knappen. Teachable Machine vil då analysere dataa dine og lage ein modell.

C. Test modellen

Når modellen er ferdig å trene, kan du teste han for å sjå korleis han fungerer. Finn fram bileta du har sett av til testing. Du kan velje "Webcam", då må du halde opp bileta framfor webkameraet, eller du kan velje "File" og dra eit og eit bilete inn i "Preview"-boksen. Du får dei beste resultata ved å gjere det siste.

For kvart bilete du testar, får du opp berekninga til modellen i prosent på kor sikker han er på om biletet er katt eller hund, ut frå datasettet han er trent på.

Test: Kva skeivskap har treningsdataa?

Når det er systematiske skeivskapar i treffsikkerheita på ein maskinlæringsmodell, seier vi at han har skeivskapar eller bias.

Finn bilete av hundar eller kattar av ulik rase eller med ulik farge på pelsen. Test bileta i modellen du har laga, og skriv ned resultata.

  • Er modellen like treffsikker på alle bileta, eller er det forskjellar? Sjå på treningsbileta og biletet du testar, kva kan forklaringa vere?

  • Undersøk om nokre hunderasar er overrepresenterte i forhold til andre i treningsdataa, og om det kan vere grunnen til at dei lettare blir kjende igjen.

Skeivskapar i datasett

Tenk deg at treningsbileta var av kvinner og menn og av menneske med ulike etnisitetar.

Korleis kan kulturell skeivskap (bia) i maskinlæringsmodellar som skal kjenne igjen menneske, vere problematiske? Diskuter med ein medelev og kom fram til døme.

2. Modell av stein, saks, papir

I denne oppgåva skal du trene ein modell som skal kjenne igjen handgestane som blir brukte i leiken stein, saks, papir. Målet er å lage modellen så treffsikker som mogleg. For å få til dette treng modellen mange ulike bilete av handgestane.

Lag ein ny modell for biletgjenkjenning og opprett tre kategoriar: "Stein", "Saks" og "Papir".

Bruk webkameraet ditt for å ta bilete av dei ulike handgestane. Ta bilete av kvar handgest frå ulike vinklar og med ulike utsnitt.

Det er ein fordel om du peiker webkameraet ditt mot ein nøytral bakgrunn når du trener og testar modellen. Viss det er ting som skjer i bakgrunnen på bileta dine, kan dette gi dårlegare resultat.

Tren modellen og test han. Klarer du å lage han 100 prosent treffsikker?

3. Test ein biletmodell

Vi finn skeivskapar i alle maskinlæringsmodellar. I denne oppgåva skal du prøve å oppdage skeivskapar i NDLAs biletrobot eller tilsvarande verktøy, som til dømes Microsoft Copilot.

Biletroboten i NDLA bruker bildegenereringsmodellen DALL-E 3. I treningsprosessen til DALL-E har han registrert og behandla informasjonen om millionar av bilete frå internett. Den er derfor best på å generere bilete som liknar på bileta han har "sett" mest av.

  • Kva bilete trur du bildegenereringsmodellen har sett mykje av, og kva har han sett mindre av? Diskuter med ein medelev og skriv ned stikkord.

  • Prøv å generere noko som er typisk norsk og noko som er typisk amerikansk. Kva bilete er best og/eller mest truverdige?

Relatert innhald

Fagstoff
Kunstig intelligens

Kunstig intelligens inneber at maskinene rundt oss blir stadig "smartare" og i stand til å løyse oppgåver som berre menneske kunne løyse tidlegare.

Skrive av Rune Mikael Birkeland.
Sist fagleg oppdatert 10/21/2024