Spring til indhold

Sådan virker billedgenkendelse

    Der stod jeg så, midt i min søsters have, og blev spurgt hvad det var for lilla blomster? “Øhh“, var mit første og mest kvalificerede svar på det tidspunkt.

    Men så tog jeg et foto  af blomsterne og lod Google Lens hjælpe:

    Først lavede Lens et overblik over fotoet, som man kan se på markeringen, og udvalgte ét fremtrædende element (der, hvor prikken er)

    Jeg ignorerede prikken og flyttede markeringen (de hvide bøjede streger i hjørnerne af fotoet) til de lilla blomster og trykkede på “Søg” igen. Google foreslog “Lærkesporer”

    Jeg tør stadig ikke lægge hovedet på blokken for om det er lærkesporer, men nu har jeg et mere kvalificeret gæt end før, som jeg kan arbejde videre med hvis det bliver vigtigt at finde ud af hvad det er for blomster.

    Blomsterne er derfor nu døbt: “Vi tror det er lærkesporer

    Men hvad er billedgenkendelse?

    Forget it! Det vil jeg slet ikke prøve at svare på (det ved jeg i øvrigt heller ikke), men jeg kan godt fortælle hvordan det virker!

    Først tager du en masse billeder af “noget” og lærer maskinen “Dette er en hotdog“, “Dette er ikke en hotdog“, “Dette er ikke en hotdog“, “Dette er en hotdog“, “Dette er ikke en …..” osv (alt efter hvad der er på billedet, selvfølgelig) og når maskinen er blevet fodret nok med billeder af hotdogs og endnu flere billeder af ikke-hotdogs, lærer den sig selv hvad den synes, der er forskellen på hotdogs og ikke-hotdogs, så den fremover kan gætte selv ud fra det datasæt (dvs de billeder) den har haft lejlighed til at lære om (som den er blevet fodret med).
    Prøv selv med ArtBot, som simulerer netop maskinlæring til billedgenkendelse.

     

     

     

     

    Tre eksempler

    Et eksempel på brug af billedgenkendelse er kameraet i brugsen, som kan kende forskel på  smilende og ikke-smilende ansigter:

     

    Maskinen her sorterer de grønne tomater fra de røde, fordi den kan kende forskel på farverne.

     

    I TV-serien Silicon Valley nævnes en “Not hotdog app” som jeg nævnede tidligere. Klippet viser nøjagtigt, hvor “dum” (eller præcis, om man vil) maskinen er.