OCR; fra billed til tekst

OCR står for Optical Character Recognition og er en form for maskinlæring, der sammenligner al krimskramset i dens søgefelt med hvad den ved om bogstaver. Her bruger jeg en papiravis, et vejskilt og et menukort som eksempler til hvad det kan bruges til.

Hent papiravisen ind i computeren til videre bearbejdning

Det hænder, at jeg ikke kan copypaste en tekst (typisk fra papir), men må ty til en løsning “udenom”, hvor jeg bruger Google Lens. Google Lens bruger billedgenkendelse, altså maskinlæring, til at “læse” skrift.

Her er et foto af en (papir-)avisartikel, som jeg åbner i Google Photos (hvor Lens er indbygget) og trykker på “Lens”, der begynder at arbejde (de små stjerner/prikker viser, at maskinlæringen er ved at finde hoved og hale i fotoet).
I “Lens” finder jeg fanen “tekst” og “kopier tekst”, som jeg markerer med blåt for at udvælge kun den del af teksten (Lens’  hvide markering), som jeg ønsker at kopiere. Jeg kopierer “til computer”

Og her er det ikke-så-gode resultat

Her er “vinderfotoet” ift det bedste resultat


Det kræver naturligvis fortsat tilretning, men værktøjet giver håb for fremtiden og skal nok blive nyttigt.

Oversæt vejskiltet, så det kan læses

Et andet eksempel på billed-til-tekst er med et ekstra lag af oversættelse. Mit nederlandske er lidt rustent, så jeg bad Google Translate som app om at oversætte skiltet til noget jeg forstod. Det gjorde den så:

Følgende forslag kom Google Translate-appen med, da jeg bad om oversættelse til dansk:

  • Cyklister på kørebanen
  • Cyklister lop kørselsforbud
  • Cyklister på vejbanen

Det er da i det store hele ok og forståeligt, omend der stadig er et stykke vej inden oversættelserne sidder lige i skabet.

Oversæt og lyt til menukortet

Forestil dig et menukort du ikke kan læse og du leder efter noget bestemt eller prøver at undgå noget? SÅ er det rart med en oversætter som Google Lens, så man undgår koriander eller hvad man nu ikke bryder sig om!

Leave a Comment

Your email address will not be published. Required fields are marked *

EnglishGermanDanish