Wat is optiese karakterherkenning (OCR)?

INHOUDSOPGAWE:

Wat is optiese karakterherkenning (OCR)?
Wat is optiese karakterherkenning (OCR)?
Anonim

Optical Character Recognition (OCR) verwys na sagteware wat 'n digitale weergawe van 'n gedrukte, getikte of handgeskrewe dokument skep wat rekenaars kan lees sonder dat dit nodig is om die teks handmatig in te tik of in te voer. OCR word gewoonlik op geskandeerde dokumente in PDF-formaat gebruik, maar kan ook 'n rekenaarleesbare weergawe van teks binne 'n prentlêer skep.

Wat OCR is

OCR, ook na verwys as teksherkenning, is sagtewaretegnologie wat karakters soos syfers, letters en leestekens (ook genoem gliewe) van gedrukte of geskrewe dokumente omskep in 'n elektroniese vorm wat makliker herken en gelees word deur rekenaars en ander sagteware programme. Sommige OCR-programme doen dit aangesien 'n dokument met 'n digitale kamera geskandeer of gefotografeer word en ander kan hierdie proses toepas op dokumente wat voorheen geskandeer of sonder OCR gefotografeer is. OCR laat gebruikers toe om binne PDF-dokumente te soek, teks te wysig en dokumente te herformateer.

Image
Image
Skandeer historiese koerant met OCR-sagteware.

Getty Images

Waarvoor word OCR gebruik?

Vir vinnige, alledaagse skanderingsbehoeftes is OCR dalk nie 'n groot probleem nie. As jy 'n groot hoeveelheid skandering doen, kan jy in PDF's soek om die presiese een te vind wat jy nodig het, heelwat tyd bespaar en OCR-funksionaliteit in jou skandeerderprogram belangriker maak. Hier is 'n paar ander dinge waarmee OCR help:

  • Geoutomatiseerde dataverwerking en data-invoer (Voorbeeld: Werkaansoeker-nasporingstelsels vir CV's).
  • Maak geskandeerde boeke soekbaar.
  • Omskakeling van handgeskrewe skanderings na rekenaarleesbare teks.
  • Om dokumente meer bruikbaar te maak deur lesersprogramme wat siggestremde gebruikers bystaan.
  • Bewaring van historiese dokumente en koerante, terwyl dit ook deursoekbaar word.
  • Data-onttrekking en oordrag na rekeningkundige programme (Byvoorbeeld: Kwitansies en fakture).
  • Indekseer dokumente vir gebruik deur soekenjins.
  • Herkenning van bestuurdersnommerplate deur 'n spoedkamera en rooiligkamerasagteware.
  • Spraaksintetiseerders vir mense wat nie kan praat nie – teoretiese fisikus, Stephen Hawking, is miskien die bekendste gebruiker van 'n spraaksintetiseerderprogram.

Onderste reël

Hoekom neem jy nie net 'n foto nie, reg? Omdat jy niks sal kan wysig of die teks kan deursoek nie, want dit sal net 'n prent wees. Deur die dokument te skandeer en OCR-sagteware te laat loop, kan daardie lêer iets verander wat jy kan redigeer en kan soek.

Geskiedenis van OCR

Terwyl die heel vroegste gebruik van teksherkenning tot 1914 dateer, het die wydverspreide ontwikkeling en gebruik van OCR-verwante tegnologieë in alle erns in die 1950's begin, spesifiek met die skepping van baie vereenvoudigde lettertipes wat makliker was om na digitaal om te skakel- leesbare teks. Die eerste van hierdie vereenvoudigde lettertipes is deur David Shepard geskep en algemeen bekend as OCR-7B. OCR-7B word vandag steeds in die finansiële industrie gebruik vir die standaardlettertipe wat op kredietkaarte en debietkaarte gebruik word. In die 1960's het posdienste in verskeie lande OCR-tegnologie begin gebruik om possortering aansienlik te bespoedig, insluitend die Verenigde State, Groot-Brittanje, Kanada en Duitsland. OCR is steeds die kerntegnologie wat gebruik word om pos vir posdienste regoor die wêreld te sorteer. In 2000 is sleutelkennis van die limiete en vermoëns van OCR-tegnologie gebruik om die CAPTCHA-programme te ontwikkel wat gebruik word om bots en spammers te stop.

Oor die dekades het OCR meer akkuraat en meer gesofistikeerd geword as gevolg van vooruitgang in verwante tegnologie-areas soos kunsmatige intelligensie, masjienleer en rekenaarvisie. Vandag gebruik OCR-sagteware patroonherkenning, kenmerkbespeuring en teksontginning om dokumente vinniger en meer akkuraat as ooit tevore te transformeer.

Gereelde Vrae

    Hoe skandeer ek dokumente met my foon of tablet?

    Op iOS, maak die Notes-toepassing oop en skep 'n nuwe nota. Maak die kamera oop en tik dan Scan Documents. Op Android, maak Google Drive oop en kies die Plus (+), en tik dan Scan om die dokument met jou foon.

    Hoe gebruik ek OCR in Adobe Acrobat?

    Maak 'n PDF-lêer oop wat 'n geskandeerde prent bevat, en kies dan Tools > Wysig PDF. Acrobat sal outomaties OCR toepas sodat jy die teks kan wysig. Kies net waar jy wysigings wil maak en begin tik.

    Wat is die verskil tussen OCR en OMR?

    Optical Mark Recognition (OMR) is sagteware wat merke op papier opspoor, gewoonlik 'n borrelvel. OMR word gebruik om die uitslae van eksamens, opnames, vraelyste en selfs verkiesings te verwerk. Anders as OCR, kan OMR nie die merke op die bladsy ontsyfer nie, maar verifieer net dat die merke daar is.

Aanbeveel: