1. fotoaparati
  2. Car Audio & Electronics
  3. Home Audio
  4. Osobni Audio
  5. TV
  6. Pametna kuća
  >> Hrvatska Electronic Technology >  >> Pametna kuća >> Pametan život

Nedostaci OCR-a

Američka poštanska služba koristi tehnologiju optičkog prepoznavanja znakova (OCR) za čitanje adresa na komadima pošte. Međutim, da bi pošta bila čitljiva OCR razvrstavanjem pošte, adrese i fontovi moraju biti formatirani na određeni način. OCR softver koristan je za pretvaranje skeniranih slika tipkanih ili rukom pisanih dokumenata u elektronički tekst koji se može pretraživati, ali ima nedostatke koji ograničavaju njegovu primjenu.

Ograničeni dokumenti

OCR najbolje funkcionira s tipkanim dokumentima dobre kvalitete. Softver za OCR ne može lako pročitati rukom pisane dokumente. Isto tako, tipkani fontovi koji nalikuju rukopisu -- kao i nelatinični fontovi -- stvaraju mnoge pogreške tijekom procesa OCR-a. Ako dokument ima slab kontrast, izgužvan je ili prljav, ili su tekst i pozadina slični u tami, tada OCR možda neće raditi dobro. OCR ima poteškoća s dokumentima koji sadrže i slike i tekst. Proračunske tablice također će proizvesti više pogrešaka.

Točnost

Nijedan OCR softver nije 100 posto točan. Broj pogrešaka ovisi o kvaliteti i vrsti dokumenta, uključujući korišteni font. Pogreške koje se javljaju tijekom OCR-a uključuju pogrešno čitanje slova, preskakanje slova koja nisu čitljiva ili miješanje teksta iz susjednih stupaca ili naslova slika. Ako je potrebna visoka točnost -- kao kod pretvaranja digitalnih knjiga u elektronički format -- tada će biti potrebno čišćenje elektroničkog teksta.

Zaobilazna rješenja

OCR ima poteškoća u razlikovanju znakova, poput broja nula i velikog "O". Da biste to zaobišli, možete koristiti poseban OCR font, kao što je ispisivanje nule. Međutim, ovo funkcionira samo za dokumente stvorene s OCR-om na umu, kao što su upitnici. Prilikom izrade upitnika koji će biti pisani rukom, istraživači također koriste okvire za svako slovo.

Dodatni rad

Čak i ako je skenirana slika izvornog dokumenta visoke kvalitete, moraju se poduzeti dodatni koraci za čišćenje OCR teksta. Ispravljanje grešaka koje stvara OCR vrlo je naporno. Osoba mora ručno usporediti izvorni dokument i elektronički tekst. Ljudi također griješe kada upisuju tekst iz dokumenta, ali ponekad je brže preskočiti OCR korak.


  1. Nedostaci SMS Poruke za Govoreći na engleskom jeziku
  2. Nedostaci Kabelska TV
  3. Nedostaci plazma TV
  4. Nedostaci plazma TV
  5. Nedostaci digitalnog emitiranja