Optické rozpoznávání znaků

Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu.

Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. OCR-A, nebo dnes používanější OCR-B.

Historie

Počátky optického rozpoznávání znaků lze vysledovat k technologiím souvisejícím s telegrafií a ke snahám o vytvoření čtecích zařízení pro zrakově postižené.^[1] V roce 1914 vyvinul Emanuel Goldberg zařízení, které dokázalo číst znaky a převádět je do standardního telegrafního kódu.^[2] Současně vytvořil Edmund Fournier d'Albe přístroj zvaný Optophone, ruční skener, který při pohybu po tištěné stránce generoval zvuky odpovídající jednotlivým písmenům nebo znakům.^[3]

Na konci 20. let a v průběhu 30. let 20. století vyvinul Emanuel Goldberg tzv. statistický stroj, určený k vyhledávání v mikrofilmových archivech pomocí systému optického rozpoznávání kódů. V roce 1931 mu byl na tento vynález udělen americký patent č. 1 838 389, který následně získala společnost IBM.

V roce 1974 založil Ray Kurzweil společnost Kurzweil Computer Products, Inc. a pokračoval ve vývoji tzv. omni-font OCR, schopného rozpoznávat text vytištěný prakticky v jakémkoli písmu. Kurzweil je často uváděn jako autor této technologie, přestože byla používána již na konci 60. a v 70. letech 20. století, například společností CompuScan.^[1]^[4] Kurzweil využil OCR k vytvoření čtecího zařízení, které umožňovalo nevidomým osobám nechat si text předčítat počítačem. Společnost Kurzweil Computer Products byla později prodána firmě Xerox, která ji následně vyčlenila jako Scansoft; tato společnost se později sloučila s Nuance Communications.

V průběhu 21. století se OCR začalo objevovat jako online služba (tzv. WebOCR), v prostředí cloud computingu a v mobilních aplikacích, například pro okamžitý překlad cizojazyčných nápisů pomocí chytrých telefonů. S rozšířením chytrých telefonů a chytrých brýlí se OCR využívá v mobilních zařízeních připojených k internetu, která zpracovávají text zachycený kamerou zařízení. Zařízení bez vestavěné funkce OCR obvykle používají rozhraní API pro extrakci textu z obrazových souborů.^[5]^[6] OCR API vrací rozpoznaný text spolu s informacemi o poloze detekovaných znaků v původním obrazu, což umožňuje další zpracování, například převod textu na řeč.

K dispozici je řada komerčních i open source OCR systémů, které podporují většinu běžně používaných písem, včetně latinky, cyrilice, arabského, hebrejského, indických písem, bengálského písma, dévanágarí, tamilského písma a znakových systémů čínštiny, japonštiny a korejštiny.^[7]^[8]

OCR software

Jméno	Licence	Operační systém	Poznámky
ABBYY FineReader OCR	Komerční	Microsoft Windows Vista, Microsoft Windows Server 2003, Windows XP, Windows 2000 (SP2)..
Adobe Acrobat	Komerční	Windows, macOS
PDF-XChange Viewer	Freeware	Windows
PDF-XChange Viewer Pro	Komerční	Windows
GOCR	GPL	(open source)
Microsoft Office Document Imaging	Komerční	Windows, macOS
NovoDynamics VERUS	Komerční?	?
Ocrad	GPL	Unix-like, OS/2
OCRopus	Apache	Linux
OmniPage	Komerční (Nuance EULA)	Windows	Produkt Nuance Communications
Readiris	Komerční	Windows, Mac OS	Produkt I.R.I.S.
ReadSoft	Komerční	?
SimpleOCR	Freeware a komerční	Windows
SmartScore	Komerční	Windows, Mac
Tesseract	Apache	Windows, macOS, Linux, OS/2	Vyvíjeno Googlem
Nicomsoft OCR	Komerční	Windows, Linux
PowerToys	Freeware	Windows	Microsoft

OCR založené na AI

olmOCR od Ai2^[9]
Chandra od Datalab^[10]
Deepseek OCR^[11]
Pixtral od Mistral^[12]
dots.ocr od rednote hi lab^[13]
PaddleOCR^[14]
Google Cloud AI^[15]

OCR rozpoznávající ručně psané znaky

Koncem 60. let 20. století byly v Japonsku vyvinuty OCR systémy rozeznávající i rukou psané znaky, především číslice (poštovní směrovací čísla).^[16] Zařízení různých výrobců, ve kterých jsou tato OCR integrována, slouží v poštovním provozu k automatickému třídění dopisů.^[17]

Odkazy

Reference

↑ ^a ^b SCHANTZ, Herbert F. The history of OCR, optical character recognition. [s.l.]: [Manchester Center, Vt.] : Recognition Technologies Users Association 138 s. Dostupné online. ISBN 978-0-943072-01-2.
↑ DHAVALE, Sunita Vikrant. Advanced image-based spam detection and filtering techniques. Hershey, Pennsylvania (701 E. Chocolate Avenue, Hershey, PA 17033, USA): IGI Global 213 s. ISBN 978-1-68318-014-2.
↑ On a type-reading optophone. Proceedings of the Royal Society of London. Series A, Containing Papers of a Mathematical and Physical Character. 1914-07, roč. 90, čís. 619, s. 373–375. Dostupné online [cit. 2025-12-17]. ISSN 0950-1207. doi:10.1098/rspa.1914.0061. (anglicky)
↑ "The History of OCR". Data Processing Magazine. 12: 46. 1970.
↑ VU, Paco. Extracting text from images using OCR on Android. HPE Developer Community. 2015-06-27. Dostupné v archivu pořízeném z originálu dne 2016-03-15. (anglicky)
↑ [Tutorial] OCR on Google Glass. HPE Developer Community. 2014-10-23. Dostupné v archivu pořízeném z originálu dne 2016-03-05. (anglicky)
↑ Advances in Visual Computing: 12th International Symposium, ISVC 2016, Las Vegas, NV, USA, December 12-14, 2016, Proceedings, Part I. Příprava vydání George Bebis, Richard Boyle, Bahram Parvin, Darko Koracin, Fatih Porikli, Sandra Skaff, Alireza Entezari, Jianyuan Min, Daisuke Iwai, Amela Sadagic, Carlos Scheidegger, Tobias Isenberg. Svazek 10072. Cham: Springer International Publishing, 2016. (Lecture Notes in Computer Science). Dostupné online. ISBN 978-3-319-50834-4, ISBN 978-3-319-50835-1. PDF. doi:10.1007/978-3-319-50835-1. Kapitola OCR as a Service: An Experimental Evaluation of Google Docs OCR, Tesseract, ABBYY FineReader, and Transym. (anglicky)
↑ OCR Language Support. Google Cloud Documentation [online]. [cit. 2025-12-17]. Dostupné online. (anglicky)
↑ On olmOCR-Bench, olmOCR 2 scores 82.4 points, up from 78.5 in our previous release—increasing performance across every document category. Ai2.
↑ datalab-to/chandra. github.com [online]. 2025-11-17 [cit. 2025-11-17]. Original-date: 2025-10-08T21:34:16Z. Dostupné online.
↑ WEI, SUN, LI. DeepSeek-OCR: Contexts Optical Compression. arxiv.org [online]. [cit. 2025-11-17]. Dostupné online.
↑ Pixtral Large | Mistral AI. mistral.ai [online]. [cit. 2025-11-17]. Dostupné online. (anglicky)
↑ rednote-hilab/dots.ocr. github.com [online]. 2025-11-17 [cit. 2025-11-17]. Original-date: 2025-07-30T11:03:59Z. Dostupné online.
↑ PaddlePaddle/PaddleOCR. github.com [online]. 2025-11-17 [cit. 2025-11-17]. Original-date: 2020-05-08T10:38:16Z. Dostupné online.
↑ OCR With Google AI. Google Cloud [online]. [cit. 2025-11-17]. Dostupné online. (anglicky)
↑ World's First Mail Processing Equipment [online]. Kawasaki, JP: Toshiba Science Museum [cit. 2023-08-19]. Dostupné online. (anglicky)
↑ VESELÝ, Milan. Systémy třídění se zaměřením na třídění poštovních zásilek na třídicích strojích. České Budějovice, 2016 [cit. 2023-08-19]. Bakalářská práce. Jihočeská univerzita. Vedoucí práce Bedřich Veselý. Dostupné online.

Externí odkazy

Obrázky, zvuky či videa k tématu OCR na Wikimedia Commons
Slovníkové heslo OCR ve Wikislovníku
Optické rozpoznávání znaků v České terminologické databázi knihovnictví a informační vědy (TDKIV)

Pahýl

Tento článek je příliš stručný nebo postrádá důležité informace.
Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.

[:0-1] SCHANTZ, Herbert F. The history of OCR, optical character recognition. [s.l.]: [Manchester Center, Vt.] : Recognition Technologies Users Association 138 s. Dostupné online. ISBN 978-0-943072-01-2.

[2] DHAVALE, Sunita Vikrant. Advanced image-based spam detection and filtering techniques. Hershey, Pennsylvania (701 E. Chocolate Avenue, Hershey, PA 17033, USA): IGI Global 213 s. ISBN 978-1-68318-014-2.

[3] On a type-reading optophone. Proceedings of the Royal Society of London. Series A, Containing Papers of a Mathematical and Physical Character. 1914-07, roč. 90, čís. 619, s. 373–375. Dostupné online [cit. 2025-12-17]. ISSN 0950-1207. doi:10.1098/rspa.1914.0061. (anglicky)

[4] "The History of OCR". Data Processing Magazine. 12: 46. 1970.

[5] VU, Paco. Extracting text from images using OCR on Android. HPE Developer Community. 2015-06-27. Dostupné v archivu pořízeném z originálu dne 2016-03-15. (anglicky)

[6] [Tutorial] OCR on Google Glass. HPE Developer Community. 2014-10-23. Dostupné v archivu pořízeném z originálu dne 2016-03-05. (anglicky)

[7] Advances in Visual Computing: 12th International Symposium, ISVC 2016, Las Vegas, NV, USA, December 12-14, 2016, Proceedings, Part I. Příprava vydání George Bebis, Richard Boyle, Bahram Parvin, Darko Koracin, Fatih Porikli, Sandra Skaff, Alireza Entezari, Jianyuan Min, Daisuke Iwai, Amela Sadagic, Carlos Scheidegger, Tobias Isenberg. Svazek 10072. Cham: Springer International Publishing, 2016. (Lecture Notes in Computer Science). Dostupné online. ISBN 978-3-319-50834-4, ISBN 978-3-319-50835-1. PDF. doi:10.1007/978-3-319-50835-1. Kapitola OCR as a Service: An Experimental Evaluation of Google Docs OCR, Tesseract, ABBYY FineReader, and Transym. (anglicky)

[8] OCR Language Support. Google Cloud Documentation [online]. [cit. 2025-12-17]. Dostupné online. (anglicky)

[9] On olmOCR-Bench, olmOCR 2 scores 82.4 points, up from 78.5 in our previous release—increasing performance across every document category. Ai2.

[10] talab-to/chandra. github.com [online]. 2025-11-17 [cit. 2025-11-17]. Original-date: 2025-10-08T21:34:16Z. Dostupné online.

[11] WEI, SUN, LI. DeepSeek-OCR: Contexts Optical Compression. arxiv.org [online]. [cit. 2025-11-17]. Dostupné online.

[12] Pixtral Large | Mistral AI. mistral.ai [online]. [cit. 2025-11-17]. Dostupné online. (anglicky)

[13] rednote-hilab/dots.ocr. github.com [online]. 2025-11-17 [cit. 2025-11-17]. Original-date: 2025-07-30T11:03:59Z. Dostupné online.

[14] PaddlePaddle/PaddleOCR. github.com [online]. 2025-11-17 [cit. 2025-11-17]. Original-date: 2020-05-08T10:38:16Z. Dostupné online.

[15] OCR With Google AI. Google Cloud [online]. [cit. 2025-11-17]. Dostupné online. (anglicky)

[16] World's First Mail Processing Equipment [online]. Kawasaki, JP: Toshiba Science Museum [cit. 2023-08-19]. Dostupné online. (anglicky)

[17] VESELÝ, Milan. Systémy třídění se zaměřením na třídění poštovních zásilek na třídicích strojích. České Budějovice, 2016 [cit. 2023-08-19]. Bakalářská práce. Jihočeská univerzita. Vedoucí práce Bedřich Veselý. Dostupné online.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]