Optische Zeichenerkennung

Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 10. Januar 2004 um 21:45 Uhr durch 82.82.119.130 (Diskussion). Sie kann sich erheblich von der aktuellen Version unterscheiden.


Optical Character Recognition (Abkürzung OCR) oder Optische Zeichenerkennung ist ein Begriff aus dem IT-Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.

Ursprünglich gab es dazu eigene OCR-Schriften, die z.B. für das Bedrucken von Scheckformularen verwendet wurden. Dabei wurden die OCR-A und OCR-B für gedruckte Schriften verwendet, während die OCR-H für handgeschriebene Zeichen galt. Diese Schriftarten waren so gestaltet, dass die einzelnen Zeichen von einem OCR-Lesegerät schnell und ohne großen Rechenaufwand unterschieden werden konnten. Diese Geräte setzten sich aber gegenüber Barcodelesern nur in Teilbereichen durch, da einerseits die Fehlerhäufigkeit viel größer war, die Leser aber teurer waren.

Die gestiegenen Leistungen moderner Rechner erlauben inzwischen auch die Erkennung von "normalen" Druckerschriftarten.

Ein Text, der eingescannt wird, liegt zunächst nur wie ein ganz normales Bild als Rastergrafik vor. Das hat vor allem zwei Nachteile:

  1. es braucht viel Speicherplatz
  2. es kann nicht mit einer Textverarbeitung oder einem Editor weiterverarbeitet werden.

OCR Programme wandeln die eingelesene Bild-Datei in eine Textdatei um. Diese kann dann mit Schreibprogrammen wie OpenOffice.org Writer oder MS Word weiterbearbeitet werden.

Vielen Scannern liegt mittlerweile OCR und Scan-Software bei.

Programme

  • Kooka ist ein Scan und OCR Programm für die grafische Benutzeroberfläche KDE für Linux
  • Recognita
  • EASYWARE
    • Elektronische Archivierung und Dokumentenmanagement (DMS)
  • LEADTOOLS
    • Eine umfassende Tool-Palette zur Verarbeitung von Raster- und Vektor-Bildern
  • IrisPen II USB
    • Datenhamster schluckt jetzt auch Strichcodes und handschriftliche Zahlen
  • FormTool Scan & OCR
    • Die professionelle Komplettlösung für elektronische Formulare
  • Paperport Scanner Suite
    • Schnäppchen-Bundle: Paperport Deluxe Software 5.3 kombiniert mit Pro OCR 100
  • OmniPage Pro
    • Top-OCR-Software ist jetzt PDF-fähig
  • Pagis Pro Millennium Scanning Suite
    • Texte erkennen, Fotos bearbeiten, Ablage strukturieren, Kopie
  • PaperPort Pro OCR
  • PAPERKEYBOARD 2000 Beleglesesoftware
  • TELEform Beleglesesoftware - Erfassung von Rohdaten
  • Scanmaster Scanmaster Multilinguale OCR Software