Zum Inhalt springen

Optische Zeichenerkennung

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 9. Juli 2004 um 12:47 Uhr durch Duesentrieb (Diskussion | Beiträge) (Doppeleintrag: Texterkennung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Vorlage:Doppeleintrag Texterkennung -- D. Düsentrieb 12:47, 9. Jul 2004 (CEST)

Optische Zeichenerkennung (Abkürzung OZE, gelegentlich auch OCR von englisch Optical Character Recognition) ist ein Begriff aus dem IT-Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.

Ursprünglich gab es dazu eigene OZE-Schriften, die z. B. für das Bedrucken von Scheckformularen verwendet wurden. Dabei wurden die OZE-A und OZE-B für gedruckte Schriften verwendet, während die OZE-H für handgeschriebene Zeichen galt. Diese Schriftarten waren so gestaltet, dass die einzelnen Zeichen von einem OZE-Lesegerät schnell und ohne großen Rechenaufwand unterschieden werden konnten. Diese Geräte setzten sich aber gegenüber Barcodelesern nur in Teilbereichen durch, da einerseits die Fehlerhäufigkeit viel größer war, die Leser aber teurer waren.

Die gestiegenen Leistungen moderner Computer und verbesserte Algorithmen erlauben inzwischen auch die Erkennung von "normalen" Druckerschriftarten.

Ein Text, der eingescannt wird, liegt zunächst nur wie ein ganz normales Bild als Rastergrafik vor.

Das hat vor allem zwei Nachteile:

  1. es braucht viel Speicherplatz,
  2. es kann nicht mit einer Textverarbeitung oder einem Editor weiterverarbeitet werden.

OZE-Programme wandeln die eingelesene Bild-Datei in eine Textdatei um. Diese kann dann mit Schreibprogrammen wie OpenOffice.org Writer oder MS Word weiterbearbeitet werden.

Vielen Scannern liegt mittlerweile OZE und Scan-Software bei.

Der erste Schritt der OZE ist oft eine Segmentierung.

Programme

  • Kooka ist ein Scan- und OZE-Programm für die grafische Benutzeroberfläche KDE für Linux
  • Recognita
  • EASYWARE
    • Elektronische Archivierung und Dokumentenmanagement (DMS)
  • LEADTOOLS
    • Eine umfassende Hilfprogrammpalette zur Verarbeitung von Raster- und Vektorgrafiken
  • IrisPen II USB
    • Datenhamster schluckt jetzt auch Strichcodes und handschriftliche Zahlen
  • FormTool Scan & OCR
    • Die professionelle Komplettlösung für elektronische Formulare
  • Paperport Scanner Suite
    • Schnäppchen-Bundle: Paperport Deluxe Software 5.3 kombiniert mit Pro OCR 100
  • OmniPage Pro
    • Top-OCR-Software ist jetzt PDF-fähig
  • Pagis Pro Millennium Scanning Suite
    • Texte erkennen, Fotos bearbeiten, Ablage strukturieren, Kopie
  • PaperPort Pro OCR
  • PAPERKEYBOARD 2000 Beleglesesoftware
  • TELEform Beleglesesoftware - Erfassung von Rohdaten
  • Scanmaster Scanmaster Multilinguale OCR Software
  • FineReader OCR 7.0 - Prof. Edition, ABBYY Software House http://www.abbyy.com