Die Rechtschreibprüfung ist ein Verfahren zur Fehlerkorrektur in elektronisch vorliegenden Texten.
Schreib- oder Tippfehler führen
- zu Buchstabensequenzen (auch Strings), die nicht zum Wortbestand der aktuellen Sprache gehören. Beispiele: Feler (Auslassung), Fehlet (Ersetzung), Fehlwer (Einfügung), Fehelr (Vertauschung, auch Transposition)
- zu Wörtern, die zwar existieren, aber im falschen Kontext stehen. Beispiel: Der Hammer frisst Gras.
Der erste Fall lässt sich mit relativ einfachen Mitteln korrigieren. Das Korrekturprogramm vergleicht Buchstabensequenzen, die nicht im Lexikon gefunden werden können, mit den Lexikoneinträgen und wählt diejenigen als Korrekturvorschläge, die dem fehlerhaften String am ähnlichsten sind. Die Editierdistanz (auch Levenshtein-Distanz zwischen der fehlerhaften Sequenz und dem Korrekturvorschlag ist minimal, das heißt, dass das fehlerhafte Wort mit möglichst wenigen Änderungen in den Korrekturvorschlag überführt werden kann.
Vereinfachtes Beispiel: fehlerhaftes Wort: Libe; Im Lexikon: Liebe, Leib
Levenshtein-Distanzen: für Liebe: 1 (1 Auslassung), für Leib: 2 (2 Vertauschungen) --> Erster Korrekturvorschlag: Liebe