Soundex

phonetischer Algorithmus zur Indizierung von Wörtern und Phrasen nach ihrem Klang in der englischen Sprache
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 10. März 2005 um 21:47 Uhr durch Littl (Diskussion | Beiträge) (Deutsche Sprache). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Soundex, Metaphone und Miracode sind phonetische Algorithmen zur Indexierung von Wörtern und Phrasen nach ihrem Klang in der englischen Sprache. Gleichklingende Wörter sollen dabei zu einer identischen Zeichenfolge codiert werden.

Der Soundex-Algorithmus erbringt aber häufig auch für die Deutsche Sprache gute Ergebnisse.

Soundex wurde von Russell für die Indizierung der Familiennamen der Volkszählung (Census) in den USA entwickelt und 1918 patentiert (US-Patent 1,261,167). Der Soundex-Code für ein Wort besteht aus seinem ersten Buchstaben gefolgt von drei Ziffern, die die nach dem Anfangsbuchstaben folgenden Konsonanten des Wortes repräsentieren. Ähnliche Laute besitzen den gleichen Code (B, F, P und V werden z.B. alle mit der Ziffer "1" codiert).

Metaphone wurde von Lawrence Philips entwickelt und ist eine eingebaute Funktion in PHP.

Siehe auch: en:Porter stemming algorithm