Zipfsches Gesetz

Paretoverteilung der Häufigkeit von Worten in Texten einer Sprache
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 13. April 2003 um 15:24 Uhr durch Kku (Diskussion | Beiträge) (rank vs. frequency). Sie kann sich erheblich von der aktuellen Version unterscheiden.
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Das Zipf'sche Gesetz, nach dem Harvard-Professor für Linguistik George Kingsley Zipf (1902-1950) benannt, korreliert die empirisch gefundenen Häufigkeit f von Worten eines ausreichend langen Textes mit deren Rang r, in einem Potenzgesetz:

oder

Wobei "~" für Proportionalität steht und a ein Exponent mit einem Wert von ungefähr 1 ist.

Interessanterweise gilt diese Beziehung nicht nur für Texte in menschlichen Sprachen, sondern für so gut wie alle natürlichen Symbolsequenzen mit längerreichweitigen Korrelationen ?ist das ueberhaupt voraussetzung?, wie z.B. der DNA.