Buchstabenhäufigkeit und Abstich: Unterschied zwischen den Seiten
Erscheinungsbild
(Unterschied zwischen Seiten)
Inhalt gelöscht Inhalt hinzugefügt
→Endbuchstaben: gr |
BKL |
||
Zeile 1: | Zeile 1: | ||
'''Abstich''' hat verschiedene Bedeutungen, siehe |
|||
Die '''Buchstabenhäufigkeit''' ist eine [[Statistik|statistische]] Größe, die angibt, wie oft ein bestimmter Buchstabe in einem Text vorkommt. Sie kann als absolute Anzahl oder in Relation zur Gesamtzahl der Buchstaben des Textes angegeben werden. Die Häufigkeitsverteilung der Buchstaben hängt von der [[Sprache]] und von der Art des untersuchten Textes ab. Die statistische Verteilung der Buchstabenhäufigkeit auf den oberen Plätzen wird vom [[Zipfsches Gesetz|Zipfschen Gesetz]] vorhergesagt. Für manche Zwecke ist es auch interessant, wie häufig ein Buchstabe am Wortanfang oder am Wortende vorkommt. |
|||
* [[Abstich (Metallurgie)]] |
|||
* [[Abstich (Weinbau)]] |
|||
{{BKL}} |
|||
== Anwendung == |
|||
Die Buchstabenhäufigkeit wird in der [[Entschlüsselung]] von [[Monoalphabetische Substitution|Substitutionsverfahren]] in der [[Kryptoanalyse]] sowie in der [[Datenkompression]] und [[Code|-kodierung]] benutzt. Bei einfachen [[Verschlüsselungsverfahren]] wie beispielsweise dem [[Verschiebechiffre|Cäsarchiffre]] kann ein [[Text]] alleine durch [[Häufigkeitsanalyse]] entschlüsselt werden. Dabei werden die Häufigkeiten der einzelnen [[Zeichen]] im Geheimtext festgestellt, und dann mit der Häufigkeit der Zeichen in einem deutschen [[Klartext]] verglichen. Nun werden die [[Buchstabe|Buchstaben]] des Geheimtextes durch die "normalen" Buchstaben gleicher Häufigkeit ersetzt. Der häufigste Buchstabe des Geheimtextes entspricht dann zum Beispiel dem Klartextbuchstaben "e". Diese [[Methode]] funktioniert um so besser, je länger der zu entschlüsselnde Text ist, weil dadurch die [[Statistik|statistische]] Abweichung der gefundenen Buchstabenhäufigkeit von der [[Erwartungswert|zu erwartenden]] Häufigkeit geringer wird. |
|||
Für den Maschinenschreibunterricht (siehe [[Tastschreiben]]) ist es ungemein wichtig, dass die Lehrkraft über die Buchstabenhäufigkeit in einer Sprache gut informiert ist und die Unterrichtsinhalte entsprechend darauf abgestimmt werden. Häufige Buchstaben wie das E oder das I müssen hinreichend trainiert werden um eine möglichst hohe Anschlagszahl und eine gute Schreibsicherheit zu erzielen. |
|||
[[:Kategorie:Spieleverlag|Hersteller]] von Buchstabenspielen wie [[Boggle]] oder [[Scrabble]] berücksichtigen bei den nationalen Varianten ebenfalls die Häufigkeit und falls vorhanden, auch die Wertigkeit der Buchstaben. |
|||
Eine der ersten Anwendungen war das [[Morsecode|Morse-Alphabet]], das für häufige Zeichen kurze Codes verwendet (zum Beispiel 'e' = '.'); für selten gebrauchte Zeichen dagegen längere Codes (zum Beispiel 'q' = '- -. -'). Siehe dazu auch [[Shannon-Fano-Kodierung]]. |
|||
== Weiterführung == |
|||
Die Weiterführung der Buchstabenhäufigkeit ist die Häufigkeit von [[Deutsches_Alphabet#Buchstabenverteilung in deutschsprachigen Texten|Buchstabenpaaren und -tripeln]] und die [[Worthäufigkeit]]. |
|||
== Buchstabenhäufigkeiten in deutschsprachigen Texten == |
|||
Die Umlaute ä, ö und ü wurden wie ae, oe und ue gezählt <ref>Albrecht Beutelspacher, ''Kryptologie'', 7. Aufl., Wiesbaden: Vieweg Verlagsgesellschaft, 2005, ISBN 3-8348-0014-7, Seite 10</ref>. Die beiden Buchstaben e und n treten mit zusammen 27,18 % am häufigsten auf. |
|||
{| border="1" cellspacing="0" cellpadding="4" style="text-align:center;" |
|||
! style="font-weight:bold;" | Platz || Buchstabe || relative<br />Häufigkeit |
|||
|- |
|||
| 1. || '''[[E]]''' || 17,40 % |
|||
|- |
|||
| 2. || '''[[N]]''' || 9,78 % |
|||
|- |
|||
| 3. || '''[[I]]''' || 7,55 % |
|||
|- |
|||
| 4. || '''[[S]]''' || 7,27 % |
|||
|- |
|||
| 5. || '''[[R]]''' || 7,00 % |
|||
|- |
|||
| 6. || '''[[A]]''' || 6,51 % |
|||
|- |
|||
| 7. || '''[[T]]''' || 6,15 % |
|||
|- |
|||
| 8. || '''[[D]]''' || 5,08 % |
|||
|- |
|||
| 9. || '''[[H]]''' || 4,76 % |
|||
|- |
|||
| 10. || '''[[U]]''' || 4,35 % |
|||
|- |
|||
| 11. || '''[[L]]''' || 3,44 % |
|||
|- |
|||
| 12. || '''[[C]]''' || 3,06 % |
|||
|- |
|||
| 13. || '''[[G]]''' || 3,01 % |
|||
|- |
|||
| 14. || '''[[M]]''' || 2,53 % |
|||
|- |
|||
| 15. || '''[[O]]''' || 2,51 % |
|||
|- |
|||
| 16. || '''[[B]]''' || 1,89 % |
|||
|- |
|||
| 17. || '''[[W]]''' || 1,89 % |
|||
|- |
|||
| 18. || '''[[F]]''' || 1,66 % |
|||
|- |
|||
| 19. || '''[[K]]''' || 1,21 % |
|||
|- |
|||
| 20. || '''[[Z]]''' || 1,13 % |
|||
|- |
|||
| 21. || '''[[P]]''' || 0,79 % |
|||
|- |
|||
| 22. || '''[[V]]''' || 0,67 % |
|||
|- |
|||
| 23. || '''[[ß]]''' || 0,31 % |
|||
|- |
|||
| 24. || '''[[J]]''' || 0,27 % |
|||
|- |
|||
| 25. || '''[[Y]]''' || 0,04 % |
|||
|- |
|||
| 26. || '''[[X]]''' || 0,03 % |
|||
|- |
|||
| 27. || '''[[Q]]''' || 0,02 % |
|||
|} |
|||
=== Anfangsbuchstaben === |
|||
Die Häufigkeit von Anfangsbuchstaben gibt an, wie häufig ein Buchstabe als erster Buchstabe eines Wortes vorkommt. Sie hängt relativ stark von der Textart ab. Für Fließtext sind die fünf häufigsten Anfangsbuchstaben <ref>[http://zwilling.dawa.de/sammelsurium/worte/buchhauf.html Statistik zur Buchstabenhäufigkeit]</ref>: |
|||
{| border="1" cellspacing="0" cellpadding="4" style="text-align:center;" |
|||
! style="font-weight:bold;" | Platz || Buchstabe || relative<br />Häufigkeit |
|||
|- |
|||
| 1. || '''[[D]]''' || 14,2 % |
|||
|- |
|||
| 2. || '''[[S]]''' || 10,8 % |
|||
|- |
|||
| 3. || '''[[E]]''' || 7,8 % |
|||
|- |
|||
| 4. || '''[[I]]''' || 7,1 % |
|||
|- |
|||
| 5. || '''[[W]]''' || 6,8 % |
|||
|} |
|||
=== Endbuchstaben === |
|||
Die Häufigkeit von Endbuchstaben gibt an, wie häufig ein Buchstabe als letzter Buchstabe eines Wortes vorkommt. (Als Beispiel-Textbasis wurde das Buch [[Effi Briest]] von [[Theodor Fontane]] ausgewertet, wobei „ß“ stets als „ss“ gezählt wurde. Die Textbasis umfasst alle 36 Kapitel dieses Werks mit insgesamt 572849 Bytes.) |
|||
{| border="1" cellspacing="0" cellpadding="4" style="text-align:center;" |
|||
! style="font-weight:bold;" | Platz || Buchstabe || relative<br />Häufigkeit |
|||
|- |
|||
| 1. || '''[[N]]''' || 21,0 % |
|||
|- |
|||
| 2. || '''[[E]]''' || 15,1 % |
|||
|- |
|||
| 3. || '''[[R]]''' || 13,0 % |
|||
|- |
|||
| 4. || '''[[T]]''' || 10,3 % |
|||
|- |
|||
| 5. || '''[[S]]''' || 9,6 % |
|||
|} |
|||
== Siehe auch == |
|||
* [[Worthäufigkeit]] |
|||
== Weblinks == |
|||
* [http://www.buchstabenprofile.de.vu Facharbeit zum Thema "Buchstabenhäufigkeit" DE,FR,IT,PT,ES] |
|||
== Weitere Buchstabenprofile == |
|||
* [[Buchstabenhäufigkeit|Deutsches Buchstabenprofil]] |
|||
* [[Buchstabenhäufigkeit Französisch|Französisches Buchstabenprofil]] |
|||
* [[Buchstabenhäufigkeit Italienisch|Italienisches Buchstabenprofil]] |
|||
* [[Buchstabenhäufigkeit Portugiesisch|Portugiesisches Buchstabenprofil]] |
|||
* [[Buchstabenhäufigkeit Spanisch|Spanisches Buchstabenprofil]] |
|||
== Quellen == |
|||
<references/> |
|||
{{Navigationsleiste Lateinisches Alphabet}} |
|||
[[Kategorie:Kryptologie]] |
|||
[[Kategorie:Schreibtechnik]] |
|||
[[en:Letter_frequencies]] |
|||
[[es:Frecuencia de aparición de letras]] |
|||
[[fr:Fréquence d'apparition des lettres en français]] |
|||
[[sl:Frekvence črk]] |
|||
[[tr:Türk alfabesindeki harflerin kullanım sıklıkları]] |