Diskussion:Buchstabenhäufigkeit
Umlaute
Umlaute als ae, oe usw. zu zählen ist unsachgemäß und ergibt außerdem eine zu hohe Häufigkeit für 'e'.
Fragen zu den Statistiken, Quellenangabe
Ich habe gesehen, daß es ebenfalls im Artikel Deutsches Alphabet um die Buchstabenhäufigkeit geht. Man sollte also beides irgendwie zusammenbringen. (Außerdem ist bei jedem Buchstabenartikel eine Häufigkeit des Buchstabens angegeben - leider ohne Quellenangabe. Das sollte miteinander verlinkt werden!) Wünschenswert wäre auch, daß Statistiken fürs Deutsche verwendet werden, die auch die Buchstaben ä, ö, ü, ß miteinbeziehen (oder aber daß gesagt wird, wie diese Buchstaben subsummiert sind - z.B. ä als a oder ä als ae? Außerdem tauchen in deutschen Texten auch andere Buchstaben auf, z.B. é. Was ist damit?). Wichtig wäre auch die Angabe, ob die Statistiken vor oder nach der Rechtschreibreform entstanden sind.--Martin Beesk 19:29, 26. Jan 2005 (CET)
- bin ebenfalls der meinung das eine quellenangabe fehlt. aufgrund welcher quellen ist diese statistik entstanden? wurden nur die bibel durchsucht oder, wovon ich gerade lese, der Duden Korpus, was ein wenig standardisierter wäre. -- Qopep 20:25, 17. Sep 2005 (CEST)
- könnte das die Quelle sein: «DU», Nr. 739? Nach .doc (2001?) ist ‚Kryptologie’ von A. Beutelspacher eine Quelle; Beutelspacher, Albrecht: Kryptologie, Vieweg Verlagsgesellschaft, ISBN 3-528-48990-1 (2000), ISBN 3834800147 (7. Aufl. 2005) -- Cherubino 12:50, 10. Nov 2005 (CET)
- Ich bin dafür, dien Artikel zu löschen, dafür dann Deutsches Alphabet zu überarbeiten. --Fornax-Galaxies 16:56, 20. Nov 2005 (CET)
Ich finde diesen Artikel einfach nur cool (vorallem wenn man Geigenmännchen spielt) Ich habe gesucht und dieses dazu gefunden! --Schwalbe007 17:38, 2. Dez 2005 (CET)
ich fände häufigkeitsangaben für andere sprachen noch sehr interessant. anne, 19.1.06
Häufigkeitsangaben ohne Sprachbezug
ich interessiere mich auch für Häufigkeitsangaben OHNE Sprachangabe, also alle texte mit (lateinischem?) Alphabet, finde aber leider nichts zu dem Thema. hanfi 22.12.06
Im Link andere Zahlen als im Artikel
in dem weblink werden amdere zahlen genannt als im artikel .luk.
Krüger
Im Bereich Anwendung steht folgender Satz: "Dabei werden die Häufigkeiten der einzelnen Zeichen im Krüger festgestellt, und dann". Was heißt denn in diesem Zusammenhang "Krüger" das wird nicht weiter erklärt und auch in der Wikipedia ließ sich sonst dazu nichts finden. --JensKohl 15:53, 3. Aug 2006 (CEST)
Komischer Satz-unvollständig?
Die Häufigkeit von Anfangsbuchstaben gibt an, wie häufig ein Buchstabe als erster Buchstabe eines Wortes vorkommt. Sie hängt relativ stark von der Textart ab. Für Fließtext sind die fünf häufigsten Anfangsbuchstaben
Und dann geht es leider nicht weiter. Welches sind denn nun die fünf häufigsten Anfangsbuchstaben??? Bitte ergänzen - oder ist der Abschnitt in Arbeit? --Bücherwürmlein 17:16, 8. Mär. 2007 (CET)
- Darunter ist so eine Tabelle mit den 5 häufigsten Abfangsbuchstaben: D, S, E, I, W. Schon gesehen? --82.207.190.210 18:31, 14. Apr. 2007 (CEST)
P viel zu selten und anderes
Ich bekomme einfach nicht in den Kopf, dass das P so selten sein soll. Es ist doch bestimmt häufiger als ein Prozent in deutschen Texten, oder? Und überhaupt, das E ist doch nicht sooo häufig wie angegeben. Wie weiter oben schon erwähnt, labt sich das E an Ä, Ö und Ü, die im Gegensatz zu dem ß nicht aufgelistet sind, was mich sehr empört. Und kann man nicht die Buchstabenhäufigkeit einiger anderer Sprachen angeben (oder wenigstens Links dazu)? --82.207.190.210 18:43, 14. Apr. 2007 (CEST)
- Das wär jetzt auch meine Frage gewesen, da hier seit dem 17.4. niemand geantwortet hat, gehe ich davon aus, dass "man" nicht kann.--Fecchi 21:05, 10. Sep. 2007 (CEST)
- Liebe Leute! Eure Frage war mir irgendwie entgangen. Doch, es stimmt: "p" gehört zum letzten Drittel der Buchstaben. Die Zahlen schwanken je nach Text oder Textkorpus, aber "p" liegt in meinen Unterlagen nie besser als Platz 20. Sein Textanteil liegt fast immer deutlich unter 1%. "e" dagegen ist im Dt. immer der häufigste Buchstabe, egal welche Textgrundlage man nimmt. An "ä, ö, ü" kann das "e" sich kaum laben: die sind ebenfalls sehr selten. (vgl. Literaturangaben im Artikel)
Buchstabenstatistiken anderer Sprachen
Einen Link auf Buchstabenstatistiken anderer Sprachen habe ich leider nicht zur Hand. Grüß Euch! Dr. Karl-Heinz Best 21:52, 10. Sep. 2007 (CEST)
- Siehe die anderssprachigen versionen dieses artikels. Entgegen verbreiteter vorurteile ist das "ü" nicht der häufigste buchstabe der türkischen sprache! Tobias b köhler 20:31, 1. Okt. 2007 (CEST)
- Ich hab mal die Statistiken für ein paar andere Sprachen eingefügt. Vielleicht kann ja jemand (der sich damit besser auskennt als ich) eventuelle Fehler ausbessern. Gruß Alexkin 16:58, 13. Feb. 2008 (CEST)
- Du solltest das Deutsche auch noch mit in die Tabelle nehmen, so dass man es einfacher vergleichen kann. --Thornard, Diskussion, 17:06, 13. Feb. 2008 (CET)
- Gute Idee. Ich habe Deutsch eingefügt.--Alexkin 22:22, 21. Feb. 2008 (CET)
- Da hat jemand im französischen œ (wie in cœur, sœur) nicht mitgezählt? Oder oe immer separat? Wie kommts sonst zu 0,00% ? Tobias b köhler 02:52, 23. Feb. 2008 (CET)
- Ich habs ausgebessert. Die französische und die spanische Spalte waren bei dem Buchstaben (œ) vertauscht.--Alexkin 16:06, 23. Feb. 2008 (CET)
Gibt es da eigentlich auch Messungen zu? --Reiner Stoppok 18:01, 16. Okt. 2008 (CEST)
Gibt's garantiert. Schau mal in W.D. Ortmann, 1980. Sprechsilben im Dt. München nach. Ich vermute, da ist so was drin. Etwas Ähnliches sind Statistiken zu Lautverbindungen, z.B. In Helmut Meier (1967) Dt. Sprachstatistik, Hildesheim: Olms, S. 275. Grüße! Dr. Karl-Heinz Best 21:28, 16. Okt. 2008 (CEST)
Buchstabenhäufigkeiten in deutschsprachigen Texten
Die Summe der Einträge in der dritten Spalte der ersten Tabelle ergibt 100,32%, ohne das ß wären es 100,01% was ja durch Rundung möglicher wäre. Ist irgendwie unlogisch. Also wurde die ß-Ligatur doch nicht separat behandelt? -- 22:56, 20. Mär. 2009 (CET) (ohne Benutzernamen signierter Beitrag von 79.216.127.241 (Diskussion | Beiträge))
- Im Duden, Band 1, 25. Auflage, steht eine andere Reihenfolge. Auch die Prozentzahlen stimmen nicht überein. -- Harry8 20:49, 27. Aug. 2009 (CEST)
Wo bekomme ich denn eine komplette Auflistung der Prozentzahlen(also auch für die Endbuchstaben komplett)? Vielen Dank im voraus! (nicht signierter Beitrag von 188.96.236.227 (Diskussion | Beiträge) 16:33, 20. Okt. 2009 (CEST))
Schau mal in die heute erweiterte Literaturliste im Artikel: Muthmann 1988. Gruß! Dr. Karl-Heinz Best 18:19, 20. Okt. 2009 (CEST)
Genial! Genau das hab ich gesucht! Vielen Dank! :-) (nicht signierter Beitrag von 188.96.236.227 (Diskussion | Beiträge) 18:47, 20. Okt. 2009 (CEST))
Schweden
Wie hast Du impportiert? Weil da ist eine Vorlage aus der sv:WP enthalten. Die gibt es NUR EBEN im de:WP nicht.--Paule Boonekamp - eine Silbersonne 13:07, 25. Jun. 2009 (CEST)
ï im Englischen
Das i mit Trema (i mit zwei Punkten) wird in der Liste für das Englische mit 0,01% Häufigkeit angegeben. Mal davon abgesehen, dass ich kein Wort kenne, dass diesen Buchstaben enthält, taucht er auch nicht in der angegebenen Quelle auf. Anscheinend ist das Trema ja ein legitimes Mittel, um mitzuteilen, dass ein Vokal ausgesprochen wird. Aber dass das ï im Englischen die größte Häufigkeit hat, macht micht schon etwas stutzig.
--94.218.8.199 14:51, 26. Nov. 2009 (CET)
- "naïve" wäre ein Wort, das mir im Englischen einfiele (nicht signierter Beitrag von 95.223.228.160 (Diskussion | Beiträge) 12:48, 27. Feb. 2010 (CET))
Abhängigkeit der verwendeten Schreibweise im Englischen
Ich kann mir kaum vorstellen, dass das "z" im Englischen die geringste Häufigkeit hat (vom "ï" einmal abgesehen), wenn es sich um die amerikanische Schreibweise handelt, da hier Verben sehr häufig aus "-ize" enden (statt "-ise" im Britischen Englisch). Leider findet sich im Artikel kein Hinweis darauf, auf welches Englisch sich die Häufigkeit bezieht; hat jemand vielleicht weitere Informationen oder kann den Artikel um die verschiedenen Schreibweisen des Englischen erweitern? -- 95.223.228.160 12:48, 27. Feb. 2010 (CET)