Standardabweichung (Stochastik)
Die Standardabweichung ist eine Maßzahl der Streuung. Wird in der Statistik eine Auswertung über eine Menge von Werten benötigt, gibt die Standardabweichung ein sinnvolles Maß für die Streuung um den Mittelwert an.
Sie heißt auch mittlerer Fehler oder r.m.s. error (root mean square Fehler). Als mathematisches Zeichen sind σ , s , m.F. oder englisch rms üblich. Oft nennt man den mittleren Fehler auch Plus/minus (±) und schreibt ihn direkt hinter den Mittel- bzw. Durchschnittswert. Letzterer wird oft mit MW oder Ø abgekürzt.
Ein Beispiel (mit Schwankungsbreite)
Mittleres Alter (z. B. in einer Tanzschule) = 17,5 ± 1,2 Jahre.
Beide Werte zusammen ergeben die
mittlere Schwankungsbreite , MW ± s = 16,3 bis 18,7 Jahre.
Sie gilt im Falle normalverteilter Mengen (siehe [[Gau%DFsche_Glockenkurve|Glockenkurve]]) mit einer Wahrscheinlichkeit von 68 Prozent (jene von 2σ mit 95 %). Demnach lässt obige Schwankungsbreite erwarten, dass
- 16 % der Tanzschüler jünger als 16,3 Jahre sind (davon 2-3 % unter 15 Jahre) und
- 16 % älter als 18,7 Jahre (davon 2-3 % über 19,9 Jahre) sind.
Unser Beispiel hat jedoch kaum Normalverteilung => vermutlich sind von den Kursteilnehmern mehr als 2,5 % älter als 20 Jahre.
- Werte außerhalb der 2- bis 3fachen Standardabweichung nennt man Ausreisser; sie deuten häufig auf grobe Fehler der Datenerfassung hin.
Mittlerer Fehler, Streuung und Varianz
Die Standardabweichung (m. F.) ist die Quadratwurzel einer anderen Streuungsmaßzahl, der Varianz. Sie hat gegenüber dieser den Vorteil, dass sie die gleiche Einheit hat wie die ursprünglichen Messwerte.
- Wenn die Zahl der Kinder in einem Haushalt untersucht wird, so ist die Einheit der Varianz ein Quadratkind, die Einheit der Standardabweichung aber wieder ein Kind.
Mathematische Definition der Standardabweichung
Dabei ist
- die Standardabweichung
- der Erwartungswert
- der Umfang der Grundgesamtheit
- die Merkmalsausprägungen am -ten Element der Grundgesamtheit
Die Standardabweichung der Grundgesamtheit kann aus einer Stichprobe auf verschiedene Weise geschätzt werden.
Gebräuchliche Formel zur Schätzung der Standardabweichung aus einer Stichprobe
Diese Formel ist eine Schätzung, die durch keine besondere Eigenschaft ausgezeichnet ist. Sie ist weder erwartungstreu noch eine Maximum-Likelihood-Schätzung für die Standardabweichung. Trotzdem ist sie weit verbreitet.
Dabei ist
- die Schätzung für die Standardabweichung
- die Merkmalsausprägung am -ten Element der Stichprobe
- das arithmetische Mittelwert der Stichprobe (und damit die erwartungstreue Schätzung für den Erwartungswert).
- der Stichprobenumfang
Man hat bei einer Stichprobe fünf Werte gemessen: 3, 4, 5, 6, 7
Man soll nun die Schätzung für die Standardabweichung errechnen.
Mit Hilfe einer Arbeitstabelle kann die Summe der quadrierten Abweichungen vom Stichprobenmittelwert mit dem Wert 10 berechnet werden.
Um eine erwartungstreue Schätzung für die Varianz zu erhalten, teilt man diese Summe durch die Zahl der Messwerte n weniger 1.
Das ergibt die Schätzung für die Varianz 10/4 = 2,5
Daraus nimmt man die Quadratwurzel:
Das ergibt die gebräuchliche Schätzung für die Standardabweichung von ca. 1,581.
Praktische Tipps
Um die Standardabweichung einer Messreihe mit der Hand zu errechnen, braucht man viel Zeit. Leichter geht es mit einer Tabellenkalkulation wie Excel. Auch die meisten Taschenrechner enthalten statistische Funktionen, die eine Berechnung erleichtern. Siehe z.B. Kcalc unter KDE Linux oder der Taschenrechner unter Windows Zubehör mit der wissenschaftlichen Darstellung..
Zur schnellen Schätzung von sucht man jenes Sechstel der Werte, die am kleinsten bzw. am größten sind. Die Standardabweichung ist dann die halbe Differenz der beiden Grenzwerte.
Erwartungstreue Schätzung der Standardabweichung aus einer Stichprobe
mit Bezeichnungen wie oben.
Der Korrekturfaktor ist in diesem Fall
und die erwartungstreue Schätzung für die Standardabweichung ist damit näherungsweise 1,682
Stichprobenumfang |
Korrekturfaktor |
2 |
1,253314 |
5 |
1,063846 |
10 |
1,028109 |
15 |
1,018002 |
Maximum-Likelihood-Schätzung für die Standardabweichung einer Normalverteilung
Die eindimensionale Normalverteilung kann unter anderem so dargestellt werden, dass die Standardabweichung ein Parameter der Verteilung ist. Bei dieser Schätzung kann die Eigenschaft der Maximum-Likelihood-Schätzung genutzt werden, dass eine monotone Transformation einer Maximum-Likelihood-Schätzung eine Maximum-Likelihood-Schätzung für die monotone Transformation des geschätzten Parameters ist. Das bedeutet, dass die Quadratwurzel einer Maximum-Likelihood-Schätzung eines Parameters, der nur positiv sein kann, eine Maximum-Likelihood-Schätzung für die Quadratwurzel dieses Parameters ist.
Diese Schätzung ist eine Maximum-Likelihood-Schätzung für einen Parameter der Normalverteilung oder für eine Transformation dieses Parameters. Sie ist nicht auf die Schätzung der Standardabweichung einer beliebigen Verteilung zu übertragen.
Die Maximum-Likelihood-Schätzung für die Standardabweichung einer Poisson-Verteilung ist beispielsweise die Quadratwurzel aus dem arithmetischen Mittel.
Als Maximum-Likelihood-Schätzung für die Standardabweichung aus der Stichprobe {3, 4, 5, 6, 7} erhält man also