Zum Inhalt springen

Standardabweichung (Stochastik)

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 12. September 2005 um 14:08 Uhr durch 213.135.237.115 (Diskussion) (Berechnung für auflaufende Messwerte). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Vorlage:Mathematische Symbole Die Standardabweichung ist ein Maß für die Streuung der Werte einer Zufallsgröße. Sie ist definiert als die Wurzel aus der Varianz. Die Varianz ist das zweite Moment einer Verteilung, der Erwartungswert das erste Moment.

Liegt eine Menge vergleichbarer Objekte vor (hier {}), etwa Noten einer Klassenarbeit, und will man eine Aussage über ihre Einheitlichkeit machen, so sind die wichtigsten Maßzahlen die Anzahl der Noten , der Mittelwert und die Standardabweichung. Letztere ist eine Maßzahl der Streuung. Wird in der Statistik eine Auswertung über eine Menge von Werten benötigt, gibt die Standardabweichung ein sinnvolles Maß für die Streuung um den Mittelwert an.

Sie heißt auch mittlerer Fehler oder RMS error (root mean square). Als mathematisches Zeichen sind σ, s, m.F. oder englisch rms üblich. Man nennt den mittleren Fehler auch Plus/minus (±) und schreibt ihn direkt hinter den Mittel- beziehungsweise Durchschnittswert. Letzterer wird z. B. mit MW oder Ø abgekürzt...

Ein Beispiel (mit Schwankungsbreite)

Mittleres Alter (beispielsweise in einer Tanzschule) = (17,5 ± 1,2) Jahre.
Beide Werte zusammen ergeben die mittlere Schwankungsbreite, MW ± s = 16,3 bis 18,7 Jahre.
Sie gilt im Falle normalverteilter Mengen (siehe Glockenkurve) mit einer Wahrscheinlichkeit von ca. 68 % (jene von 2σ mit ca. 95 %). Demnach lässt obige Schwankungsbreite erwarten, dass

  • 16 % der Tanzschüler jünger als 16,3 Jahre sind (davon 2 - 3 % unter 15,1 Jahre) und
  • 16 % älter als 18,7 Jahre (davon 2 - 3 % über 19,9 Jahre) sind.

Unser Beispiel hat jedoch kaum Normalverteilung, denn es sind vermutlich von den Kursteilnehmern mehr als 2,5 % älter als 20 Jahre.

  • Werte außerhalb der zwei- bis dreifachen Standardabweichung nennt man Ausreißer. Ausreißer können ein Hinweis auf grobe Fehler der Datenerfassung sein. Es kann den Daten aber auch eine stark schiefe Verteilung zu Grunde liegen. Andererseits muss ca. jeder 20ste Messwert außerhalb der zweifachen Standardabweichung liegen.

Mittlerer Fehler, Streuung und Varianz

Die Standardabweichung (m. F.) ist die Quadratwurzel einer anderen Streuungsmaßzahl, der Varianz. Die Standardabweichung hat gegenüber der Varianz den Vorteil, dass sie die gleiche Einheit hat wie die ursprünglichen Messwerte.

Wenn die Zahl der Kinder in einem Haushalt untersucht wird, so ist die Einheit der Varianz ein Quadratkind, die Einheit der Standardabweichung aber wieder ein Kind.

Mathematische Definition der Standardabweichung

Dabei ist

  • die Standardabweichung
  • der Erwartungswert (Mittelwert)
  • der Umfang der Grundgesamtheit (Anzahl der Werte bzw. Anzahl der Freiheitsgrade)
  • die Merkmalsausprägungen am -ten Element der Grundgesamtheit (das -te Element in der Menge der Werte)

Die Standardabweichung der Grundgesamtheit kann aus einer Stichprobe auf verschiedene Weise geschätzt werden.

Zur schnellen Schätzung von sucht man jenes Sechstel der Werte, die am kleinsten beziehungsweise am größten sind. Die Standardabweichung ist dann die halbe Differenz der beiden Grenzwerte. Bei unübersichtlichen Verteilungen oder wenn man nur "im Kopf" rechnen kann, geht auch folgende Abschätzung: (Maximalwert-Minimalwert)/3. Erstaunlicherweise liefert diese Schätzung sowohl bei Normalverteilungen wie Gleichverteilungen oder hohen Variationskoeffizienten gute grobe Schätzungen.

Erwartungstreue Schätzung der Standardabweichung aus einer Stichprobe

mit Bezeichnungen wie oben.

Dabei ist

  • die erwartungstreue Schätzung der Standardabweichung und
  • die Gammafunktion

Der Korrekturfaktor ist in diesem Fall

und die erwartungstreue Schätzung für die Standardabweichung ist damit näherungsweise 1,064.

Korrekturfaktoren für die erwartungstreue Schätzung der Standardabweichung
Stichprobenumfang Korrekturfaktor
2 1,253314
5 1,063846
10 1,028109
15 1,018002

Maximum-Likelihood-Schätzung für die Standardabweichung einer Normalverteilung

Die eindimensionale Normalverteilung kann unter anderem so dargestellt werden, dass die Standardabweichung ein Parameter der Verteilung ist. Bei dieser Schätzung kann die Eigenschaft der Maximum-Likelihood-Schätzung genutzt werden, dass eine monotone Transformation einer Maximum-Likelihood-Schätzung eine Maximum-Likelihood-Schätzung für die monotone Transformation des geschätzten Parameters ist. Das bedeutet, dass die Quadratwurzel einer Maximum-Likelihood-Schätzung eines Parameters, der nur positiv sein kann, eine Maximum-Likelihood-Schätzung für die Quadratwurzel dieses Parameters ist.

Diese Schätzung ist eine Maximum-Likelihood-Schätzung für einen Parameter der Normalverteilung oder für eine Transformation dieses Parameters. Sie ist nicht auf die Schätzung der Standardabweichung einer beliebigen Verteilung zu übertragen.

Die Maximum-Likelihood-Schätzung für die Standardabweichung einer Poisson-Verteilung ist beispielsweise die Quadratwurzel aus dem arithmetischen Mittel.

Als Maximum-Likelihood-Schätzung für die Standardabweichung aus der Stichprobe {3, 4, 5, 6, 7} erhält man also

Beispiele

Das aus der Varianz bekannte Würfelbeispiel hier für die Standardabweichung:

Die Standardabweichung beim 500-maligen Würfeln und der Zufallsgröße X: Anzahl der Einsen

Berechnung für auflaufende Messwerte

In Systemen, die kontinuierlich große Mengen an Messwerten erfassen, ist es oft unpraktisch -- oder auf Grund des Speicherbedarfs auch unmöglich -- alle Messwerte zwischenzuspeichern, um die Standardabweichung zu berechnen.

In diesem Zusammenhang ist es günstiger, eine modifizierte Formel zu verwenden, die den kritischen Term umgeht. Dieser kann nicht für jeden Messwert sofort berechnet werden, da der Mittelwert nicht konstant ist.

Durch Anwendung der 1. binomischen Formel und der Definition des Mittelwerts gelangt man zur Darstellung

die sich für jeden eintreffenden Messwert sofort aktualisieren lässt, indem die Summe der Messwerte sowie die Summe ihrer Quadrate mitgeführt werden.