Zum Inhalt springen

Streuungsmaß (Statistik)

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 28. Mai 2004 um 07:52 Uhr durch Johannes Hüsing (Diskussion | Beiträge) (=Box-and-Whisker-Plot= : Der originalen Definition von Tukey zu ihrem Recht verholfen). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Unter Streuung fasst man in der deskriptiven Statistik verschiedene Maßzahlen zusammen, die der Einschätzung der Streubreite von Stichprobenwerten um ihren Mittelwert dienen. Die verschiedenen Berechnungsmethoden unterscheiden sich prinzipiell durch ihre Beeinflussbarkeit bzw. Empfindlichkeit gegenüber Ausreissern.

Maßzahlen

Spannweite (range)

Die Spannweite ist das einfachste Streuungsmaß und berechnet sich einfach als Distanz zwischen dem größten und dem kleinsten Messwert:

R ist aufgrund der Tatsache, dass - unabhängig von der Stichprobengrösse - nur zwei Werte (die so genannten Extremwerte) berücksichtigt werden, nicht robust gegenüber Ausreissern.

(Inter-)Quartilabstand ((inter-)quartile range)

Hat man die Quartile Q25 und Q75 berechnet, so bezeichnet man deren Differenz als Quartilabstand oder QR:

Innerhalb des QR kommen 50% aller Messwerte zu liegen, er ist - wie auch der Median bzw Q50 - unempfindlich gegenüber Ausreissern.

Absolute Abweichung

oder

Die absolute Abweichung berechnet sich als der Betrag der Abstände der einzelnen Werte vom Median oder arithmetischen Mittelwert. Sie ist robuster als die Standardabweichung.

Varianz und Standardabweichung (variance bzw. standard deviation)

Siehe auch: Varianz, Standardabweichung.


Graphische Darstellungsformen

Box-and-Whisker-Plot

Die wörtliche Übersetzung "Kasten-und-Schnurrhaare-Darstellung" deutet auf die Form der im Graphen verwendeten Symbole hin:

   ___
    |
  -----
  |   |
  |   |
  |   |
  +---+
  |   |
  -----
    |
    |
   ___

Dabei markieren die horizontalen Kanten der box das 25- und das 75%-Quartil und die Enden der whiskers die am weitesten außen liegenden "verbundenen" Werte. "Verbunden" sind alle Werte, die nicht mehr als das 1,5-fache des Interquartilsabstandes von der Box entfernt liegen. Weiter außen liegende Werte werden als Einzelpunkte dargestellt.

Quelle: Tukey, JW. Exploratory Data Analysis. Addison-Wesley Publishing Co., Reading, Massachusetts, 1977

Scatterplot

Wörtlich: "Streudarstellung". ...