Unter Streuung fasst man in der deskriptiven Statistik verschiedene Maßzahlen zusammen, die der Einschätzung der Streubreite von Stichprobenwerten um ihren Mittelwert dienen. Die verschiedenen Berechnungsmethoden unterscheiden sich prinzipiell durch ihre Beeinflussbarkeit bzw. Empfindlichkeit gegenüber Ausreissern.
Maßzahlen
Spannweite (range)
Die Spannweite ist das einfachste Streuungsmaß und berechnet sich einfach als Distanz zwischen dem größten und dem kleinsten Messwert:
R ist aufgrund der Tatsache, dass - unabhängig von der Stichprobengrösse - nur zwei Werte (die so genannten Extremwerte) berücksichtigt werden, nicht robust gegenüber Ausreissern.
(Inter-)Quartilabstand ((inter-)quartile range)
Hat man die Quartile Q25 und Q75 berechnet, so bezeichnet man deren Differenz als Quartilabstand oder QR:
Innerhalb des QR kommen 50% aller Messwerte zu liegen, er ist - wie auch der Median bzw Q50 - unempfindlich gegenüber Ausreissern.
Absolute Abweichung
oder
Die absolute Abweichung berechnet sich als der Betrag der Abstände der einzelnen Werte vom Median oder arithmetischen Mittelwert. Sie ist robuster als die Standardabweichung.
Varianz und Standardabweichung (variance bzw. standard deviation)
Siehe auch: Varianz, Standardabweichung.
Graphische Darstellungsformen
Box-and-Whisker-Plot
Die wörtliche Übersetzung "Kasten-und-Schnurrhaare-Darstellung" deutet auf die Form der im Graphen verwendeten Symbole hin:
___ | ----- | | | | | | +---+ | | ----- | | ___
Dabei markieren die horizontalen Kanten der box das 25- und das 75%-Quartil und die Enden der whiskers die am weitesten außen liegenden "verbundenen" Werte. "Verbunden" sind alle Werte, die nicht mehr als das 1,5-fache des Interquartilsabstandes von der Box entfernt liegen. Weiter außen liegende Werte werden als Einzelpunkte dargestellt.
Quelle: Tukey, JW. Exploratory Data Analysis. Addison-Wesley Publishing Co., Reading, Massachusetts, 1977
Scatterplot
Wörtlich: "Streudarstellung". ...