„Median“ – Versionsunterschied
[ungesichtete Version] | [ungesichtete Version] |
→Median einer Verteilung: Grafik rein, das mit den zentralen Verteilungen raus. Ist wenig hilfreich |
|||
Zeile 22: | Zeile 22: | ||
== Median einer Verteilung == |
== Median einer Verteilung == |
||
[[Image:BäckereiMed.png|300px|thumb|Dichtefunktion einer Dreiecksverteilung mit Median]] |
|||
Eine Verallgemeinerung des Begriffes liefert die [[Stochastik|stochastische]] Betrachtung einer [[Zufallsvariable]] <math>X</math> bzw. deren [[Verteilungsfunktion]] <math>F</math>. Dort ist der '''Median''' das 0,5-[[Quantil]], also |
Eine Verallgemeinerung des Begriffes liefert die [[Stochastik|stochastische]] Betrachtung einer [[Zufallsvariable]] <math>X</math> bzw. deren [[Verteilungsfunktion]] <math>F</math>. Dort ist der '''Median''' das 0,5-[[Quantil]], also |
||
:<math>\inf\{x\in\R:F(x)\ge \frac 12\}</math>. |
:<math>\inf\{x\in\R:F(x)\ge \frac 12\}</math>. |
||
Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten ''Obermedian''.<br /> |
Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten ''Obermedian''.<br /> |
||
Er ist, beispielsweise neben Erwartungswert und Modus, ein [[Lageparameter]]. |
|||
Er gehört zu den Maßzahlen der [[zentrale Verteilung|zentralen Verteilung]], auch [[Parameter (Statistik)#Lageparameter|Lagemaße]] genannt. |
|||
Ein Beispiel für den Median einer Verteilungs liefert die Dreiecksverteilung |
|||
:<math>f(x) = \frac {x} {18} \quad f \ddot ur \quad 0 \le x \le 6.</math> |
|||
Der x-Wert, der die Fläche unter der Dichtefunktion in zwei gleiche Flächen teilt, ist 4,24: <math>P(X \le 4,24) = 0,5</math>. |
|||
== Median von gruppierten Daten == |
== Median von gruppierten Daten == |
Version vom 24. September 2006, 11:36 Uhr
Der Median (oder Zentralwert) bezeichnet eine Grenze zwischen zwei Hälften. So wird manchmal in der Geometrie die Seitenhalbierende eines Dreiecks als Median bezeichnet, da sie das Dreieck in zwei flächengleiche Hälften teilt. Häufiger jedoch wird der Begriff in der Statistik verwendet, wo der Median eine Stichprobe oder allgemein eine Wahrscheinlichkeitsverteilung halbiert. Gegenüber dem arithmetischen Mittel, auch Durchschnitt genannt, hat der Median meistens den Vorteil, robuster gegenüber Ausreißern zu sein.
Median einer Stichprobe
Bei einer sortierten Folge von Messwerten („geordnete Stichprobe“) ist der Median der Wert des Elementes, das in der Mitte liegt. Bei einer geraden Anzahl von Messwerten wird je nach Definition eines der beiden mittleren Elemente oder deren arithmetisches Mittel als Median gewählt.
Eine mögliche Definition ist also:
Der Median einer geordneten Stichprobe von Messwerten berechnet sich als
- .
Oft möchte man dagegen sicherstellen, dass der Median in jedem Fall eines der Elemente der Stichprobe sein soll. In diesem Fall wird alternativ zu dieser Definition bei einer geraden Anzahl von Elementen entweder der Untermedian oder der Obermedian genutzt und als Median bezeichnet.
Diese Medianbestimmung spielt beispielsweise bei Datenbanksystemen eine große Rolle, wie z. B. bei SELECT-Abfragen mittels des Medians der Mediane.
Beispiele
- Messwerte 1, 2, 4, 5, 18: Ungerade Anzahl. Der Median ist der Wert an der mittleren Stelle, also 4. Das arithmetische Mittel dagegen ist 6.
- Messwerte 1, 1, 2, 3, 4, 37: Gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Das arithmetische Mittel dagegen ist 8.
Median einer Verteilung

Eine Verallgemeinerung des Begriffes liefert die stochastische Betrachtung einer Zufallsvariable bzw. deren Verteilungsfunktion . Dort ist der Median das 0,5-Quantil, also
- .
Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten Obermedian.
Er ist, beispielsweise neben Erwartungswert und Modus, ein Lageparameter.
Ein Beispiel für den Median einer Verteilungs liefert die Dreiecksverteilung
Der x-Wert, der die Fläche unter der Dichtefunktion in zwei gleiche Flächen teilt, ist 4,24: .
Median von gruppierten Daten
Vor allem in den Sozialwissenschaften wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern jene nur in Intervallen gruppiert vorliegen. So wird beispielsweise bei Umfragen selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in welchem das Gehalt liegt. Die Berechnungsvorschrift für diese Schätzung unterscheidet sich deswegen von der oben vorgestellten exakten Berechnung des Medians.
Es seien die Anzahl aller Daten, die jeweilige Anzahl der Daten der -ten Gruppe und bzw. die entsprechenden oberen bzw. unteren Intervallgrenzen.
Zunächst wird nun die mediane Klasse (oder mediane Gruppe) bestimmt, d.h. diejenige Gruppe, in welche der Median (nach obiger, konventioneller Definition) hineinfällt, z.B. die -te Gruppe. Wenn keine weiteren Angaben über die Verteilung der Daten gegeben sind, wird z.B. Gleichverteilung postuliert, sodass man sich der linearen Interpolation als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:
Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.
Beispiel: Einkommen
Klasse () | Bereich ( bis ) | Gruppengröße () |
---|---|---|
1 | mind. 0, weniger als 1500 | 160 |
2 | mind. 1500, weniger als 2500 | 320 |
3 | mind. 2500, weniger als 3500 | 212 |
, also liegt der Median in der 2. Klasse (d.h. ), da die erste Klasse nur 160 Elemente umfasst.
Somit ergibt sich als Schätzung für den Median .
Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der Summenkurve. Hier wird der Abzissenwert gesucht, der zum Ordinatenwert gehört. Bei kleinerem und geradem kann auch stattdessen der Ordinatenwert gewählt werden.
Vorteile des Medians
Durch seine Resistenz gegen Ausreißer eignet sich der Median besonders gut als Lageparameter für nicht normalverteilte Grundgesamtheiten.
Beispiel:
Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:
- 9 Personen verdienen EUR 1.000 und
- 1 Person verdient EUR 1.000.000.
Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.