Zum Inhalt springen

Wilcoxon-Rangsummentest

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 13. Juni 2006 um 18:56 Uhr durch 195.93.60.6 (Diskussion) (sprachliche Überarbeitung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Der Wilcoxon-Rangsummentest ist der gebräuchlichste nichtparametrische Test für das Lokationsproblem in der mathematischen Statistik und somit für den Vergleich der Mediane zweier abhängiger Zufallsgrößen geeignet. Ein weiterer, ähnlicher Test ist der Mann-Whitney-U-Test.

Erklärung an einem Beispiel

Von zwei Messgeräten gleicher Herstellung ist eins möglicherweise falsch eingestellt. Zur Überprüfung werden mit beiden Geräten einige Messungen gemacht und zwar 10 Messungen X mit dem richtig eingestellten Gerät und 12 Messungen Y mit dem verdächtigen. Wir dürfen unterstellen, dass die Wahrscheinlichkeitsverteilungen von X und von Y bis auf eine Verschiebung einander ähnlich sind. Als Nullhypothese nehmen wir an, dass beide Geräte richtig sind, also dass die Verschiebung gleich Null ist. Als Alternativhypothese nehmen wir einfachshalber an, das andere Gerät weise zu hohe Werte auf. Wir ordnen die Messwerte beider Instrumente nach Größe:

   X X X Y X Y X Y Y X Y Y Y X X Y X X Y Y Y Y

Wenn die Nullhypothese richtig ist, kann an jeder Stelle in der Anreihung mit gleicher Wahrscheinlichkeit ein X oder ein Y stehen. Wenn aber die Alternativhypothese gültig ist, werden die X-Werte sich mehr am Anfang der Reihe konzentrieren und die Y-Werte am Ende. Ganz extrem könnten wir gefunden haben:

   X X X X X X X X X X Y Y Y Y Y Y Y Y Y Y Y Y

Es ist dann klar: das verdächtige Gerät misst tatsächlich zu hoch. Finden wir aber:

   Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X Y Y

dann ist dies zwar ein merkwürdiges Ergebnis, aber kein Grund, dem verdächigen Gerät zu misstrauen.

Zu welcher Schlussfolgerung führt nun das gefundene Ergebnis? Auf den ersten Blick scheinen die X-Werte etwas mehr links und die Y-Werte rechts zu liegen. Das wäre ein Beweis gegen die Nullhypothese. Aber ist das Ergebnis signifikant? Dazu berechnen wir als Testgröße W die Gesamtsumme der Ränge der X-Werte in der Anreihung, in unserem Fall also:

   W = 1+2+3+5+7+10+14+15+17+18 = 92

Klar ist: je kleiner W ist, desto unglaubhafter wird die Nullhypothese. Das bringt uns auf die Frage: Ist der gefundene Wert W = 92 zu klein, das heißt so klein, dass es Grund gibt, die Nullhypothese abzulehnen? Mit Hilfe der Wahrscheinlichkeitsrechnung kann die Verteilung von W unter der Bedingung der Nullhypothese berechnet werden. Dazu benutzt man die Feststellung, dass die Nullhypothese jeder Anordnung der X- und Y-Werte dieselbe Wahrscheinlichkeit zuweist. Es gibt Tabellen und Computerprogramme für die benötigten Kalkulationen.

Annahmen

Die Zufallsvariablen X und Y haben stetige Verteilungsfunktionen F bzw. G, die sich nur um eine Verschiebung m voneinander unterscheiden, das heißt:

Es liegen unabhängig Stichproben von X und von Y vor, die auch untereinander unabhängig sind.

Teststatistik

Der Wilcoxon-Rangsummentest für das Testverfahren der Nullhypothese:

hat als Teststatistik:

,

wobei der Rang der i-ten X in der gepoolten, geordneten Stichprobe ist. Es werden also nur die Ränge von aufsummiert. Abhängig von der Alternativhypothese wird die Nullhypothese abgelehnt für zu kleine, zu große oder zu kleine und zu große Werte von .


Kritische Werte

Die exakte Verteilung von unter der Bedingung der Nullhypothese kann mittels kombinatorischer Überlegungen leicht gefunden werden. Allerdings steigt der Rechenaufwand für große Werte von rasch an. Man kann die exakten kritischen Werte:

mittels einer Rekursionsformel berechnen. Die Formel entsteht, wenn mann untersucht, ob der letzte Wert in der Anordnung ein X (...X) oder ein Y (...Y) ist.

 :


Literatur

  • Büning, Trenkler, Nichtparametrische statistische Methoden, de Gruyter, ISBN 3110163519