Trennschärfe eines Tests
Power (englisch Kraft, Macht) beschreibt in der Statistik die Aussagekraft eines statistischen Tests oder auch einer medizinischen Studie.
Die Teststärke ist die Wahrscheinlichkeit, die der "Alternativhypothese" (oft: "es gibt einen Unterschied") "H1" zugeordnet wird, d. h. die Teststärke gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer spezifischen H1 entscheidet, falls diese richtig ist. (Die abzulehnende Hypothese wird H0, die Nullhypothese genannt.)
Die Teststärke hat den Wert 1-β, wobei β die Wahrscheinlichkeit bezeichnet, den Fehler 2. Art zu begehen. Diese Wahrscheinlichkeit heißt auch Fehlerwahrscheinlichkeit 2. Art.
Für medizinische Behandlungen schlägt Cohen (1969) für β einen 4mal so hohen Wert vor wie für α, die Teststärke gibt er somit ungefähr mit 1-4*0,05=80%, oder weniger an, wenn α=0,05 ist.
Wahrer Sachverhalt: H0 Es gibt keinen Unterschied | Wahrer Sachverhalt: H1 Es gibt einen Unterschied | |
---|---|---|
durch einen statistischen Test fällt eine Entscheidung für: H0 | 1-α | β (Fehler 2. Art) |
durch einen statistischen Test fällt eine Entscheidung für: H1 | α (Fehler 1. Art) | 1-β "Power" |
Merkmale der Power
Die Power wird größer [1]:
- mit wachsender Differenz von und (also mit wachsender Effektgröße ; das bedeutet: ein großer Unterschied wird seltener übersehen, als ein kleiner Unterschied),
- bei kleiner werdender Merkmalsstreuung ,
- mit größer werdendem (sofern nicht festgelegt ist),
- mit wachsendem Stichprobenumfang (da der Standardfehler kleiner ist)
Siehe auch
Literatur
- J. Cohen: Statistical Power Analysis for the Behavior Science. 1969.