Konfidenzintervall
Mit einem Konfidenzintervall kann man in der mathematischen Statistik die Lage eines Parameters mit einer bestimmten Wahrscheinlichkeit abschätzen.
Beschreibung des Verfahrens
Man interessiert sich für den unbekannten Verteilungsparameter einer Zufallsvariablen. Der „wahre“ Parameter Γ wird durch eine Schätzfunktion g aus einer Stichprobe vom Umfang n geschätzt. Es wird davon ausgegangen, dass die Stichprobe in etwa die Grundgesamtheit wiederspiegelt und dass deshalb die Schätzung in der Nähe des wahren Parameters liegen müsste. Die Schätzfunktion ist eine Zufallsvariable mit einer Verteilung, die den Parameter Γ enthält.
Man kann zunächst mit Hilfe der Verteilung ein Intervall angeben, in das die Zufallsvariable g mit einer Wahrscheinlichkeit 1−α fällt. 1−α wird Konfidenzkoeffizient genannt.
Das Verfahren wird anhand eines mit dem Erwartungswert μ und der Varianz σ2 normalverteilten Merkmals demonstriert: Es soll der Erwartungswert μ dieser Normalverteilung geschätzt werden. Verwendet wird die Schätzfunktion
wobei die Zufallsvariable Xi (i=1,...,n) für die i-te Beobachtung sorgt. Es ist
Die Grenzen des Intervalls
in dem mit der Wahrscheinlichkeit 1−α liegt, bestimmen sich aus der Beziehung
Normalverteilung des Mittels
Man standardisiert und erhält für die standardisierte Zufallsvariable
die Wahrscheinlichkeit
wobei z(α/2) das (α/2)-Quantil der Standardnormalverteilung ist. Löst man nach μ auf, resultiert aus dem Zufallsintervall
das (1−α)-Konfidenzintervall für μ
Es liegt also der wahre Parameter μ mit einer Wahrscheinlichkeit von 1−α in dem durch bestimmten Intervall. Ist die Stichprobe aber extrem ausgefallen, liegt der wahre Parameter nicht in dem Intervall. Dies ist in α·100 % aller Stichproben der Fall.
Von besonderem Interesse ist die Breite des Konfidenzintervalls. Diese bestimmt sich durch die Standardabweichung der Schätzfunktion. Durch Erhöhung des Stichprobenumfangs kann die Breite verringert werden. Erwünscht ist in der Regel ein schmales Konfidenzintervall.
Ausgewählte Konfidenzintervalle
Erwartungswert eines normalverteilten Merkmals mit bekannter Varianz: |
|
Erwartungswert eines normalverteilten Merkmals mit unbekannter Varianz. Die Varianz der Grundgesamheit wird durch die Stichprobenvarianz
|
|
Erwartungswert eines unbekannt verteilten Merkmals mit unbekannter Varianz, falls n>50 ist. |
|
Varianz eines normalverteilten Merkmals. χ2(p;k) ist das p-Quantil der >χ2-Verteilung mit k Freiheitsgraden. |
|
Anteilswert einer dichotomen Grundgesamtheit bei einem Urnenmodell mit Zurücklegen, falls
|
Ist die Zahl N der Elemente in der Grundgesamtheit bekannt, kann auch ein Konfidenzintervall für ein Urnenmodell ohne Zurücklegen angegeben werden. Hier wird die Standardabweichung noch mit einem Korrekturfaktor modifiziert. Wenn der Stichprobenumfang n < 9/(p(1-p)) ist, kann ein exaktes Konfidenzintervall mit Hilfe der F-Verteilung angegeben werden.
Bemerkung
Konfidenzintervalle können gelegentlich auch Hypothesentests ersetzen. Beispielsweise testet man in der Regressionsanalyse, ob im multiplen Regressionsmodell mit der geschätzen Regressionshyperebene
die wahren Regressionskoeffizienten βj (j = 1, ... , m) gleich Null sind. Wenn die Hypothese nicht abgelehnt wird, sind die entsprechenden Regressoren xj vermutlich für die Erklärung der abhängigen Variablen y unerheblich. Eine entsprechende Information liefert das Konfidenzintervall für einen Regressionskoeffizienten: Überstreicht das Konfidenzintervall die Null, kann mit einer Wahrscheinlichkeit von 1-α der Regressionskoeffizient ebenso gut Null sein, d.h. er ist statistisch insignifikant.