Vertrauensbereich

Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 12. März 2006 um 10:57 Uhr durch RaimundHermann (Diskussion | Beiträge) (Approximation durch die Normalverteilung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Vorbemerkung

Im Artikel Konfidenzintervall wird auf die Berechnung von Konfidenzintervallen für den Mittelwert und anderer statistischen Kenngrößen eingegangen. In diesem Artikel wird auf die Berechnung eines Konfidensintervalls (Vertrauensbereich) für den unbekannten relativen Anteil p einer Grundgesamtheit mit Hilfe der Binomialverteilung und der Betaverteilung eingegangen. Somit erhält man ein genaueres Intervall als bei der Approximation durch die Normalverteilung.

Konfidenzintervall - Begriffsklärung

In einer Meinungsumfrage (n Befragte) geben k Befragte an die Partei A zu wählen. Sei n = 400 und k = 20. Die Zufallsvariable X beschreibt die Anzahl der Personen in der Umfrage, welche angeben die Partei A zu wählen. Die Zufallsvariable X ist binomialverteilt mit den Parametern n und p.

Punktschätzer:

 

Der wahre Wert des relativen Anteils p kann sowohl kleiner, als auch größer als der Punktschätzer p* sein. Mit Sicherheit gilt nur, dass p jeden Wert zwischen 0 und 1 annehmen kann. Wünschenswert ist ein Intervall [pu, po] anzugeben, sodass die Aussage p ∈ [pu, po] mit hoher Wahrscheinlichkeit γ richtig ist. γ heißt Vertrauenswahrscheinlichkeit und [pu, po] Konfidenzintervall (Vertrauensbereich). Meist wird γ gleich 95% gewählt.


Untere Grenze:
P(X ≥ 20) = 0,025
Wenn für einen bestimmten Anteilswert p, die Wahrscheinlichkeit mindestens k Treffer zu erzielen 0,025 unterschreitet, so kann mit ziemlicher Sicherheit ausgeschlossen werden, dass p der gesuchte Anteilswert ist. pu ist somit der kleinste Wert von p, bei dem noch angenommen wird, dass k Befragte angeben die Partei A zu wählen. Für kleinere Werte von p erscheint dies zu unwahrscheinlich.

Obere Grenze:
P(X ≤ 20) = 0,025
Wenn für einen bestimmten Anteilswert p, die Wahrscheinlichkeit höchstens k Treffer zu erzielen, 0,025 unterschreitet, so kann mit ziemlicher Sicherheit ausgeschlossen werden, dass p der gesuchte Anteilswert ist. po ist somit der größte Wert von p, bei dem noch angenommen wird, dass k Befragte angeben die Partei A zu wählen. Für größere Werte von p erscheint dies zu unwahrscheinlich.

Berechnung von p bei bekanntem n und p

Sei X eine binomialverteilte Zufallsvariable mit den Parametern n und p. Die Gleichung P(X ≤ k) = α, lässt sich mit der EXCEL - Funktion BETAINV(Wahrscheinlichkeit; Alpha; Beta; A; B) nach p auflösen. Die Funktion gibt das Quantil der angegebenen Betaverteilung zurück. Eine Approximation durch die Normalverteilung ist somit nicht notwendig.

p = BETAINV(1 - α; k + 1; n - k)

Berechnung des Konfidenzintervalls

n = 400 und k = 20. Es soll ein 95% - Konfidenzintervall bestimmt werden:

Untere Grenze des Konfidenzintervalls:
P(X ≥ 20) = 0,025
P(X ≤ 19) = 0,975
pu = BETAINV(1 - 0,975; 20; 50 - 19) = 0,03081
Selbst bei einem Stimmenanteil von nur 3,1% beträgt die Wahrscheinlichkeit, dass sich in der Stichprobe mindestens 20 Personen befinden, noch 2,5%


Obere Grenze des Konfidenzintervalls:
P(X ≤ 20) = 0,025
po = BETAINV(1-0,025; 21; 50 - 20) = 0,07617
Sogar bei einem Stimmenanteil von 7,6% beträgt die Wahrscheinlichkeit, dass sich in der Stichprobe höchstens 20 Personen befinden, noch 2,5%


Die Berechnung mit Hilfe der Normalverteilung ergibt für diese Werte die Grenzen 0,03161 und 0,07744.
Die häufig verwendete Näherungsformel (beruhend auf der Normalverteilung) ergibt die Werte 0,07136 und 0,02864.


Zusammenhang zwischen Betaverteilung und Binomialverteilung

Für ganzzahlige Parameter a und b lautet die Betaverteilung

 

Wird nun x = 1 - p, a = n - k und b = k + 1 gewählt, so ergibt sich

 

B(k; n; p) ist die Binomialverteilung mit n und p. Mehr Informationen zur Betaverteilung.


Approximation durch die Normalverteilung

Meistens wird diese einfache Näherungsformel verwendet:

 
 
 

Bei einem 95% - Konfidenzintervall ist α = 5%.

Literatur

Norbert Henze: Stochastik für Einsteiger, Viehweg Verlag, 1999, 2. Auflage, ISBN 3-528-16894-3