Allgemeine Problemstellung:
Zu einer Menge mit a Elementen gibt es zwei voneinander unabhängige Teilmengen
mit b, bzw. c Elementen.
Die Hypergeometrische Wahrscheinlichkeitsverteilung mit den Parametern a, b und c H a,b,c
gibt die Wahrscheinlichkeit dafür an, dass die beiden Teilmengen genau 0, 1, 2, 3, ... Elemente
gemeinsam besitzen.
Beispiele:
In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb.
Es werden 10 Kugeln entnommen.
Die Verteilung H 45,20,10 gibt die Wahrscheinlichkeit dafür an, dass genau
0, 1, 2, 3, ..., 10 der entnommenen Kugeln gelb sind.
Beim Zahlenlotto gibt es 49 numerierte Kugeln; davon werden
bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.
Die Verteilung H 49,6,6 gibt die Wahrscheinlichkeit dafür an, genau
0, 1, 2, 3, ..., 6 "Treffer" zu erzielen.
Hilfsgröße "a über b":
Die Zahl "a über b" bezeichnet die Anzahl der verschiedenen Möglichkeiten,
aus einer Menge mit a Elementen eine Teilmenge mit b Elementen auszuwählen.
Es gilt: ( a über b ) = ( a * ( a - 1 ) * ( a - 2 ) * ... * ( a - b + 1 ) ) / ( 1 * 2 * 3 * ... * b )
Beispiel: ( 10 über 3 ) = ( 10 * 9 * 8 ) / ( 1 * 2 * 3 ) = 720 / 6 = 120
Es gilt immer: ( a über 0 ) = 1
Die hier benötigte Hilfsgröße "a über b" wird im allgemeinen als Binomialkoeffizient bezeichnet und besitzt eine eigene Darstellung:
Rechenbeispiel H 45,20,10 ( 4 ):
Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit für genau 4 gelbe Kugeln ermittelt werden.
Die Wahrscheinlichkeit ergibt sich aus:
Anzahl der Möglichkeiten, genau 4 gelbe ( und damit genau 6 violette ) Kugeln auszuwählen
geteilt durch
Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen
Es gibt ( 20 über 4 ) = 4845 Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.
Es gibt ( 25 über 6 ) = 177100 Möglichkeiten, genau 6 violette Kugeln auszuwählen.
Da jede "gelbe Möglichkeit" mit jeder "violetten Möglichkeit" kombiniert werden kann,
ergeben sich 4845 * 177100 = 858049500 Möglichkeiten für genau 4 gelbe und 6 violette Kugeln.
H 45,20,10 ( 4 ) |
= ( 20 über 4 ) * ( 25 über 6 ) / ( 45 über 10 ) |
Das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe Kugeln entnommen.
Eigenschaften der Hypergeometrische Verteilung:
Für alle natürliche Zahlen a, b, c, d mit a >= b und a >= c gilt:
- H a,b,c = H a,c,b
- H a,b,c ( d ) = H a,c,b ( d )
- H a,b,c ( d ) = ( b über d ) * ( ( a - b ) über ( c - d ) ) / ( a über c )
- H a,b,c ( d ) = ( c über d ) * ( ( a - c ) über ( b - d ) ) / ( a über b )
- Die Verteilung H a,b,c besitzt den Erwartungswert b * c / a
- Die Verteilung H a,b,c besitzt die Streuung ( b * c / a ) * ( 1 - b / a ) * ( a - c ) / ( a - 1 )
- Die Hypergeometrische Verteilung kann unter bestimmten Umständen durch die Binomialverteilung angenähert werden.
Mathematische Definition
Die Massefunktion der Hypergeometrischen Verteilung ist
Der Erwartungswert einer Zufallsvariable mit Hypergeometrischer Verteilung ist
Und ihre Varianz