Hypergeometrische Verteilung

diskrete Wahrscheinlichkeitsverteilung
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 22. Januar 2004 um 15:01 Uhr durch JakobVoss (Diskussion | Beiträge) (+Mathematische Definition -Monstertabelle). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Allgemeine Problemstellung:

Zu einer Menge mit a Elementen gibt es zwei voneinander unabhängige Teilmengen mit b, bzw. c Elementen.
Die Hypergeometrische Wahrscheinlichkeitsverteilung mit den Parametern a, b und c a,b,c gibt die Wahrscheinlichkeit dafür an, dass die beiden Teilmengen genau 0, 1, 2, 3, ... Elemente gemeinsam besitzen.

Beispiele:

In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb. Es werden 10 Kugeln entnommen.
Die Verteilung 45,20,10 gibt die Wahrscheinlichkeit dafür an, dass genau 0, 1, 2, 3, ..., 10 der entnommenen Kugeln gelb sind.

Beim Zahlenlotto gibt es 49 numerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.
Die Verteilung 49,6,6 gibt die Wahrscheinlichkeit dafür an, genau 0, 1, 2, 3, ..., 6 "Treffer" zu erzielen.

Hilfsgröße "a über b":

Die Zahl "a über b" bezeichnet die Anzahl der verschiedenen Möglichkeiten, aus einer Menge mit a Elementen eine Teilmenge mit b Elementen auszuwählen.
Es gilt: ( a über b ) = ( a * ( a - 1 ) * ( a - 2 ) * ... * ( a - b + 1 ) ) / ( 1 * 2 * 3 * ... * b )
Beispiel: ( 10 über 3 ) = ( 10 * 9 * 8 ) / ( 1 * 2 * 3 ) = 720 / 6 = 120
Es gilt immer: ( a über 0 ) = 1

Die hier benötigte Hilfsgröße "a über b" wird im allgemeinen als Binomialkoeffizient bezeichnet und besitzt eine eigene Darstellung:

Rechenbeispiel H 45,20,10 ( 4 ):

farbige Kugeln
Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit für genau 4 gelbe Kugeln ermittelt werden.
Die Wahrscheinlichkeit ergibt sich aus:
Anzahl der Möglichkeiten, genau 4 gelbe ( und damit genau 6 violette ) Kugeln auszuwählen
geteilt durch
Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen

Es gibt ( 20 über 4 ) = 4845 Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.
Es gibt ( 25 über 6 ) = 177100 Möglichkeiten, genau 6 violette Kugeln auszuwählen.
Da jede "gelbe Möglichkeit" mit jeder "violetten Möglichkeit" kombiniert werden kann, ergeben sich 4845 * 177100 = 858049500 Möglichkeiten für genau 4 gelbe und 6 violette Kugeln.

H 45,20,10 ( 4 )

 = ( 20 über 4 ) * ( 25 über 6 ) / ( 45 über 10 )
 = 4845 * 177100 / 3190187286
 = 858049500 / 3190187286
 = 0.2689652434405696

Das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe Kugeln entnommen.

Eigenschaften der Hypergeometrische Verteilung:

Für alle natürliche Zahlen a, b, c, d mit a >= b und a >= c gilt:

  • H a,b,c = H a,c,b
  • H a,b,c ( d ) = H a,c,b ( d )
  • H a,b,c ( d ) = ( b über d ) * ( ( a - b ) über ( c - d ) ) / ( a über c )
  • H a,b,c ( d ) = ( c über d ) * ( ( a - c ) über ( b - d ) ) / ( a über b )
  • Die Verteilung H a,b,c besitzt den Erwartungswert b * c / a
  • Die Verteilung H a,b,c besitzt die Streuung ( b * c / a ) * ( 1 - b / a ) * ( a - c ) / ( a - 1 )
  • Die Hypergeometrische Verteilung kann unter bestimmten Umständen durch die Binomialverteilung angenähert werden.

Mathematische Definition

Die Massefunktion der Hypergeometrischen Verteilung ist

 

Der Erwartungswert einer Zufallsvariable   mit Hypergeometrischer Verteilung ist

 

Und ihre Varianz