Beta-Binomialverteilung

Wahrscheinlichkeitsverteilung
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 8. August 2009 um 11:37 Uhr durch 217.224.141.248 (Diskussion) (stil, form, formatierung, formulierung und grobheiten; ferinheiten wikifiziert. einige sätze bleiben unverständlich). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Beta-Binomialverteilung ist eine univariate diskrete Zufallsvariable welche als eine Art Verallgemeinerung der Binomialverteilung angesehen werden kann, da in dieser die Wahrscheinlichkeit von Erfolgen auf bei gegebener Wahrscheinlichkeit eines Einzelerfolges angegeben wird, während in der Beta-Binomialverteilung die Erfolgswahrscheinlichkeit nur ungenau bekannt ist und durch eine Betaverteilung B(a,b) beschrieben wird.

Beta-Binomialverteilung hat drei Parameter: n, a, b

Definition

Sei X~BeB(n,a,b) eine Zufallsvariable, die wie eine Beta-Binomialverteilung mit den Parametern n, a, b verteilt ist, dann gilt für den Träger  

 

wobei die Konstante C folgender Massen berechnet wird

 

und   die Gammafunktion ist.

Eine alternative Schreibweise ist

 

wobei   die Betafunktion ist.

Eigenschaften

Der Erwartungswert hängt von allen drei Parametern ab:

 

so wie auch die Varianz:

 

Die Schiefe wird angegeben mit

 

Spezialfälle

Falls a=1 e b=1, dann handelt es sich um eine diskrete Gleichverteilung mit  , da der Träger   Werte beinhaltet.

Anwendungsbereiche

Typische Anwendung der Beta-Binomialverteilung ist in jenen Fälle, wo man üblicherweise eine Binomialverteilung benützen würde, aber nicht davon ausgehen kann, dass alle Ereignisse die selbe Wahrscheinlichkeit haben positiv auszufallen, sondern diese Wahrscheinlichkeiten mehr oder minder glockenförmig um einen Wert liegen.

Will man zum Beispiel wissen will, wieviele Glühbirnen innerhalb der nächsten 12 Monaten platzen werden, aber davon ausgeht, dass die Wahrschienlichkeit zu platzen von Glühbirne zu Glühbirne abweicht.

Es ist somit nachvollziehbar, dass falls sich in einem binomialen Modell die Daten mehr verstreuen als von der Binomialverteilung vorgesehen, man auch an die Beta-Binomialverteilung denken soll.

Beispiel

Modell in der Bayessche Statistik

Ein Korb enthält eine unbekannte Anzahl von Bälle, von denen man aus anderen Stichproben weiß, dass der Anteil roter Bälle von einer Betaverteilung   beschrieben wird.

Es sollen n-mal Bälle gezogen werden (mit Zurücklegen). Die Wahrscheinlichkeit, dass x mal ein roter Ball gezogen wird, ist in der Beta-Binomialverteilung BetaB(n,a,b).

Zahlenbeispiel

Ausgehend von einer kompletten Unwissenheit der apriori Verteilung, die mit einer   beschrieben wird (Alternativen sind z.B.  , wird eine "Vorstudie" mit einer Ziehung (mit Wiederholung) von 15 Bällen organisiert. Einer dieser Bälle ist rot. Somit wird di a posteriori Verteilung mit der   beschrieben.

Die eigentliche "Studie" sieht eine Ziehung von 40 Bällen vor. Gefragt ist die Wahrscheinlichkeit, dass genau zwei Mal ein roter Ball gezogen wird.

Da in dieser zweiten Ziehung die Wahrscheinlichkeit   jene einer   ist, lässt sie sich wie folgt berechnen:

 

wobei

 

und da   und außerdem allgemein   ist, erhält man

 
Die im Beispiel benützten Zufallsvariablen
 
 
 

Dieses Ergebnis weicht wesentlich von jenem, welcher mit einer "einfachen" Binomialverteilung   berechnet worden wäre. In diesem Fall bekommt wäre das Ergebnis  .

Aus der Grafik wird ersichtlich, dass die "einfache" Binomialverteilung   weniger Ergebnisse "zulässt" als die  . Dies geschieht, da man in dem Bayesianischen Modell nicht vernachlässigt, dass der "wahre" Anteil an roten Bällen im Grunde unbekannt ist, und somit die Ergebnisse weit verstreuter sein können.

Literatur

  • Leonhard Held: Methoden der statistischen Inferenz. Likelihood und Bayes, Unter Mitwirkung von Daniel Sabanés Bové, Spektrum Akademischer Verlag Heidelberg 2008, ISBN 978-3-8274-1939-2
  • Jim Albert: Bayesian Computation With R, Springer New York, 2009, ISBN 978-0-387-92297-3 [1]