Zum Inhalt springen

Beta-Verteilung

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 11. Mai 2004 um 21:58 Uhr durch Weialawaga (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Betaverteilung ist eine kontinuierliche Wahrscheinlichkeitsverteilung über dem Intervall [0,1]. Sie ist definiert durch die Wahrscheinlichkeitsdichte

Außerhalb des Intevalls [0,1] wird sie durch f(x)=0 fortgesetzt. Sie besitzt die Parameter p und q; um ihre Normierbarkeit zu garantieren, wird p,q > 0 gefordert.

Der Vorfaktor 1/B(p;q) dient der korrekten Normierung; der Ausdruck

steht für die Betafunktion, nach der die Verteilung auch benannt ist; Γ(p) steht für die Gammafunktion.

Erwartungswert und Varianz der Betaverteilung sind

Beispiel

Die Betaverteilung kann aus zwei Gammaverteilungen erhalten werden: Der Quotient X = U/(U+V) aus den stochastisch unabhängigen Zufallsvariablen U und V, die beide gammaverteilt sind mit den Parametern b und pu bzw. pv, ist betaverteilt mit den Parametern pu und pv. U und V lassen sich als Chi-Quadrat-Verteilungen mit 2pu bzw. 2pv Freiheitsgraden interpretieren.

Mit Hilfe der Linearen Regression wird eine Regressionsgerade y = a + bx durch eine Punktwolke mit n Wertepaaren (xi;yi) (i=1,...,n)zweier statistischer Merkmale x und y gelegt, und zwar so, dass die Quadratsumme der senkrechten Abstände der yi-Werte von der Geraden minimiert wird.

Die totale Streuung von y (TSS) lässt sich mit der Streuungszerlegung aufteilen in die sog. erklärte Streuung der durch die Gerade geschätzten Werte y* (ESS) und die nichterklärte Streuung der Residuen (RSS) zerlegen:

.

Das Bestimmtheitsmaß, der Anteil der erklärten Streuung an der Gesamtstreuung

bzw.

ist also betaverteilt. Da das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten von x und y darstellt, ist auch das Quadrat des Korrelationskoeffizienten betaverteilt.

Allerdings kann die Verteilung des Bestimmtheitsmaßes beim Modelltest der Regression durch die F-Verteilung angegeben werden, die tabelliert vorliegt.