Beta-Verteilung
Die Betaverteilung ist eine kontinuierliche Wahrscheinlichkeitsverteilung über dem Intervall [0,1]. Sie ist definiert durch die Wahrscheinlichkeitsdichte
Außerhalb des Intevalls [0,1] wird sie durch f(x)=0 fortgesetzt. Sie besitzt die Parameter p und q; um ihre Normierbarkeit zu garantieren, wird p,q > 0 gefordert.
Der Vorfaktor 1/B(p;q) dient der korrekten Normierung; der Ausdruck
steht für die Betafunktion, nach der die Verteilung auch benannt ist; Γ(p) steht für die Gammafunktion.
Erwartungswert und Varianz der Betaverteilung sind
Beispiel
Die Betaverteilung kann aus zwei Gammaverteilungen erhalten werden: Der Quotient X = U/(U+V) aus den stochastisch unabhängigen Zufallsvariablen U und V, die beide gammaverteilt sind mit den Parametern b und pu bzw. pv, ist betaverteilt mit den Parametern pu und pv. U und V lassen sich als Chi-Quadrat-Verteilungen mit 2pu bzw. 2pv Freiheitsgraden interpretieren.
Mit Hilfe der Linearen Regression wird eine Regressionsgerade y = a + bx durch eine Punktwolke mit n Wertepaaren (xi;yi) (i=1,...,n)zweier statistischer Merkmale x und y gelegt, und zwar so, dass die Quadratsumme der senkrechten Abstände der yi-Werte von der Geraden minimiert wird.
Die totale Streuung von y (TSS) lässt sich mit der Streuungszerlegung aufteilen in die sog. erklärte Streuung der durch die Gerade geschätzten Werte y* (ESS) und die nichterklärte Streuung der Residuen (RSS) zerlegen:
- .
Das Bestimmtheitsmaß, der Anteil der erklärten Streuung an der Gesamtstreuung
bzw.
ist also betaverteilt. Da das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten von x und y darstellt, ist auch das Quadrat des Korrelationskoeffizienten betaverteilt.
Allerdings kann die Verteilung des Bestimmtheitsmaßes beim Modelltest der Regression durch die F-Verteilung angegeben werden, die tabelliert vorliegt.