Diskussion:Normalverteilung
invariante der FT
Die Gauß'sche Normalverteilung besitzt noch eine wichtige Eigenschaft: Sie ist eine Invariante der Fouriertransformation. Das klingt vielen sicher zu mathematisch, deshalb der Versuch einer Erklärung in einfachen Worten:
Wie vielleicht bekannt ist, kann man eine periodische Funktion durch eine Kombination von Sinus- und Cosinusfunktionen annähern oder ausdrücken. Eine Funktion, die nicht periodisch ist, kann oft durch einen Trick zerlegbar gemacht werden: Man definiert die Periode einfach zu unendlich. Wenn man sich dann vorstellt, dass man zu + unendlich geht und dann wieder bei - unendlich herauskommt, hat man die geforderte periodische Funktion. Die Normalverteilung ist eine solche Funktion: obwohl sich rechts und links sehr schnell gegen Null geht ( 1/e^x^2) wird sie doch nie Null. Macht man nun eine Fourieranalyse, so entsteht wieder eine Normalverteilung! Allerdings ist sie von inverser Standardabweichung: eine schmale Verteilung wird breit, eine breite wird schmal. Das geht so weit, dass eine unendlich schmale, unendlich hohe Normalverteilung unendlich breit wird mit dem Funktionswert 1: ein senkrechter Strich wird zu einem vertikalen Strich.(Das ist die sogenannte Diracfunktion (streng genommen keine Funktion sondern etwas besonderes)) Dieses Verhalten erlaubt es, bestimmte physikalische Erscheinungen mathematisch auszudrücken, etwa die Heisenbergsche Unschärferelation.
Wenn man sich den Dirac-Puls und sein Spektrum als Linie vorstellt, so sieht das aus, als hätte sich der Puls um 90° gedreht! In der Tat ist es so, dass nach viermaliger Anwendung der Fouriertransformation wieder das Original herauskommt.
Gelegentlich könnte man noch etwas mehr dazu sagen, vielleicht ist jemand angesprochen. RaiNa 19:02, 7. Feb 2004 (CET)
Müsste es bei der Drehung nicht 90° heißen? Ansonsten gefällt mir die Erklärung gut. --Felix Ruoff 15:01, 4. Mai 2008 (CEST)
schreibweise
Parametrisierung der Normalverteilung
Ich habe eine Frage zu den Parametern der Normalverteilung: auf der Seite wird sie mit der Standardabweichung parametrisiert (), so wie das im angelsächsichen Sprachraum üblich ist. In Deutschland findet man sie häufig mit der Varianz parametrisiert, also . Ist die Art der Parametrisierung in diesem Artikel Konsens? ich wollte die Definition jetzt weiterbenutzen (siehe Wiener-Prozess) 84.128.132.64 19:20, 29. Nov 2004 (CET)
Ich glaube, hier macht man sich keine allzugroßen Gedanken dazu. Es kommt darauf an, was man mit der Verteilung anfangen will. Prinzipiell gibt es zwei Ansätze: Man betrachtet die Normalverteilung als Dichtekurve einer verteilten Größe. Dann ist die Fläche der Kurve über alle X zu Eins zu setzen und um eine Abschätzung der Breite zu haben, verwendet man die Standardabweichung als X-Einheit. Also hat die Normalverteilung die Fläche 1, den Schwerpunkt 0 und die Standardabweichung 1. Wenn man so normiert, ist natürlich auch die Varianz Eins. Ursprünglich wurde die Normalverteilung dazu benutzt, eine Aussage über die Fehlerquellen einer Messreihe zu machen. Wichtig war hierbei die Landvermessung und die Sternenkartierung. Die angegebenen Parameter sind Spezialfälle der statistischen Momente. Stimmen die statistischen Momente einer Messreihe mit denen der Normalverteilung überein, kann ein systematischer Fehler ausgeschlossen werden. Neben Fläche, Schwerpunkt und Varianz sind gebräuchlich Schiefe (Skew) und Stauchung( Excess). Höhere statistische Momente haben keine eigenen Namen, da ihre Bestimmung sehr fehlerbehaftet ist, wenn man sich nur ganz wenig in der Positionierung der Grundlinie irrt. Da die Normalverteilung durch drei Parameter festgelegt ist, sind damit alle statistischem Momente bestimmt. Die ungeraden Momente sind alle Null, da die NV symmetrisch ist, die geraden haben definierte Zahlenwerte. Bestimmt man die statistischen Momente unbekannter, normalverteilungsähnlicher Messreihen und zieht die Momente der NV ab, so erhält man bei vorliegen normalverteilter Messreihen jeweils Nullwerte. Die um die Momente der NV korrigierten Werte heißen Kummulanten.
Anders sieht es aus, wenn man die Normalverteilung zum Ausgang einer Vektorraumbasis macht. Wenn man diese orthonormiert, dann ist nicht die Fläche unter der Kurve = 1 zu wählen, sondern das Integral über das Betragsquadrat der Funktion. Siehe auch Hermitsche Funktionen. RaiNa 20:43, 29. Nov 2004 (CET)
- Also das mit dem angelsächsischen Sprachraum scheint nicht 100%ig zuzutreffen, ich habe zwei englische Bücher über W'theeorie vorliegen (Lindgren und Grimmet/Stirzacker), die beide mit notieren. --Philipendula 22:44, 29. Nov 2004 (CET)
- Muss mal eine Lanze brechen für - Ich hab bis jetzt ausschließlich diese Art der Notation gelesen. () kommt mir recht exotisch vor. --Crus4d3r
Nach meiner Erfahrung ist beides in etwa ähnlich oft gebräuchlich, ich denke auch nicht, dass hier der angelsächsische Raum andere Vorzüge hat. Es ist einfach eine simple Bezeichnungsfrage, bei denen jeder Autor bekanntlich seinen eigenen Stil hat. Auch hat das ganze mit den inhaltlichen Ausführungen von RaiNa nicht allzuviel zu tun. Natürlich sollte in einem Artikel durchgängig eine Bezeichnung verwendet werden, ob wir das in der ganzen Wikipedia schaffen, wage ich zu bezweifeln. Eine technische Kleinigkeit spricht für . Wenn man nämlich die dazugehörige Verteilungsfunktion betrachtet, wird diese in der Regel mit bezeichnet, und die Parameter werden als Indizes geschrieben. Und das sieht optisch etwas einfacher aus als , analog hat man dür die Wahrscheinlichkeitsdichte statt . -- Jesi 17:32, 14. Aug. 2007 (CEST)
Sigma Quadrat?
Statt begegnet mir oft . Kann mir jemand den Unterschied erklären oder besser sogar im Artikel einbauen? Dasselbe kann es ja nicht sein, da sich durch das Quadrat ja alle Formeln ändern müssten. Oder nicht? Wie gesagt, besser gleich im Artikel einbauen als hier zu antworten. Mich verwirrt die unterschiedliche Handhabe. 128.176.114.42 16:34, 7. Dez 2004 (CET)
- ist die Varianz und ist ihre Wurzel, die Standardabweichung. An der Berechnung ändert sich nichts, z.B.
und
Hier geht es nur um die Bezeichnung der Normalverteilung. Die Notation mit scheint die mir häufigere zu sein. --Philipendula 21:26, 7. Dez 2004 (CET)
Ich habe mich auch etwas an der Notation gestört und mir mal herausgenommen, dass zu ändern. Ich hoffe, es stört sich keiner dran. --Smeyen 12:54, 9. Dez 2004 (CET)
- Also ich nicht. --Philipendula 17:21, 9. Dez 2004 (CET)
- Eindeutigkeit muss sein! Denn wenn statt Buchstaben Zahlen stehen z.B. , dann weiß man nicht mehr, ob es sich um oder um handelt. -- 17:42, 6. Jul. 2008 (CEST) (nicht signierter Beitrag von 91.21.254.21 (Diskussion) 20:28, 5. Jul 2008 (CEST)), (nicht signierter Beitrag von 91.21.248.39 (Diskussion) 17:42, 6. Jul 2008 (CEST))
Beispiele für Normalverteilung
Wie ist man an die Normalverteilung drangekommen? Hat man in der Natur Prozesse beobachtet, und diese Verteilung erkannt? Ist alles auf eine Normalverteilung zurückzuführen? Der IQ eines Menschen ist zum Beispiel, so habe ich es gehört, auch eine Normalverteilung. Gibt es noch mehr Beispiele? Danke, --Abdull 21:49, 6. Dez 2004 (CET)
- IQ ist vielleicht ein schlechtes Beispiel - denn der ist per Definition normalverteilt. --217.225.53.175 20:46, 12. Apr 2006 (CEST)
- Nicht ganz, nicht die Tester weisen ja nicht den Getesteten beim IQ-Test ein Ergebnis zu, so dass selbiges normalverteilt ist. Egal wie du die Punkte-Skala wählst, ein Wert wird am häufigsten vorkommen, nach links und rechts (also hohe und niedrige IQ-Werte) werden seltener vorkommen, die Werte werden einer Gaußkurve entsprechen. Was du meinst, bedeutet, dass nun die Punkteskala normiert wird, und zwar so, dass die Leute, die in der ERgebnisverteilung ein simga links oder rechts sind, den IQ 85 bzw 115 bekommen. Was du meinst, ist einfach die Normierung, dass der IQ normalverteilt ist, ist kein Phänomen, dass sich jemand mal ausgedacht hat. 19:29, 14. Nov. 2007 (CET) (nicht signierter Beitrag von 137.226.102.135 (Diskussion)-- Jesi 08:08, 25. Nov. 2007 (CET) 19:29, 14. Nov. 2007)
Die Gaußsche Normalverteilung wurde von Carl Friedrich Gauß entdeckt.Das denken viele!Tatsächlich hat Abraham de Moivre diese Verteilung bereits 1733 in seinem Buch "Doctrine of chances" lange vor der Geburt von Gauß als Grenzwertverteilung von normierten Binomialverteilungen erhalten. ( Satz von de Moivre-Laplace). Gauß hat nie behauptet, er habe die Verteilung entdeckt. Sie wurde aber erst durch die Arbeiten von Gauß allgemein bekannt(1809). Das Verdienst von Gauß besteht darin, daß er die Verteilung als Fehlerverteilung vorschlug und zwar zuerst in der Astronomie .Erst später in der Landvermessung.Der historisch richtige Name wäre de Moivre-Verteilung, aber der Name Gauß-Verteilung ist besonders unter Anwendern so verbreitet, dass er sich wohl kaum ändern wird.
Um unvermeidbare Fehler von vermeidbaren bei der Landvermessung zu unterscheiden (letztere kann man dann zu vermeiden suchen) entwickelte er die Methode der Mittelwert und Standardabweichungsbestimmung. Zu dieser Zeit mussten ja alle Rechnungen noch manuell gemacht werden und da war so was wichtig. Immer wenn man "verrauschte" Werte hat, ist die Mittelwertbestimmung nützlich, auch bei der Sternbeobachtung usw. Aber in der doch sehr mathematischen Beschreibung dieses Artikels geht so etwas unter, dass die eigentliche Entdeckung sehr pragmatisch beeinflusst war.RaiNa 09:44, 7. Dez 2004 (CET)
- Typischerweise sind "Naturphänome" normalverteilt, beispielsweise Größe, Gewicht usw. Diese Merkmale werden von sehr vielen Komponenten beeinflusst, deren Einfluss man aber nicht mehr exakt trennen kann. Nach dem zentralen Grenzwertsatz ist die Summe dieser Einflüsse annähernd normalverteilt. Wenn man beispielsweise das Gewicht eines Schlachthähnchens betrachtet, hängt es ab von der Temperatur im Stall, von der Futtermenge, dem Stressfaktor usw, aber man kann nicht sagen, dass die Temperatur das Gewicht zu 18% bestimmt. Diese Phänomene sind natürlich nicht genau normalverteilt, sondern annähernd. Manchmal ist hier auch der Wunsch der Vater des Gedankens, etwa wenn in der Schule verlangt wird, dass Noten normalverteilt sind. Das ist großer Unsinn, zum einen, weil ja Noten rangskaliert sind, zum anderen, weil hier die Verteilung vorgegeben wird. --Philipendula 13:02, 7. Dez 2004 (CET)
todo
Was noch fehlt
Imho ist die Standardnormalverteilung noch stark verbesserungswürdig. So fehlen noch Streubereich, Antistreubereich, linker und rechter Spitz, Negativitätsregel. Ich werde das bei Gelegenheit noch erweitern. Tom1200 14:56, 26. Mai 2005 (CEST)
- Nach den jüngsten Aktualisierungen wären Graphiken unbeding nötig - mal sehen was sich machen lässt. Außerdem wäre noch die Approximation der Biniomialverteilung durch die NV mit Stetigkeitskorrektur nett. Aber ich warte erst ab, wie die neuen Kapitel aufgenommen werden. Tom1200 23:06, 28. Mai 2005 (CEST)
Was noch fehlt 2
Auf dieser Seite wird die normierte Gaußfunktion beschrieben. Häufig benötigt man die Gaußfunktion jedoch um sie z.B. über ein Balkendiagramm zu legen und so zu beweisen, dass die Verteilung normalverteilt ist. Für solche Zwecke benötigt man die nicht normierte Gausfunktion, die als Absolutwerte die Anzahl der Versuche in der Verteilung wiedergibt. Die Formel dafür hatte ich nich mehr im Kopf, weswegen ich gegoogelt habe. Bisher ohne Erfolg.
Ich glaube aber, dass man dann die Gaußfunktion nur mit n=Anzahl der Versuche multiplizieren muss. Dies könnte noch erwähnt werden.
- Ich bin etwas verwirrt, weil ich nicht verstehe, was für Balkendiagramme Du meint. Wenn Du eine empirische Verteilung auf eine Normalverteilunsannahme testen willst, kannst Du den Kolmogorow-Smirnow-Test verwenden. Der ist aber nicht auf Normalverteilungen beschränkt.
- Es könnte aber auch sein, dass Du gerade an Bernulli- und Binomialverteilungen denkst. Wenn nicht, müsstest Du Dich etwas klarer ausdrücken, was Du meinst. --Smeyen | Disk 20:14, 29. Mai 2006 (CEST)
- Ich verstehe die Frage so, dass man in einer empirischen Messung Werte mit einem Mittelwert m und einer Standardabweichung s hat, und wenn man die Messwerte nach Häufigkeit plottet, könnte man die Normalverteilung der Werte veranschaulichen, wenn man eine Normalverteilung (Gaußfunktion) mit den entsprechenden Parametern m und s, nicht die Standardnormalverteilung (normierte Gaußfunktion, , ) dahinterlegt. Ich wünsche mir hier auch ein Bild der Normalverteilung mit der Achsenbeschriftung , , etc. --(Sorry, kein login)--
Mit Balkendiagrammen sind wahrscheinlich Histogramme gemeint. Um eine Dichtefunktion (pdf) an ein Histogramm anzupassen multipliziert man die pdf mit der Klassenbreite des Histogrammes - ergibt die ungefähre Wahrscheinlichkeit dass ein Sample in diese Klasse fällt - und mit der Anzahl der Samples - gibt den Erwartungswert für die Anzahl der Samples in der jeweiligen Histogrammklasse. (Rudloff) (nicht gemaess WP:WEB signierter Beitrag von 193.171.83.181 (Diskussion) 16:11, 24. Apr 2008)
Wahrscheinlichkeitsrechnung
Gilt eigentlich der zur Standardisierung von normalverteilten Zufallsvariablen genutzte Zusammenhang: nur für die Normalverteilung?
- Du kannst alle Wahrscheinlichkeitsfunktionen über Variablentransformation transformieren, aber standarisieren kannst Du damit nur Wahrscheinlichkeitsverteilungen, die über ihren Erwartungswert und ihre Varianz bestimmt sind. Außer der Normalverteilung fällt mir da nur die Students t-Verteilung ein. Die Exponentialverteilung wird dagegen über die Rate parametrisiert, da erreichst Du durch obige Transformation keine Standarisierung mehr.
Und: Für die Normalverteilung gilt auch allgemeiner, wenn :
Gibt es bestimmte Bedingungen, dass dieser allgemeinere Fall gilt, die weniger restriktiv sind als die Annahme der Normalverteilung von X?
- Nein, das ist falsch, da die letzte Gleichung nicht gilt. Es müsste heißen:
- Das funktioniert dann auch bei allen Wahrscheinlichkeitsverteilungen, nur kommst Du dadurch nicht au eine wie auch immer geartete Standardform. Beachte, dass dann die transformierte Zufallsvariable nicht mehr unbedingt der selben Klasse von Wahrscheilichkeitsfunktionen angehören muss: Wenn X exponentialverteilt ist, dann ist X auch exponentialverteilt, 2X+1 aber nicht mehr.
Danke! und Sorry für den Fehler und danke für's Ausbessern! Aber genau das wollte ich wissen - es ging nicht um standardisieren, sondern um die Anwendbarkeit der Variablentransformation (hätte ich diesen Begriff gekannt, wäre es einfacher gewesen was zu finden...). auch für den Hinweis zur t-Verteilung und zum Unterschreiben vielen Dank. --195.143.211.20 19:09, 5. Aug 2005 (CEST)
Und wo kann man die (verständlich) nachlesen?
(man kann diesen allgemeineren Fall einfach herleiten: er basiert auf der Eigenschaft der Normalverteilung, dass eine durch lineare Transformation einer normalverteilten Zufallsvariable erzeugte Zufallsvariable ebenfalls normalverteilt ist (vgl. z.B. Poddig, Dichtl, Petersmeier, "Statistik, Ökonometrie, Optimierung", 2. Aufl. (2001) ("PDP") S. 76) sowie den Rechenregeln für Erwartungswert und Varianz. Durch Standardisierung die Wahrscheinlichkeit für y1<Y<y2 angeben und umformen).
Irgendwie kommt es mir so vor, als ob sich die Werte von Wahrscheinlichkeitsfunktionen (kumulierte Dichtefunktionen, cdf) grundsätzlich durch lineare Transformationen der Zuvallsvariablen nicht ändern... auch intuitiv plausibel, Beispiel: Würfeln und jede gewürfelte Zahl X durch 2 teilen und dann die Zahl 1 addieren, so dass Y=X/2 + 1 dann gilt doch z.B. P(X<3) = P(Y<3) und P(X>1) = P (Y > 1/2 + 1)
- Doch, die Wahrscheinlichkeit ändert sich: P(X<4)=3/6=1/2, P(Y<4)=5/6.
- leider wieder der gleiche Fehler - nochmal sorry - es muss heißen: P(X<3) = P(Y<2,5) und P(X>1) = P (Y > 1,5) - ist auch bei Deinem - entsprechend geänderten Beispiel so: P(X<4 = 3/6)= P(Y<3)=3/6
--195.143.211.20 19:09, 5. Aug 2005 (CEST)
Auch basiert z.B. offenbar die Herleitung der Ermittlung von Konfidenzintervallen mit der t-Verteilung offenbar auf linearen Transformationen ohne Änderung von Wahrscheinlichkeiten... (vgl. PDP, S. 186)...
- Siehe oben. Die t-Verteilung ist die einzige, mit der es sonst noch funktioniert (also die einzige, die ich kenne).
Viele Grüße,
Verteilungsfunktion --> Wahrscheinlichkeitsverteilung
Hier in dem Artikel wird für F(x) der Begriff "Verteilungsfunktion" während bei der Exponentialverteilung der Begriff "Kumulierte Verteilungsfunktion" verwendet wird. Wäre es nicht sinnvoller man würde konsequent den Begriff "Wahrscheinlichkeitsverteilung", auf den auch die beiden Begriffe weitergeleitet werden verwenden?. 17:20, 11. Aug 2005 (CEST)
- ist keine Verteilung, sondern eine Verteilungsfunktion, deswegen die Begriffe nicht abwechselnd verwenden. Eine Verteilungsfunktion ist eine maßdefinierende Funktion, die das Maß der Wahrscheinlichkeitsverteilung bestimmt. Das "kummulierte" kannst Du, wenn Du magst, streichen.--Smeyen Disk 11:45, 12. Aug 2005 (CEST)
Definition
In der obersten Intro steht eine saubere Definition der NV. Unter dem Kapitel Definition dagegen eine m.E. falsche; z.B. ist die Forderung der Stetigkeit der ZV, die normalverteilt sein soll, unsinnig.--JFKCom 11:33, 23. Aug 2005 (CEST)
Summe von normalverteilten Zufallsvariablen
Hat jemand Lust den Beweis zu schreiben, dass die Summe von zwei normalverteilten ZV wieder normalverteilt ist?
- Ist die Frage, ob der Beweis so elementar ist, dass er hier aufgeführt werden müsste. Schließlich ist das hier eine Enzyklopädie und keine Mathematiklehrbuch, da kommt es eher auf Verständlichkeit an als darauf, alles beweisen zu müssen. Aber meines Wissens ist der Beweis ein Dreizeiler (eine einfache Faltung (Mathematik)). --Smeyen | Disk 14:25, 23. Mär 2006 (CET)
Ein Literaturverweis wäre sinnvoller meines Erachtens. --Methossant 20:57, 27. Jun. 2008 (CEST)
- Es geht aber auch einfacher: Die charakteristische Funktion einer nornalverteilten Zufallsvariablen ist . Die ch. F. der Summe unabhängiger Zv. ist das Produkt der beiden ch. F. (siehe charakteristische Funktion (Stochastik)#Eigenschaften, letzter Eintrag) und damit , und das ist wieder die ch. F. einer normalverteilten Zv. Für nicht unabhängige Zv. gilt dieser Summensatz sowieso nicht. -- Jesi 05:13, 29. Jun. 2008 (CEST)
Halbwertsbreite
Vielleicht könnte man in den Artikel noch reinschreiben, wie man von der Standardabweichung auf die Halbwertsbreite der Gauß-Kurve kommt....??
Ja....das wollte ich ja auch gerne wissen. Na FWHM (=full width at half maximum), also die Breite der Kurve in der Höhe des halben Maximums. Physiker brauchen sowas manchmal/öfters. Habe jetzt durch Google rausgefunden, dass
FWHM = sigma * sqrt(8 ln 2)
ist. Vielleicht kann man das noch mit reinschreiben? Aber ich dachte halt, Mathematiker wissen das sicherlich besser als ich.
- Also ich studiere Physik im fünften Semester und hab das bislang noch nie gebraucht, kann mich zumindest nich dran erinnern ;). Das sigma is da schon das wichtigste 19:40, 14. Nov. 2007 (CET) (nicht signierter Beitrag von 137.226.102.135 (Diskussion)-- Jesi 08:08, 25. Nov. 2007 (CET) 19:40, 14. Nov. 2007)
- Das ist schon was wichtiges. Ich brauch's in der Spektroskopie andauernd. Aber nicht nur die FWHM sind wichtig, sondern auch der x-Wert bei dem die Verteilung auf 1/e bzw. 1/e^2 des Maximums gefallen ist.
- Leider hab ich's grad überhaupt net zur Hand.
- Bei Gelegenheit schreib ich's rein. (nicht signierter Beitrag von 147.142.186.54 (Diskussion)-- Jesi 08:08, 25. Nov. 2007 (CET) 18:13, 20. Nov. 2007)
Zwölferregel
- "Für numerische Simulationen ist die Zwölferregel daher sehr bedenklich! Andere genauso leicht zu programmierende Verfahren sind unbedingt vorzuziehen!"
stand im abschnitt zur zwoelferregel. ich habe das auskommentiert und frage hier, ob es ueberhaupt relevant ist, das zu erwaehnen (quellen?) und falls ja, ob das jemand gescheiter formulieren koennte. -- 141.3.74.36 17:05, 13. Okt. 2006 (CEST)
- Wenn die Aussage zutrifft, dann ist sie sehr relevant. Wer dies nicht weiß, der neigt dazu, eine normalverteilte Zufallsvariable durch die Addition von gleichverteilten Variablen zu erzeugen. Dies erscheint aufgrund des zentralen Grenzwertsates naheliegend, ist der Aussage nach aber äußerst problmenatisch. Ich habe weiterhin den Eindruck, dass dies nicht Laien zutrifft. Zufallszahlen muss man für praktisch jede Simulation generieren und diese sind oft normalverteilt. Die Aussage ist somit u. a. für die wissenschaftliche Praxis von entscheidender Bedeutung. Ich plädiere für eine neutrale Schlussfolgerung für Praxis, z. B. "Auf die Zwölferregel sollte daher nur dann zurückgegriffen werden, wenn die Unabhängigkeit der gleichverteilten Zufallsvariablen gewährleistet ist." Falk Lieder 20:55, 13. Okt. 2006 (CEST)
- Die Zwölferregel ist dann problematisch, wenn die gleichverteilten Zufallsvariablen nicht ganz unabhängig sind. Beim Kongruenzgenerator kann das schon mal der Fall sein. Der springende Punkt ist, dass sie anderen Verfahren deutlich unterlegen ist. Andere Verfahren brauchen ein bis zwei gleichverteilte ZV, um eine normalverteilte zu erstellen, bei der Zwölferregel braucht man eben zwölf. Das Verfahren ist also deutlich langsamer. Meines Wissens braucht man die Zwölferregel eher aus pädagogischen Gründen, um den zentralen Grenzwertsatz erklären zu können. --Smeyen | Disk 20:01, 16. Okt. 2006 (CEST)
- Selbst aus pädagogischen Gründen ist es nicht ratsam, ein Gesetz das beim Grenzübergang der Anzahl unabhängiger identisch verteilter Zufallsvariablen gegen unendlich gilt bei nur 12 Zufallsvariablen als gegeben anzunehmen. Diese Methode der Simulation ist bestenfalls einfach zu kodieren, es gibt eine sparsamere und interessantere Alternative in Form der Box-Mueller-Transformation. Eine Simulation der Standardnormalverteilung die nur Werte zwischen -6 und 6 liefern kann lässt den unbeschränkten Träger völlig unter den Tisch fallen. kw 11:47, 17. Okt. 2006 (CEST)
- Ich habe eine Quelle im Kommentar angegeben. Knuth vol 2 S. 106. Die numerical recipes tuns auch. Der Spektraltest liefert dieses Ergebnis. Und was heißt gescheiter formulieren? Die Aussage ist einfach korrekt. Mathematisch beweisbar. Und bewiesen. Die oben genannten Zusatzaussagen verstärken das. Auch Pädagogik ist kein Argument für die Zwölferregel. Man sieht leider in der Praxis immer wieder Programme, die die Zwölferregel anwenden, weil man bei BOX-Mueller mehr denken müsste! --Brf 13:47, 17. Okt. 2006 (CEST)
- Für die meißten Zwecke würden 12 gv-Zufallszahlen wohl ausreichen, der Wertebereich ist (für einer Simulation) groß genug. Man wählt Zwölf wohl deshalb, weil dann die Varianz der Summe eben 1 ist. Aber in der Praxis ist das wirklich ein eher sinnloses Simulationsverfahren. Es ist wohl eher ein Beispiel für den zentralen Grenzwertsatz als für die Erzeugung von Zufallszahlen. --Smeyen | Disk 18:17, 17. Okt. 2006 (CEST)
Polarmethode und Verwerfungsmethode
Wo wir beim Simulieren sind: im Artikel wird die Polarmethode vorgestellt und eine Verwerfungsmethode erwähnt. Die Polarmethode ist eine Verwerfungsmethode (mit Verwerfungen wird eine über den Einheitskreis gleichmäßig verteilte Zufallszahl erzeugt), weitere (gängige) Verwerfungsmethoden sind mir nicht bekannt. Wenn es noch welche gibt, wäre es interessant zu wissen, welche Vorschlagsfunktion man verwendet. --Smeyen | Disk 18:23, 17. Okt. 2006 (CEST)
Rechnen mit der Standardnormalverteilung
Wäre es vorteilhaft, die Beziehung zur Cauchy-Verteilung im Abschnitt "Rechnen mit der Standardnormalverteilung" einzureihen und um die allgemeine Lösung für beliebige Varianzen zu erweitern (siehe etwa die englische Version der Seite)?
Weiterhin frage ich mich, ob in der Wikipedia die aus einer Division zweier Normalverteilungen mit unterschiedlichen Erwartungswerten resultierende Wahrscheinlichkeitsverteilung (die unimodal oder bimodal sein kann) samt der analytischen Loesung erwähnenswert ist.
- Ich weiß nicht, was die Cauchy-Verteilung im Umgang mit der Normalverteilung helfen soll, zumal sie doch gar kein zweites Moment besitzt. Ansonsten finde ich die momentane Lösung (Transformation einer normalverteilten in eine standardnormalverteilte Variable) eigentlich die einfachste.
- Was die Division zweier Normalverteilungen angeht: Abschnitt 3.3 behandelt ja genau das Thema. Man könnte diesen ausführlicher fassen, Beweise oder Beweisskizzen gehen aber gewöhnlich zu weit. --Smeyen | Disk 15:16, 25. Okt. 2006 (CEST)
- Der Abschnitt "Rechnen mit..." befaßt sich nicht - wie von mir zunächst erwartet - mit Berechnungen, die normalverteilte Zufallsvariablen enthalten. Ich hätte hier Aussagen und Vorschriften zu Rechenoperationen wie a+X, a*X, X+Y, X*Y, X/Y,... ; a ∈ ℜ; X,Y~N(0,1) vermutet. Eine zusammenfassende Übersicht hierzu würde meiner Ansicht nach die (insgesamt sehr verwirrend gestaltete) Seite verbessern. Die englische Version beinhaltet dies etwa im ersten Abschnitt von "Properties":
- http://en.wikipedia.org/wiki/Gaussian_Distribution#Properties
- Bezüglich der Division zweier Normalverteilungen sähe ich es als wichtig an zu erwähnen, daß X/Y; X,Y~N(μ,σ) nur einer Cauchy-Verteilung entspricht, falls μ=0. Etwa im Falle (a+X)/(b+Y); a,b ∈ ℜ+; X,Y~N(0,1) ergibt sich eine recht komplexe Verteilung, die bimodal ist, wenn a>2,257. Ansonsten kann sie unimodal oder bimodal sein. Dies ist insbesondere wichtig, da dieser Zusammenhang aus der Taylor-Entwicklung nicht direkt offensichtlich wird. Ein entsprechender Zusammenhang kann in experimentellen Ergebnissen leicht fehlinterpretiert werden, wenn eine unimodale Verteilung erwartet wird, so daß die Erwähnung in der Wikipedia relevant wäre. (Analytische Lösung hierzu: Marsaglia, G.: Ratios of Normal Variables and Ratios of Sums of Uniform Variables. In: Journal of the American Statistical Association, Vol.60/309, 1965, S. 193-204).
Warum Approximation der Binomialverteilung
Gibt es einen guten Grund, die Approximation der Binomialverteilung als eine spezielle Anwendung des zentralen Grenzwertsatzes so herauszuheben? Die Verteilung der Summe von unabhängingen, identisch verteilten Zufallsgrößen konvergiert mit wachsender Zahl der Summanden in Verteilung gegen eine Normalverteilung mit der Summe der Erwartungswerte als Erwartungswert und der Summe der Varianzen als Varianz. Die Konvergenz der Binomialverteilung als Summe von Bernoulli-verteilten Zufallsgrößen ist ein Spezialfall dieses allgemeineren Gesetzes. Eine Aussage zur Normalapproximation der Binomialverteilung gehört eher zur Binomialverteilung als zur Normalverteilung. kw 16:26, 15. Nov. 2006 (CET)
- Ich glaube, weil es das einfachste Beispiel ist. Nichtmathematiker lernen Mathematik bevorzugt durch Beispiele (kann man jetzt gut oder schlecht finden, ist aber so), und die Binomialverteilung ist wohl das griffigste, Zumal sie ja selbst schon eine Faltung ist. Man hätte vielleicht auch ein anderes Beispiel nehmen können, aber Hauptsache, es gibt überhaupt eins. --Smeyen | Disk 18:25, 15. Nov. 2006 (CET)
- Wobei ich mich dann doch frage, was Max Planck bei aller Wertschätzung in der Einleitung verloren hat. Das tut ja überhaupt nichts zum Thema Normalverteilung erklären. --Smeyen | Disk 18:29, 15. Nov. 2006 (CET)
- Es erschien mir als ein erhaltenswerter Teil in dem von mir gelöschten Abschnitt, der zwar nichts mit der Normalverteilung als Approximation für die Binomialverteilung zu tun hat, aber trotzdem erhalten bleiben soll. Immerhin liefert er etwas zum Entdeckungszusammenhang. Nachdem aber die Approximation der Binomialverteilung durch die Normalverteilung so wichtig zu sein scheint, entferne ich den Teil wieder aus der Einleitung kw 07:33, 16. Nov. 2006 (CET)
zu schwer
mir hat das thema schonmal jemand so erklärt das ich es verstanden hab. hier seh ich nicht durch--88.72.238.74 12:41, 12. Dez. 2006 (CET)
- Eine interessante Rückfrage wäre, welches Thema da eigentlich verständlich erklärt wurde. Der Artikel ist eine Sammlung von Fakten, und vieleicht nicht einmal von ausgewählten wichtigen Fakten, über die Normalverteilung. Die Normalverteilung ist sicher kein Thema, das so abgegrenzt werden kann, dass es abschliessend erklärbar ist. Spätestens ab "In der Versicherungsmathematik" wird der Artikel aber dann fragwürdig, obwohl das, was da steht, jeweils für sich genommen nicht falsch ist. Einige Punkte zum Nachdenken:
- wem die Definition über die Dichte etwas sagt, der kennt die Dichte der Normalverteilung ohnehin. Die Dichte zu erwähnen ist damit nicht schlecht, aber die Einführung als Grenzverteilung aus dem zentralen Grenzwertsatz in Worten (und ohne "konvergiert in Verteilung" einfach nur so hinzuschreiben) ist sicher nützlicher und steht schon in diesem Artikel.
- über die Verteilungsfunktion würde es doch genügen zu sagen, dass keine geschlossene Darstellung existiert. Wer den Zusammenhang zwischen Dichte und Verteilungsfunktion kennt, kann dann die Darstellung im Artikel selbst hinschreiben, und dieser Zusammenhang ist keine spezielle Eigenschaft der Normalverteilung. Einem anderen würde ein Hinweis auf eine allgemeinere Darstellung bei den stetigen Verteilungen wohl die gleiche Information bieten.
- was symmetrisch um den Erwartungswert für die Funktionsgraphen von Dichte und Verteilungsfunktion bedeuten, nämlich Achsensymmetrie für die Dichte und Punktsymmetrie für die Verteilungsfunktion muss nicht unbedingt in Formeln dargestellt sein, jedenfalls nicht in einem Artikel über die Normalverteilung. Entsprechende Darstellungen über die Symmetrie von Funktionen enthält schon der Artikel über Symmetrie in der Geometrie, und dieses Medium bietet doch die Möglichkeit, einen Verweis einzufügen (für den Autor) oder einem Verweis nachzugehen (für den Leser). Die Symmetrieeigenschaften der Funktionsgraphen der Dichte oder der Verteilungsfunktion der Normalverteilung unterscheiden sich ja nicht von denen anderer Funktionsgraphen.
- welche Bedeutung der verirrten Stichprobenvarianz unter der Überschrift Entropie zukommen mag übersteigt mein Einsichtsvermögen.
- Handwerkliche Anleitungen zur Integration einer Funktion einer veränderlichen bietet zu Recht der Artikel Integralrechnung. Die Integration durch Substitition ist dort formal dargestellt und könnte sicher durch ein Beispiel wie das im diesem Artikel vorgeführte illustriert werden. Aber würde in einem Artikel über die Normalverteilung nicht ein Hinweis auf die Integration durch Substitution ausreichen ohne dass diese hier handwerklich vorgeführt wird?
- dass die Approximation der Binomialverteilung ein wesentliches Anwendungsbeispiel ist haben wir ja schon diskutiert. Auch die didaktische Vorgehensweise vom speziellen Beispiel zur allgemeineren Darstellung ist mir bekannt. Aber das spezielle Beispiel alleine, ohne einen Verweis auf das dahinterstehene allgemeinere Prinzip in die Welt zu stellen ist noch nicht einmal ein guten didaktischer Ansatz. Aus dem Artikel in seiner jetzigen Form lerne ich, dass es eine spezielle Beziehung der Normalverteilung zur Binomialverteilung gibt, die eine Approximation der Binomialverteilung durch die Normalverteilung ermöglicht. Aus dem Artikel lerne ich weiterhin, dass andere Verteilungen mit existierendem Erwartungswert und existierender Varianz wohl nicht durch die Normalverteilung approximiert werden können, weil eine solche allgemeinere Anwendung ja sonst irgendeine Erwähnung finden würde. Wie sich der arme Max Planck mit seinem Energiequantum in die Darstellung der Approximation der Binomialverteilung mit Hilfe der Normalverteilung verirrt hat, und ob es für diese Darstellung nicht irgendwo in dieser Enzyklopädie einen lohneneren Ort geben könnte, ist auch eine offene Frage.
- in den Darstellungen zum Rechnen mit der Standardnormalverteilung finde ich vieles, was für alle stetigen Verteilungen gilt, manches, was für symmetrische stetige Verteilungen gilt, und einiges, was für um die 0 symmetrische stetige Verteilungen gilt. Die Normalverteilung ist eine um 0 symmetrische stetige Verteilung, aber eben nicht die einzige Verteilung mit diesen Eigenschaften. Gilt den die Negativitätsregel nicht auf für die t-Verteilung, relativ unabhänig von deren gewähltem Parameter? Ein netter Artikel zum Rechnen mit stetigen Verteilungen, der die Spezialfälle behandelt läßt sich recht einfach aus dem unfangreichen Artikel extrahieren, und dieses Medium bietet die einfache Möglichkeit, diese allgemeinere Betrachtung für den interessierten Leser aus diesem Artikel zugänglich zu machen. kw
- Der Artikel fristet schon lange ein Mauerblümchendasein bei verminderter Qualität, was bei der Bedeutung der Normalverteilung etwas schade und überraschend ist. Dass Du mal die Finger auf die Wunden legst, wäre vielleicht ein guter Einstieg, um den Artikel mal aufzuräumen. Aber unterschreibe bitte das nächste mal Deine Diskussionsbeiträge.
- Mit mathematischen Themen ist das so eine Sache mit der Verständlichkeit, die lassen sich teilweise nicht so einfach erklären, wie man sich das vorstellt, weil es sich um eine sehr komplexe Materie handelt. Wenn man nicht weiß, was eine Zufallsvariable ist (sie ist weder zufällig noch variabel), macht der Artikel in dieser Form tatsächlich wenig Sinn. Natürlich könnte ich jedem Abiturienten begreiflich machen, was eine Normalverteilung ist, nur bräuchte ich mehrere Stunden Zeit, ihm die Grundlagen der Wahrscheinlichkeitstheorie zu erklären. Die haben wir in einem Artikel aber nicht. Das mit dem Oma-Test ist also ein frommer Wunsch. Das heißt aber nicht, dass der Artikel nicht über das jetzige Niveau kommen könnte. Ich versuche mal auf Deine Punkte einzugehen:
- Die Dichte der Verteilung ist die Größe, über die die Verteilung definiert wird und damit der zentrale Punkt des Artikels, der in die Einleitung muss. Verteilungen werden normalerweise durch ihre Verteilungs- oder Dichtefunktion definiert. Der zentrale Grenzwertsatz ist eine wichtige Eigenschaft, aber sicher nicht wichtiger als die Dichtefunktion. Ich kannte die Dichtefunktion übrigens Jahrelang nicht auswendig, sondern musste auf dem 10-DM-Schein nachschauen - insbesonders für die Normierungskonstanten.
- Über die Verteilungsfunktion müsste man erwähnen, dass sie nicht geschlossen darstellbar ist, jedoch Funktionen in Tabellenkalkulationen und mathematischer Software existieren. Dabei zu erwähnen, dass die Verteilungsfunktion das Integral der Dichtefunktion ist, halte ich nicht für übertrieben, auch wenn das anderswo nochmal steht. Ein wenig Redundanz schadet der Wikipedia nicht. Außerdem muss man auf die tabellierte Verteilungsfunktion der Standardnormalverteilung eingehen und damit notgedrungen auf die Symmetrieeigenschaft der Normalverteilung und die Transformation einer normalverteilten in eine standardnormalverteilte Variable. Da mag zwar vieles für symmetrische Variablen allgemein gelten, aber wie gesagt, Redundanz ist nicht unser größter Feind. Wenn Du meinst, das könne man kürzer und weniger mathematisch-formal machen, gebe ich Dir durchaus recht.
- Stichprobenvarianz bei der Entropie ist wohl ein Vertipper.
- Den Zusammenhang mit der Binomialverteilung finde ich nicht so schlimm, obwohl ich auch auf ihn verzichten könnte. Welche Verteilung wird denn sonst noch so durch Normalverteilungen approximiert (außer 12 Gleichverteilungen)? Aber vielleicht sollte man den Absatz wirklich erst mal löschen.
- Was Max Planck hier verloren hat, verstehe ich auch nicht, genau so wenig wie den unmotivierten Link auf die Versicherungsmathematik.
- Das was Du als schnöde Aneinanderreihung von Fakten abzutuen scheinst, halte ich übrigens für sehr nützlich: ich muss öffters mal einzele Sachen nachschauen (Momente, charakteristische Funktion, Beziehung zu anderen Verteilungen). Das würde ich auch im Taschenbuch der Statistik finden, aber Wikipedia ist halt schneller. --Smeyen | Disk 20:15, 14. Dez. 2006 (CET)
- Den Link zur Versicherungsmathematik finde natürlich nicht ganz unmotiviert
, aber trotzdem sehr entbehrlich, weil auch in der Versicherungsmathematik eigentlich nur noch historisch oder für einen Versicherungsmathematiker interessant, der nur mit einer Tafel der Normalverteilung auf einer einsamen Insel strandet und dort statt Kokosnüsse zu ernten lieber eine Sachversicherung für kleine bis mittlere Schäden aufziehen möchte.
- Zur Definition einer stetigen Verteilung über ihre Dichtefunktion: Natürlich wird eine Verteilung über die Dichte definiert, und in einem Lehrbuch der Stochastik soll eine Verteilung auch genau so eingeführt werden. Außerhalb eines solchen Lehrbuches ist aber die Frage, was den eigentlich normalverteilt ist, oder sogar eine Darstellung, warum eine nur theoretisch existierende Grenzverteilung so grosse praktische Relevanz hat vieleicht nützlicher als die formale Definition. So eine Art Abramowitz/Bronstein-Wiki würde möglicherweise helfen, den Formelsammlungscharakter der Enzyklopädie-Artikel zu reduzieren
- Verteilungen mit existierendem Erwartungswert und existierender Varianz haben oft eine Entwicklungsrichtung, in der eine Approximation über eine Normalverteilung brauchbar ist. Das gilt neben den offensichtlichen Fällen wie der Chi-Quadrat-Verteilung (und anderer Gamma-Verteilungen) beispielsweise auch für dieF-Verteilung und die Verteilung verschiedener Rangsummen aus der nicht-parametrischen Statistik. Auch Beta-Verteilungen haben mit wachsender Summe der Parameter einen grossen Bereich, in dem eine Approximation der Verteilung durch eine Normalverteilung mit dem Erwartungswert und der Varianz der Beta-Verteilung brauchbar ist, ehe die Verteilung zu einer Ein-Punkt-Verteilung degeneriert. Dass auf die Anwendung der t-Verteilung bei hinreichend grossem Stichprobenumfang verzichtet werden kann ist auch kein besonderes Gesetz sondern in der guten Approximation der t-Verteilung durch eine Normalverteilung begründet. Mir geht es gerade umgekehrt: Mir fällt ausser der Exponentialverteilung keine gebräuchliche univariate Verteilung mit existierendem Erwartungswert und existierender Varianz ein, für die es keine wenigstens bereichsweise brauchbare Normalapproximation gibt. Selbst die aus der Exponentialverteilung abgeleiteten Lebensdauerverteilungen wie die Erlang-Verteilung, die Hjorth-Verteilung oder die Weibull-Verteilung sind bereichsweise gut mit einer Normalverteilung approximierbar. kw 19:43, 15. Dez. 2006 (CET)
- Ich hoffe, ich habe am Wochenende Zeit, mal darauf einzugehen, und möchte hier nur das Wichtigste vornewegschicken.
- Ein eigenes Mathewiki wäre schön. Nicht nur, weil man dann Artikel über Wahrscheinlichkeitsverteilungen viel mathematischer und formaler aufziehen könnte, sondern auch zu jedem noch so absonderlichen (sprich: hier irrelevanten) Satz ein eigenes Lemma anlegen kann und ohne Rücksicht auf Verluste Beweise reinschreiben könnte. Leider gibt es so was (noch) nicht. Trotzdem würde ich die Dichtefunktion gleich vornewegschicken, oder, wie es jetzt ist, in den ersten Abschnitt stecken. Dass im zweiten Absatz ein Abschnitt über die einzelnen Parameter der Verteilung kommt, ist wohl deshalb sinnvoll, weil andere Artikel über W'Verteilungen auch so aufgebaut zu sein scheinen.
- In einem dritten Abschnitt könnte man auf die Bedeutung des ZGS eingehen, und da die Verteilungen, die man gerne mal mit der Normalverteilung approximiert, kurz erwähnen.
- In einem vierten Abschnitt wird die Beziehung zu anderen Verteilungen erwähnt (im Wesentlichen deshalb, weil das in anderen Artikeln auch so gemacht wird). Dort werden die Verteilungen, die nur approximiert werden, nicht mehr erwähnt. Absatz drei und vier kann man auch tauschen.
- Ganz um das Thema „Wie rechne ich mit der tabellierten Verteilungsfunktion?“ werden wir wohl nicht herumkommen, auch wenn man den Abschnitt kürzer und klarer fassen sollte.
- --Smeyen | Disk 22:18, 15. Dez. 2006 (CET)
- Ich hoffe, ich habe am Wochenende Zeit, mal darauf einzugehen, und möchte hier nur das Wichtigste vornewegschicken.
Literaturquelle Quotient standardnormalverteilter ZV = Cauchy-verteilt
Hallo liebe Wiki-Autoren!
Da ich mich gerade mit dem Problem der Verteilung von Produkten und Quotienten normalverteilter ZV beschäftige, bin ich brennend daran interessiert, in welcher Quelle man etwas hierzu findet.
Viele Grüße!
PS: Hat jemand auch zufällig eine Verteilung für das Produkt normalverteilter ZV im Angebot?
- Horst Rinne: Taschenbuch der Statistik, Verlag Harri Deutsch, 3. Auflage 2003. Kapitel B3.10, Seite 299. Das ist ein schönes Nachschlagewerk, so was wie ein Bronstein für Stochastiker, das ich ganz nützlich finde. Der Quotient ist die erwähnte Cauchy-Verteilung, für das Produkt wird die Dichtefunktion
- angegeben, aber das scheint keine geläufige Verteilung (kein must-know) zu sein. --Smeyen | Disk 02:19, 6. Feb. 2007 (CET)
Abschnitt Allgemeines
überarbeiten
Bitte überarbeiten. Das stimmt so überhaupt nicht wie es da drin steht bzw. ist sehr missverständlich und häufig eine Fehlerursache für Blödsinn in wissenschaftlichen Arbeiten. Beispiel: Binomialverteilung - Kann approximativ eine Normalverteilung werden, aber das dauert EWIG. Deswegen ist es im Allgemeinen falsch einer Binomialverteilung eine Normalverteilung zu unterstellen, weil dies bei den gegeben Daten einfach nie passieren wird. Bitte unbedint den Absatz noch ändern, denn erfahrungsgemäß pflanzen sich solche Missverständnisse sehr gerne sehr schnell fort. Korrekturleser1st 17:58, 4. Jun. 2007 (CEST)
- Ich finde den Abschnitt auch nicht gelungen. Ich habe nicht verstanden, was Max Planck in diesem Artikel zu suchen hat und würde den Absatz ganz löschen. Was der Künstler mir mit den Würfelversuchen überhaupt sagen wollte, habe ich auch nicht verstanden, aber es gehört ganz bestimmt nicht in diesen Artikel. Lediglich den Zentralen Grenzwertsatz halte ich für so wichtig, dass er unbedingt erwähnt werden muss, und damit auch die Approximation durch die Binomialverteilung (selbstverständlich gilt der ZGS auch für die Bernulli-Verteilung. Warum Dir diese Approximation zu ungenau ist, kann ich nicht nachvollziehen.). Allerdings käme die Binomialverteilung konsequenterweise nicht in den Abschnitt "Beziehung zu anderen verteilungen", sondern nach "Zentraler Grenzwertsatz". --Smeyen | Disk 17:07, 16. Aug. 2007 (CEST)
Beispiel Würfelversuch
Die Summen von zwei Würfeln sind auch bei unendlich vielen Versuchen nicht disket normalverteilt, auch nicht näherungsweise. Die Wahrscheinlichkeitsdichtefunktion der Summe zweier gleichverteilter Zufallsvariablen ist immer eine Dreiecksfunktion (entsprechend der Faltung zweier Rechteckfunktionen). Im Falle von zwei Würfeln, deren Summe nach jedem Wurf bestimmt wird, hat man ebenfalls eine solche Dreiecksfunktion, nur diskret wegen der diskreten Zufallsvariable. Konkret: Das Ergebniss 7 tritt in sechs Kombinationen auf, die Ergebnisse 6 und 8 treten je in fünf Kombinationen auf, die Ergebnisse 5 und 9 je in vier Kombinationen, usw. Dieses Würfelbeispiel ist also fehl am Platz beim Thema "Normalverteilung". Auch der Abschnitt über dem Würfelbeispiel ist irreführend, aber das wurde hier auf der Diskussionseite schon einen Punkt weiter oben erwähnt. --87.180.140.162 00:36, 26. Jul. 2007 (CET)
Warum so?
Was ich beim lesen des Artikels bis hin zur ersten expliziten Darstellung der Normalverteilung nicht verstanden habe, ist warum man die Normalverteilung so angibt und warum z.B.: Messfehler auf einer Gaußkurve liegen? Liegt vllt an der oben erwähnten Aproximation von Binomialverteilungen? Man kann doch nicht einfach definieren, dass Messfehler Normalverteilt sind!
mfg 91.5.157.148 19:47, 22. Okt. 2007 (CEST)
- Das muss auch nicht per Gesetz so sein. Es ist halt häufig so oder man säuft sich die Verteilung normal. --Philipendula 20:38, 22. Okt. 2007 (CEST)
Einer der wesentlichen Gründe für dieses Verhalten ist der Zentrale Grenzwertsatz, nach dem eine Summe von sehr vielen unabhängigen Zufallsgrößen, von denen jede für sich einen kleinen Einfluss auf die Summe hat, näherungsweise normalverteilt ist. Und Messfehler kann man sich als solche Summen sehr vieler kleiner Einflüsse vorstellen. Natürlich darf keiner der Einflüsse ein besonderes Gewicht haben, das wäre dann ein systematischer Fehler und man kann dann nicht mehr annehmen, dass die Summe näherungsweise normalverteilt ist. -- Jesi 00:07, 23. Okt. 2007 (CEST)
mehrdim. normalverteilung
gudn tach!
im artikel steht im abschnitt zur mehrdim. NV:
Die multivariate Normalverteilung ist die einzige rotationssymmetrische multivariate Verteilung,
deren Komponenten stochastisch unabhängig sind.
- es muesste _standard_normalverteilung heissen, da fuer die rot.sym. floeten geht.
- rot.sym. ist nur fuer 3d-gebilde definiert, oder?
ich formuliere mal noch nix um, weil ich sichergehen will, den passus nicht missverstanden zu haben. -- 141.3.74.15 01:09, 30. Dez. 2007 (CET)
- Ich denke aber, beides lässt sich verallgemeinern. Rot.-Symmetrie bleibt auch nach Verschiebung erhalten, dann eben um eine andere Achse, sie lässt sich auch für mehr als drei Dim. formulieren, dann allerdings nicht mehr anschaulich. -- Jesi 06:46, 30. Dez. 2007 (CET)
- aeh, moment. mit meinte ich (ich war 141.3.74.15) den korrelationskoeffizienten und nicht den erwartungswert , welcher als verschiebung angesehen werden kann. dagegen deformiert den "zuckerhut". rot.sym. ist verschiebungs- aber nicht deformierungsinvariant. deshalb ist "normalverteilung" allgemein falsch. entweder man ergaenzt "unkorreliert" oder schreibt "standard-nv" (und weist ggf. auf die beliebigkeit von hin).
- meine frage zur def. von rot.sym. moechte ich praezisieren: _wo_ wird rot.sym. fuer -dim-gebilde mit definiert? -- seth 10:52, 30. Dez. 2007 (CET)
- Oh sry, da hab ich nicht richtig aufgepasst. -- Jesi 13:54, 30. Dez. 2007 (CET)
- Von deinen Vorschlägen würde mir der zweite (Standard-NV) besser gefallen, du solltest es im Artikel ändern. Nachtrag zur Symmetrie: Kugel- und Rotationssymmetrie werden auch für n Dimensionen definiert (kugelsymmetrisch bzw. rotationssymmetrisch, wenn invariant gegenüber Drehungen um einen festen Punkt bzw. um eine feste Gerade). -- Jesi 18:59, 30. Dez. 2007 (CET)
- hab's mal versucht.
- wenn du zuviel zeit hast, koenntest du uebrigens den rot.sym.-abschnitt des symmetrie-artikels erweitern. ;-) -- seth 11:27, 31. Dez. 2007 (CET)
Summe von normalverteilten Zufallsvariablen
Ist eigentlich die Summe von zwei normalverteilten Zufallsvariablen immer normalverteilt (eventuell mit Varianz 0), selbst wenn die Variablen nicht unabhängig sind? (nicht signierter Beitrag von Cosine (Diskussion | Beiträge) 14:57, 10. Jun 2008 (CEST))
- Ja. Wobei Varianz = 0 eigentlich keine Verteilung mehr ist. -- Philipendula 17:18, 10. Jun. 2008 (CEST)
- Danke für die Antwort. Das kann man aber nicht mehr einfach mit einer Faltung beweisen, oder? --Cosine 17:22, 10. Jun. 2008 (CEST)
- @Philipendula: Bist du dir da sicher? Ich bin es (auf Anhieb) nicht. Und der Beweis mittels Faltung (bzw. einfacher Produkt der charakteristischen Funktionen) entfällt ja tatsächlich. -- Jesi 17:30, 10. Jun. 2008 (CEST)
- Äh, ihr könnt einen aber auch Sachen fragen. Für mich war das irgendwie selbstverständlich. Leider bin ich gerade auf Arbeit und habe keine gescheite Literatur da. Allerdings gibt es den Satz: Wenn ein multinormalverteilter Zufallvektor mit Erwartungsvektor und Varianzkovarianzmatrix ist, dann ist die lineare Transformation wieder normalverteilt mit E'vektor und der Kovarianzmatrix . Das dürte eine Verallgemeinerung der Summe zweier NVen sein. Wenn wir den Vektor x aus x1 und x2 zusammensetzen und A als Zeilenvektor (1 1) nehmen, haut das hin. -- Philipendula 18:20, 10. Jun. 2008 (CEST)
- Also, auch diesen Satz kenne ich nur für Vektoren mit unabhängigen Komponenten (wobei hier die egoistische Betonung auf ich liegt). Da die Sätze mit Unabhängigkeit immer die bekanntesten sind, kann es natürlich sein, dass es einen solchen Satz auch bei Abhängigkeiten in voller Allgemeinheit gibt, ich kann mir das aber nicht vorstellen. Bei Unabhängigkeit kann eben so viel "schiefgehen", dass solche allgemeinen Sätze wohl eher unüblich wären. Aber das ist natürlich nur Heuristik, ich habe weder irgend einen Beweis noch ein (Gegen)Beispiel. Der Zusatz Varianz=0 in der Fragestellung bezog sich meiner Meinung nach nicht auf die Summanden, sondern auf die Summe, weil man sonst das triviale Gegenbeispiel X und -X hätte. -- Jesi 20:01, 10. Jun. 2008 (CEST)
- Der obige Satz bezieht sich ja ausdrücklich auf , die Kovarianzmatrix, die eben Kovarianzen der Zufallsvariablen beinhaltet. Siehe auch [1] -- Philipendula 12:57, 11. Jun. 2008 (CEST)
- Der Satz betrifft aber nicht einen "beliebig zusammengewürfelten Vektor" von normalverteilten Zufallsgrößen, sondern er setzt voraus, dass der Vektor insgesamt n-dimensional normalverteilt ist. Und da gilt der Satz "Ein Zufallsvektor ist genau dann standardnormalverteilt auf , wenn seine Komponenten standardnormalverteilt und stochastisch unabhängig sind", siehe Normalverteilung#Mehrdimensionale Verallgemeinerung. -- Jesi 15:14, 11. Jun. 2008 (CEST)
- Wenn die Zufallsvariablen paarweise korreliert sind, sind sie automatisch multinormalverteilt. -- Philipendula 15:18, 11. Jun. 2008 (CEST)
- Der Satz betrifft aber nicht einen "beliebig zusammengewürfelten Vektor" von normalverteilten Zufallsgrößen, sondern er setzt voraus, dass der Vektor insgesamt n-dimensional normalverteilt ist. Und da gilt der Satz "Ein Zufallsvektor ist genau dann standardnormalverteilt auf , wenn seine Komponenten standardnormalverteilt und stochastisch unabhängig sind", siehe Normalverteilung#Mehrdimensionale Verallgemeinerung. -- Jesi 15:14, 11. Jun. 2008 (CEST)
- also: Jesi hat recht, aber der zitierte satz bezieht sich nur auf die _standard_normalverteilten ZVs. bei den anderen normalverteilten sieht's anders aus. Philipendula betrachtet dagegen nur die gemeinsamen _normal_verteilungen, was der OP nicht voraussetzte. ich nenne als beispiel zwei normalverteilte ZVs mit nichtnormalverteilter gemeinsamer verteilung, z.b. X,Y\sim\mathcal(0,1) mit der gemeinsamen dichte f(x,y)= 2*(dichte der entsprechenden unkorrelierten, d.h. durch faltung erhaltenen 2d-normalverteilung) im positiven sowie im negativen quadranten, aber f(x,y)=0 in den beiden anderen quadranten.
- der OP sucht also afaics z.b. die gemeinsame verteilung zweier jeweils (nicht-entartet, d.h. \sigma\ne0) normalverteilter ZVs X,Y mit der eigenschaft, dass fuer ein eps>0 gilt: P(X+Y\in (-eps,eps))=0. -- seth 21:26, 11. Jun. 2008 (CEST)
- Noch einmal @Philipendula, weil ich es nicht verstanden habe: Wenn die Zufallsvariablen paarweise korreliert sind, sind sie automatisch multinormalverteilt? Das kann ich so nicht einsehen. Z.B. sind für eine normalverteilte Zv. X die Zv. in dem Vektor (X,-X) "paarweise" korreliert und beide normalverteilt, der Vektor ist aber nicht multinormalverteilt (es ist etwa P(X < x, -X < y ) = P(X < x, X > -y), und diese Wahrscheinlichkeit kann für passende x und y null werden). Wenn du aber meinst Wenn die Zufallsvariablen paarweise nicht korreliert sind, ..., dann stimmt es wieder, allerdings sind unkorrelierte normalverteilte Zv. eben auch unabhängig, und da sind wir wieder beim Anfang. (Seths Beitrag habe ich noch nicht gründlich genug durchgelesen, aber ich glaube, das ist es ähnlich beschrieben.) -- Jesi 00:11, 12. Jun. 2008 (CEST)
- Es freut mich, dass ich mit meiner kleinen Frage, die hier natürlich überhaupt nicht korrekt aufgehoben ist, weil die kein Mathe-Forum ist ;-), so viel Resonanz ausgelöst habe. Anmerkung @Jesi: Der Vektor (X,-X) ist multinormalverteilt, wenn X normalverteilt ist. Er geht aus der 2dimensionalen Standardnormalverteilung durch die lineare Abbildung: (x,y)-> (x,-x) hervor, falls X stadardnormalverteilt ist, oder verstehe ich was falsch? Viele Grüße. --Cosine 13:42, 12. Jun. 2008 (CEST)
- Also zunächst einmal war die Frage schon an einer richtigen Stelle gestellt, und du siehst ja, was du losgetreten hast. Zu deinem Einwand: Wenn du eine lineare Abbildung ins Spiel bringst, musst du den Ausgangsvektor genau angeben. Dieser ist nämlich V = (X, X) und er geht durch die lineare Transformation W = A · V mit in W = (X, -X) über. Aber: Der von dir angewendete Satz gilt nur, wenn die Komponenten des Ausgangsvektors unabhängig sind. Und da diese Komponenten beide die gleiche Zufallsvariable sind, sind sie eben auch nicht unabhängig. Dass die gemeinsame Verteilung keine Normalverteilung ist, wollte ich oben schon andeuten (habe mich allerdings verschrieben). Man betrachtet die zweidimensionale Verteilungsfunktion FW(x,y) als zweidimensionale Punktfunktion. Diese ist definiert durch FW(x,y)=P(X < x, -X < y ) = P(X < x, X > -y). Setzt man jetzt z.B. x = 0, y = -1, dann ist die Wahrscheinlichkeit P(X < 0, X > 1) = 0 und damit FW(x,y) = 0. Die zweidimensionale Normalverteilungskunktion wird aber (wie auch die eindimensionale) nie null (beachte allerdings, dass das Bild im Artikel die Dichte darstellt, die Verteilungsfunktion erhält man daraus durch "Kumulation"). Also ist die gemeinsame Verteilung keine Normalverteilung. -- Jesi 14:33, 12. Jun. 2008 (CEST)
- Und wenn wir stattdessen folgende Matrix nähmen: ? Ausgangsvektor (X,Y) mit X und Y unabhängig standardnomalverteilt. Oder muss die Matrix invertierbar sein? -- --Cosine 14:43, 12. Jun. 2008 (CEST)
- Ja, letzteres. -- Jesi 15:00, 12. Jun. 2008 (CEST)
- Und wenn wir stattdessen folgende Matrix nähmen: ? Ausgangsvektor (X,Y) mit X und Y unabhängig standardnomalverteilt. Oder muss die Matrix invertierbar sein? -- --Cosine 14:43, 12. Jun. 2008 (CEST)
- Also zunächst einmal war die Frage schon an einer richtigen Stelle gestellt, und du siehst ja, was du losgetreten hast. Zu deinem Einwand: Wenn du eine lineare Abbildung ins Spiel bringst, musst du den Ausgangsvektor genau angeben. Dieser ist nämlich V = (X, X) und er geht durch die lineare Transformation W = A · V mit in W = (X, -X) über. Aber: Der von dir angewendete Satz gilt nur, wenn die Komponenten des Ausgangsvektors unabhängig sind. Und da diese Komponenten beide die gleiche Zufallsvariable sind, sind sie eben auch nicht unabhängig. Dass die gemeinsame Verteilung keine Normalverteilung ist, wollte ich oben schon andeuten (habe mich allerdings verschrieben). Man betrachtet die zweidimensionale Verteilungsfunktion FW(x,y) als zweidimensionale Punktfunktion. Diese ist definiert durch FW(x,y)=P(X < x, -X < y ) = P(X < x, X > -y). Setzt man jetzt z.B. x = 0, y = -1, dann ist die Wahrscheinlichkeit P(X < 0, X > 1) = 0 und damit FW(x,y) = 0. Die zweidimensionale Normalverteilungskunktion wird aber (wie auch die eindimensionale) nie null (beachte allerdings, dass das Bild im Artikel die Dichte darstellt, die Verteilungsfunktion erhält man daraus durch "Kumulation"). Also ist die gemeinsame Verteilung keine Normalverteilung. -- Jesi 14:33, 12. Jun. 2008 (CEST)
- (bk) normalerweise wird die dichte und damit auch die verteilungsfunktion der normalverteilung nie 0, aber wenn man die entarteten normalverteilungen (\sigma=0, stichwort: dirac-delta-distribution) hinzunimmt, dann halt doch (sogar \lambda^1-fast ueberall, \lambda=borelmass); hattest du ja oben selbst gesagt. insofern ist das (X,-X)-beispiel nicht soo gut. -- seth 15:03, 12. Jun. 2008 (CEST)
- Diesen Einwand verstehe ich (wieder einmal) nicht. Die zweidimensionale Verteilung FW(x, y) = P (X < x, X > -y) ist zwar in vielen Bereichen gleich null, in "vielen" aber auch echt positiv. So ist sie, wie oben ausgeführt, in dem Punkt (0, -1) und auch in einem kleinen Kreis um diesen Punkt null. Aber in (1, 0) ist FW(1,0) = P (X < 1, X > 0) = Φ(1) - Φ(0) und auch in einem kleinen Kreis um diesen Punkt trägt sie Wahrscheinlichkeitsmasse. Das ist ja alles andere als etwas Entartetes. -- Jesi 19:16, 12. Jun. 2008 (CEST)
- (bk) normalerweise wird die dichte und damit auch die verteilungsfunktion der normalverteilung nie 0, aber wenn man die entarteten normalverteilungen (\sigma=0, stichwort: dirac-delta-distribution) hinzunimmt, dann halt doch (sogar \lambda^1-fast ueberall, \lambda=borelmass); hattest du ja oben selbst gesagt. insofern ist das (X,-X)-beispiel nicht soo gut. -- seth 15:03, 12. Jun. 2008 (CEST)
- Oh, ich habs zu spät geschnallt. Du dachtest warscheinlich, das Beispiel (X, -X) sollte noch für das "Summenproblem" sein. Nein, es sollte ein Beispiel dafür sein, dass ein Vektor aus normalverteilten Komponenten nicht multinormalverteilt ist. -- Jesi 19:54, 12. Jun. 2008 (CEST)
Eigentlich brauch ich ja gar nichts mehr dazu sagen, wie ich sehe. Ich hab mal noch die Definition rausgekramt:
Es gibt zwei Arten von Definition einer multinormalen Verteilung:
1. Wenn der Zufallsvektor der Ordnung k eine p-variate Normalverteilung hat, dann und nur dann kann dargestellt werden als
wobei ist und ein Vektor aus p unabhängigen standardnormalverteilten Zufallsvariablen.
ist dann die Kovarianzmatrix von , die wir nennen wollen. Also sollten zumindest unabhängige ZVen zugrunde liegen.
2. Wenn von oben eine multivariate Normalverteilung hat, dann und nur dann
hat eine univariate Normalverteilung für jeden konstanten Vektor .
Y ist also eine Summe aus korrelierten normalverteilten Zufallsvariablen.
Die Kovarianzmatrix kann auch singulär von einem Rang k<p sein, dann ergibt sich eine sog. singuläre Multinormalverteilung als Projektion auf den k-dimensionalen Unterraum.
Das Beispiel mit dem (X, -X) mag ich jetzt nicht näher beleuchten, es ergäbe auf jeden Fall eine singuläre Korrelationsmatrix, weil natürlich X und -X exakt linear abhängig sind und daher eine Korrelation von -1 haben. Da diese Matrix den Rang 1 hat, hätten wir wohl automatisch eine univariate Verteilung. -- Philipendula 21:05, 12. Jun. 2008 (CEST)
- eben, beim beispiel (X, -X) waere die dichte f(x,y)=\delta(x+y), mit delta=dirac-delta-distribution.
- Jesi hat trotzdem recht, wenn zwei zufallsvariablen X,Y normalverteilt sind, muss ihre gemeinsame verteilung nicht einer 2d-normalverteilung unterliegen. ein beispiel dafuer habe ich oben bereits angegeben. die sache mit den quadranten. hier noch mal die dichte:
- (alles noch fernab von der summengeschichte.)-- seth 22:00, 12. Jun. 2008 (CEST)
- Ich versuche mal zusammenzufassen, was ich verstanden habe:
- * Eine multivariat-Normalverteilter Zufallsvektor lässt sich schreiben als , wobei z standardnormalverteilt ist.
- * Demnach ist der Vektor (X,-X) von oben normalverteilt, da er sich genauso schreiben lässt mit mu=0 und
- * Wenn aber X und Y zwei normalverteilte Zufallsvariablen sind, dann muss (X,Y) noch lange nicht (multivariat) normalverteilt sein.
- * All das hilft uns nicht weiter, zu entscheiden, ob meine Ausgangsvermutung gilt oder nicht, d.h. wir wissen immer noch nicht, ob es zwei abhängige normalverteilte Zufallsvariablen gibt, deren Summe nicht normalverteilt (oder konstant) ist.
- Stimmt das? Viele Grüße --Cosine 22:10, 12. Jun. 2008 (CEST)
- der zweite punkt bedarf einer ergaenzung: wenn der korrelationskoeefizient -1 ist, wie im fall (X, -X), dann gibt es keine gewoehnliche normalverteilung, die dazu passt, sondern nur eine entartete (d.h. standardabweichung=0). die konventionelle normalverteilung laesst nur positive standardabweichungen zu (wg. division durch sigma). wenn man aber den limes bildet, erhaelt man die heaviside-funktion (bei der verteilungsfunktion) bzw. die dirac-delta-distribution (bei der dichte).
- damit muss auch der vierte punkt ergaenzt werden. die frage ist also: existiert eine gemeinsame verteilung zweier jeweils normalverteilter zufallsvariablen X und Y, sodass die zufallsvariable Z=X+Y nicht normalverteilt (und auch nicht entartet normalverteilt) ist? und die beantwortun wurde hier bisher noch nicht geklaert. -- seth 22:45, 12. Jun. 2008 (CEST)
Wenn man sich in die Diskussion "unbefangen" einliest, entsteht direkt zu Beginn eine Frage: Was eigentlich ist die Summe von zwei normalverteilten Zufallsvariablen ? Eine Zufallsvariable ist ja zuerst einmal eine Variable wie jede andere auch. Zufällig ist ja wohl nicht die Variable, sondern der dieser zugeordnete Funktionswert. Oder sehe ich das falsch? FellPfleger 08:34, 13. Jun. 2008 (CEST)
- Formal definiert man sich eine Zufallsvariable als eine (messbare) Abbildung von einem Wahrscheinlichkeitsraum in die Reellen Zahlen. Funktionen in die reellen Zahlen kann man addieren und somit ist kein formales Problem bei der Fragestellung gegeben. Das Problem entsteht dadurch, dass dieser Wahrscheinlichkeitsraum immer schön im Hintergrund bleibt und man eigentlich nichts darüber weiß, außer dass er groß genug sein muss, um alle Zufallsvariablen, die man für ein mathematisches Modell braucht, zu "beherbergen". Und solange alle vorkommenden Zufallsvariablen alle schön unabhängig sind, ist es auch egal, wie dieser ominöse Wahrscheinlichkeitsraum aussieht, dann ist die gesamte relevante Information durch die Verteilung gegeben und man kann schön drauf los rechnen, ohne sich um den zugrundeliegenden Wahrscheinlichkeitsraum zu kümmern. Aber sobald die nicht mehr unabhängig sind, wird's eklig. --Cosine 11:22, 13. Jun. 2008 (CEST)
Anmerkung wieder gelöscht. Es sind einfach zu viele Voraussetzungen nicht definiert, Schlüsse sind damit rein zufällig. FellPfleger 22:22, 13. Jun. 2008 (CEST)
Letzter Nachtrag zu diesem Thema: Ich habe jetzt mal einen Experten gefragt und der hat mir ein Gegenbeispiel verraten: Als Zutaten nehmen wir ein X standardnormalverteilt, und eine diskrete Zufallsvarieble Z, die nur -1 und +1 mit Wahrscheinlichkeit jeweils 50% annimmt und X und Z seien unabhängig. So etwas lässt sich konstruieren. Dann definiere ich Y:=XZ und rechne nach, dass Y auch normalverteilt ist. Aber X+Y ist nicht mehr normalverteilt. Also ist die Vermutung vom Anfang falsch. Schade eigentlich... Es wäre so schön gewesen. Vielen Dank an alle, die mitgeraten haben.--Cosine 16:27, 24. Jun. 2008 (CEST)
Notation in Graphik (Normal density.svg) stimmt nicht überein mit Notation in Textkörper
Im Textkörper wurde sich auf die Notation X~ geeinigt. (Was mir, so nebenbei, als gute/bessere Wahl erscheint.) Die Graphik ganz oben im Artikel zeigt allerdings eine blaue Linie, die nach der Notation im Textkörper nicht X~ sondern tatsächlich X~ also X~ zeigt. Offensichtlich wurde die Graphik gefertigt und die Notation X zu Grunde gelegt -- dann nämlich stimmt, was dort zu sehen ist. Wer aber der Notation im Textkörper des Eintrags folgt und auf das Bild schaut, sieht eine "zu breite" blaue Normalverteilung. Analog gilt das hier Gesagte natürlich für die violette PDF: Das, was man im Bild sieht, ist X~, wenn man der Notation folgt, die im Text vorgeschlagen wird. Frage: Wer macht eine neue Graphik? --Sewenz 12:29, 10. Okt. 2008 (CEST)