Zum Inhalt springen

Diskussion:Varianz (Stochastik)

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 11. November 2017 um 07:33 Uhr durch Duerer38 (Diskussion | Beiträge) (Neuer Abschnitt Definition der Varianz). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 7 Jahren von JonskiC in Abschnitt Review-Diskussion, 24. September -31. Oktober 2017

absolut unverständlich

Wie bei den meisten mathematischen Beiträgen in Wikipedia, versteht der Normalsterbliche auch hier kein Wort. Wikipedia ist in mathematischen Fragen mittlerweile keine Hilfe mehr. Es hat den Anschein, als ob jeder Autor eines mathematischen Beitrags versucht, den Sachverhalt so kompliziert wie nur möglich darzustellen.... (nicht signierter Beitrag von 134.169.16.161 (Diskussion) 09:44, 9. Nov. 2011 (CET)) Beantworten

Dem muss ich leider zustimmen. Wikipedia ist eine Plattform die Unwissenden Wissen nahebringen soll, und kein Nachschlagewerk für Matematikprofs. Wobei sich das eigentlich nicht wiedersprechen muss wenn man das richtig aufzieht. Vom einfachen ins komplexe oder mehrstufig, ggf. nach Schulklassensystem. --143.164.102.13 12:58, 20. Okt. 2015 (CEST)Beantworten

kovarianz

Hallo Leute, müsste es bei Varianz einer Summe nicht - 2 mal die Kovarianz heißen? Jedenfalls dachte ich bisher immer das das so sein müßte.

unverstaendlich

Bitte nicht mißverstehen, aber ich verstehe aus dem Artikel so gut wie nichts! Schlägt man unter dem Begriff "Standardabweichung" nach so wird diese durch die Varianz erklärt; schlägt man unter den Begriff "Varianz" nach, so wird die Varianz mit der Standardabweichung erklärt... also dreht man sich im Kreis:( Vergleichbare Aussage wäre: Anisotrop ist der Gegensatz zu Isotrop. Isotrop ist der Gegensatz von Anisotrop. Ps. Es wäre schon eine große Hilfe, wenn man zum Anfang erwähnen würde, daß die Varianz ein Maß für die Streuung um den Mittelwert ist und die Standardabweichung die durchnittliche mittlere Abweichung der Zufallsvariablen ist. Sehr schön könnte man es z.B. mit einen praktischen Versuch erklären um es verständlich zu machen.


Vielleicht könnte man im Text noch einen Hinweis darauf geben, was E(X-a)^r und Med(X) sind. Ich habe sie hier im Zusammenhang mit E(X) und Var(X) in meinen Unterlagen. 82.82.120.218 21:17, 9. Jan 2004 (CET)

Wieso ist "a" in der Definition nicht erklärt? R.sponsel


Ja, ich finde auch das swolche Artikel in der Wikipedia nichtssagend sind. Ich meine, tolle definition, findet man in jedem Lehrbuch, aber der Wiki-Nutzer will natürlich auch wissen wie er aus 5 Datenwerten jetzt *konkret* die Varianz (und dann die Standardabweichung - der Artikel ist nämlich genauso ein murks) berechnen kann! Also USELESS!--195.4.207.157 00:15, 15. Feb. 2008 (CET)Beantworten

Wer nicht sucht, kann auch nicht finden ... Wie aus dem Einleitungstext implizit hervorgeht, kann man die Varianz aus z.B. 5 Messwerten nicht einfach ausrechnen. Für diesen Fall benötigt man Varianzschätzer, wie z.B. die Stichprobenvarianz (siehe Einleitung). Und folgt man z.B. letzterem Link findet man
.
Und mal am Beispiel vorgerechnet:
geg.:
ges.:
Schätzung für den Erwartungswert:
Schätzung für die Varianz:
Schätzung für die Standardabweichung:
Die Schätzverfahren hab' ich mir alle gerade aus den genannten Artikeln zusammengelesen und anhand dessen dieses Beispiel gebastelt "USELESS" ist vielleicht ein bischen vorschnell geurteilt.--Falk 16:11, 15. Feb. 2008 (CET)Beantworten


Nach dem Gesetz der großen Zahl läßt sich die Varianz aus einer hinreichend großen Menge von Merkmalsausprägungen annähernd berechnen als

Begründung: Wenn es sich um die Varianz der Grundgesamtheit mit bekanntem N handelt, ist kein Gesetz der großen Zahl notwendig. Bei einer Stichprobenvarianz ist aber i.a. EX unbekannt. Möglicherweise hat der Autor auf die Varianz in der Stichprobentheorie abgezielt. Um den Absatz gegebenenfalls möglichst schmerzlos wieder einfügen zu können, habe ich ihn hier deponiert. --Philipendula 11:01, 13. Jun 2004 (CEST)

Ich denke, es ist wichtig, darauf hinzuweisen, dass es hier zwei "ebenen" gibt, die zu unterscheiden sind. Zum einen die Grundgesamtheit/Realität/Theorie und zum anderen die Erhebung/Umfrage/Messung/Stichprobe. Der Erwartungswert ist i.A. unbekannt, nur der Mittelwert der Stichprobe ist bekannt. Die Varianz ist unbekannt, nur die Streuung der Strichprobe ist bekannt. Im ganzen Lemma kommt kein 1/N oder 1/n oder 1/(n-1) vor, dafür gibt es vermutlich einen Grund, dieser sollte genannt werden. --Moritzgedig 20:32, 15. Feb. 2011 (CET)Beantworten

Ich habe mal mit http://de.wikipedia.org/w/index.php?title=Varianz_%28Stochastik%29&action=historysubmit&diff=93637121&oldid=93517858 eine für den normalen Menschen verständliche Erklärung der Varianz hinzugefügt und hoffe, dass es im allgemeinen Interesse ist. (Arno Nym) (nicht signierter Beitrag von 80.149.148.212 (Diskussion) 12:34, 14. Sep. 2011 (CEST)) Beantworten

Na super, prompt hat das einer wieder reverted mit http://de.wikipedia.org/w/index.php?title=Varianz_%28Stochastik%29&action=historysubmit&diff=93637426&oldid=93637121. Na dann bleibt es wieder nur der höher studierten Mathe-Elite vorbehalten, den Begriff Varianz zu verstehen. Schade und Tschüs. (Arno Nym)
Das Bild passt einfach hinten und vorne nicht. Was ist der "eigentlich Richtige Kandidat" von einem Wuerfel? --Erzbischof 13:45, 14. Sep. 2011 (CEST)Beantworten
da ist es der Mittelwert über alle möglichen Würfelaugen. Beim Schießen auf eine Zielscheibe ist es der Mittelpunkt der Zielscheibe. Bei der Hough-Transformation die Houghraum-Spalten (Winkel) mit den größten Peeks. (Arno Nym) (nicht signierter Beitrag von 80.149.148.212 (Diskussion) 14:20, 14. Sep. 2011 (CEST)) Beantworten

Ein Beweis, warum die Formel für die Varianz in einem speziellen Fall richtig ist, hilft für das Verständnis des Begriffes "Varianz" hier nicht weiter. Wenn, dann gehört das zur Binomialverteilung. Allerdings ist die Darstellung in dem verlinkten Artikel auch nicht der einfachste und übersichtlichste Beweis.--Gunther 17:48, 24. Apr 2005 (CEST)

P.S. Es gibt ein Wikibook zur Binomialverteilung, da könnte man den Beweis einarbeiten.--Gunther 17:51, 24. Apr 2005 (CEST)

--- Im Gegenteil, sogar sehr einfache Darstellung, äußerst ausführlich. Was bedeutet schon "Verständnis"? Ich finde, in einem Artikel zum Thema Varianz, in dem die Varianzdarstellung unter BinomVerteilung erwähnt wird, sollte man einen Beweis dieser Darstellung nicht zensieren. Man kann Inhalt ja auch in Wikipedia reinkopieren, falls dich stört, dass es ein Link unten gibt. --IP

Wie man diese Formeln nachrechnet, ist unerheblich für die Bedeutung der Varianz. Der beste Platz für die Rechnung wäre hier.--Gunther 18:22, 24. Apr 2005 (CEST)

--- Bei diesem Artikel könnte man sich nach dem entsprechen Beweis fragen, da passt der Link super. Das tolle an dieser Definition der Varianz ist doch gerade auch, dass sich die Varianz um ein Vielfaches unter BinomVerteilung vereinfacht, das sollte man erwähnen. In dem von dir verlinkten Artikel passt der Link und der Beweis doch gar nicht, weder Varianz, noch Erwartungswert kommen darin vor, da wäre er Fehl am Platz. Eine Frage noch (ich bin Neuling in Wiki): Wie kann man hier vernünftig einen Diskussionsbeitrag schreiben, wie du es gemacht hast? Ich editiere dazu diese Seite, aber das scheint mir nicht ganz optimal zu sein, muss ich mich dafür hier in Wiki anmelden? Diese Frage kann natürlich nach antwort gelöscht werden. danke schonmal!

Im Wikibook-Artikel finden sich die Formeln am Ende des Abschnittes "Formale Darstellung". Im Wikibook sind Beweise explizit erwünscht, von daher wäre es da eine sinnvolle Ergänzung.
Zum Beweis selbst: Ich wünsche mir von einem Beweis, dass ich hinterher nicht nur weiß, dass die Behauptung wahr ist, sondern auch, warum. Und genau diese Frage wird durch die Rechnung nicht wirklich beantwortet. Warum ist der Erwartungswert proportional zu n, warum proportional zu p?
Zu den Diskussionsseiten: diese Seite zu bearbeiten, ist genau richtig. Alternativ kannst Du auch nur den Abschnitt bearbeiten, neben der Überschrift gibt es rechts einen Link. Du kannst Deine Beiträge noch mit Zeit und Unterschrift versehen, indem Du --~~~~ am Ende anfügst. Fragen oder andere Beiträge zu löschen ist unüblich.--Gunther 20:49, 24. Apr 2005 (CEST)


Ok, von Wikibook wusste ich nichts, muss mich erst in den Sinn dieser Abteilung einlesen. Inhaltlich passt es da jedenfalls, in der jetzigen Artikelform, nicht hinein. Zum Beweis: Die Frage nach dem "Warum", welche über eine Herleitung hinaus geht, habe ich mir auch oft gestellt. Sie ist jedoch tatsächlich nicht so berechtigt, wie sie scheint. Induktionsbeweise oder Widerspruchsbeweise sind viel weniger schlüssig in dieser Frage. Der Fehler in diesem Gedanken liegt jedoch nicht darin, dass Beweise an sich unschön wären, dass sich daraus ein "Warum" nicht gewinnen ließe, sondern vielmehr darin, dass eine Anschauung nicht immer Teil einer Beweisführung ist. Tatsächlich ist sie das in den wenigsten Fällen (diese Beweis gelten dann zugegebenerweise als sehr schön).
Man könnte natürlich noch zum Beispiel "Erwartungswert" veranschaulichende Anmerkungen bzgl. der Proportionalität machen. Aber ein "warum" ist in diesem Sinne nur eine Anschauung. Vielleicht lässt sich dies in Form von Gegenfragen klar machen: Warum gibt es unendlich viele Primzahlen? Warum ist sqrt(2) irrational? Was ist mit einem Versuch der Veranschaulichung von Banach-Tarski? Tatsächlich ist es sehr reizvoll und naheliegend nach Antworten zu suchen, die über den Beweis hinausgehen, aber oft unmöglich. Kennst du welche?
Wir sollten den Weg des Formalismus in diesen Fragen beschreiten, denn oft kommen wir dadurch zu Ergebnissen, die wir durch das ständige Grübeln über Anschauungen nicht gewinnen würden.

--85.16.10.3 23:48, 24. Apr 2005 (CEST)

Ich denke, dass es in der Mathematik im wesentlichen um dieses Warum geht. Natürlich ist man auch am "ob" interessiert, aber wenn man keine konkrete Anwendung im Sinn hat, ist das Hauptziel, die richtige Sichtweise und die Zusammenhänge zu erkennen. Irgendwer hat das mal in die Form gebracht, dass Mathematik darin besteht, so lange Begriffe einzuführen, bis die Behauptung trivial wird.
Eine Herleitung für die zur Diskussion stehenden Formeln, bei der es zumindest nicht so überraschend ist, dass explizite Formeln dabei herauskommen, beruht auf
für Die von mir oben genannten Fragen werden davon auch nicht beantwortet, und es ist auch nicht klar, warum man gerade so vorgehen sollte, aber ich halte diesen Ansatz trotzdem für übersichtlicher.
Ich denke, Euklid hat in etwa die richtige Antwort auf die Frage nach der Unendlichkeit der Primzahlen gefunden: Produkte endlich vieler Primzahlen liegen nicht dicht genug. Wurzel aus 2 ist irrational, weil rationale Zahlen ungleich Null so etwas wie unendliche Vektoren mit ganzzahligen Einträgen zusammen mit einem Vorzeichen sind, und der Vektor ist nicht das Doppelte eines anderen Vektors. Banach-Tarski halte ich persönlich für ziemlich irrelevant, ich glaube nicht, dass es viel Mathematik gibt, die damit zusammenhängt.--Gunther 00:38, 25. Apr 2005 (CEST)
Ich halte den Ansatz für weniger geeignet, er ist weniger elementar (als das einfache Ausmultiplizieren). Von "gut" oder "nicht gut" will ich nicht anfangen, sind es doch letztlich nur subjektive Wertungen.
Ich denke, dass das Warum im tiefsten Sinne von der Mathematik überhaupt nicht beantwortet wird. Dass Produkte endlich vieler Primzahlen nicht dicht genug liegen...nungut, das wissen wir durch den Widerspruchsbeweis + Primfaktorenzerlegung. Aber es ist doch keine Antwort, bestenfalls eine Umformulierung. Die eigentliche Frage kann man dann eben formulieren, warum denn diese Produkte nicht dicht genug liegen, ein gefundenes Fressen übrigens für Zahlenmystiker und "Hobbyzahlentheoretiker", böse Zungen reden auch von Scharlatenen. Ein Warum auf diese Fragen ist mir nicht bekannt, ich vermute, es gibt einfach keine Antwort, die nicht wieder nur eine Umformulierung ist. Für die Vektorenveranschaulichung trifft genau dasselbe zu, auch wenn das Beispiel mit den Primzahlen sicher reizvoller ist. BanachTarski ist genauso relevant in der Frage des Warums, wie die anderen Beispiele. Aber es stimmt: Wenn die Mathematik auf immer tiefere "Warums" eine echte Antwort (weg vom Tautologischen) hätte, dann wäre das phantastisch!
--85.16.10.239 13:47, 26. Apr 2005 (CEST)
Elementar ja, aber wer an einem Beweis wirklich interessiert ist und nicht einfach nur die Formel glauben will, der bringt auch die nötige Energie auf, den o.a. Beweis zu verstehen. Und auch wenn die elementare Rechnung vollkommen richtig ist, erklärt sie doch nichts. Genausogut kann man die Binet-Formel für die Fibonacci-Zahlen per Induktion beweisen, das ist ähnlich unbefriedigend.
Dass Produkte endlich vieler Primzahlen nicht dicht genug liegen, äußert sich noch an anderen Stellen, beispielsweise ist die Summe der Kehrwerte endlich, oder ihre Dichte
ist Null. Ich denke, dass man an diesen Punkten ein wenig vom Wesen der Primzahlen begreifen kann. Das steht natürlich nicht explizit in Euklids Beweis, aber er beruht auf diesem Aspekt.
Die Vektorendarstellung der multiplikativen Gruppe von ist ein Beispiel dafür, dass die Begrifflichkeit so weit entwickelt wurde, dass das gegebene Problem (Irrationalität von Wurzel aus 2) trivial wird. Es gibt noch andere Sichtweisen, die i.w. eine Umformulierung darstellen (z.B. müsste die 2-adische Bewertung einer Wurzel gleich 1/2 sein), aber all das ist viel klarer als die Beweise, die von gekürzten Darstellungen und geraden oder ungeraden Quadratzahlen reden.
Das sind alles natürlich nur Annäherungen an das Warum oder an die richtige Vorstellung von einem Begriff, aber ich sehe darin den Sinn der Mathematik, sobald sie über anwendungsbezogene Fragen hinausgeht.--Gunther 14:51, 26. Apr 2005 (CEST)

Ok, der "richtige" Beweis der Formeln für Erwartungswert und Varianz der Binomialverteilung ist der folgende: Die Binomialverteilung entsteht als n-malige Hintereinanderausführung eines Zufallsexperimentes mit den Ergebnissen 1 bzw. 0 mit Wahrscheinlichkeit p bzw. q. Da diese voneinander unabhängig sind, sind Erwartungswert und Varianz das jeweils n-fache von Erwartungswert und Varianz des einfachen Experimentes, welche p bzw. pq sind. Q.E.D.--Gunther 12:07, 1. Mai 2005 (CEST)Beantworten

Ein anschauliches Beispiel

Ich bin ein Nicht-Mathematiker und kann mit dem Artikel leider nichts anfangen. Wie wäre es mit einem Anschaulichen Beispiel? Ich wüsste gerne, wie man die Abweichung der Werte in der Reihe (1,2,3,1,2,3,1,2,3,100) als einen Wert angeben kann. Hat das was mit Varianz zu tun? Ich finde, ein enzyklopädischer Artikel kann auch ruhig Einstiegschanchen für Nichtfachleute des jeweiligen Gebietes bieten, man liest doch nach, weil man es noch nicht weiß. Und ich befürchte, wenn ich irgendwann die Kryptographie der Mathematiker mühselig erlernt habe, wird sich rausstellen, dass Varianz etwas pupeinfaches ist. Doing, doing, doing...--Kangaroo 18:03, 1. Jun 2005 (CEST)

Du würdest den Mittelwert berechnen, also alle Glieder der Reihe aufsummieren, und durch die Anzahl der Elemente Teilen. Das entspricht dem sog. Erwartungswert, wenn man zufällig ein Glied auswählt. Die Varianz ist jetzt die aufsummierte quadr. Abweichung jedes einzelnen Gliedes vom Erwartungswert, wiederum geteilt durch die Anzahl der Elemente.
Hättest du zum Beispiel eine Reihe (50, 50, 50, 50) ist der Erwartungswert 50 und die Varianz 0. Ist die Varianz 0, heißt es, dass du zu 100% sicher bei einer zufälligen Auswahl eines Gliedes offensichtlich den Erwartungswert erhältst. Wäre die Reihe (50, 0, 50, 100) wäre der Erwartungswert auch 50, die Varianz aber 1250 (=(0+2500+0+2500)/4), das sagt dir, dass die Chance, dass ein zufälliger Wert erheblich vom Erwartungswert abweicht, hoch ist.
Sollte man sowas als Beispiel vielleicht mal in den Artikel einfügen? MFG--F GX 11:44, 19. Jun. 2009 (CEST)Beantworten
Ich bitte darum, Genau so stell ich mir die nähere Erläuterung in einem Lexikon vor! Gerade bei mathematischen Themen wird in der dt. Wikipedia alles anhand von Formeln erklärt, was für Leute vom Fach sicherlich eindeutig und präzise ist. Leider geht es an gewissen Zielgruppen (die extra in der Wikipedia nachschlagen) vorbei, wenn ein Artikel zu mehr als 50% aus Formelsprache besteht.
Möglicherweise ist die deutsche Wikipedia halt einfach sehr auf Präzision, aber ich würde mir wirklich wünschen, dass man sich hier etwas mehr an der angelsächsichen Wikipedia orientiert - vor allem was die Text-Formel Ratio bei mathematischen Themen angeht. 141.65.40.245 16:51, 4. Aug. 2011 (CEST)Beantworten
Ich bin Mathematiker und kann den Artikel gut lesen (das heißt allerdings nicht, dass ich alles in dem Artikel gut finde). Grafiken und Beispiele könnten den Artikel vielleicht wirklich verständlicher machen. Allerding ist und bleibt das 'Problem', dass die Varianz nunmal ein abtrakter Begriff ist, nämlich eine Eigenschaft einer Zufallsvariable. Wer weiß, was eine Zufallsvariable und was ein Erwartungswert ist wird den Artikel verstehen, ohne Wissen über die beiden Begriffe ist es quasi unmöglich den echt Artikel zu verstehen - und das kann der beste Wiki-Artikel nicht verhindern (es sei denn er erklärt nochmal was eine Zufallsvariable und ein Erwartungswert ist, was aber wegen der Redundanz ja gerade nicht sein sollte). Die Interwikilinks benutzen, wenn man etwas nicht versteht, hilft sehr.--Beben 20:31, 4. Aug. 2011 (CEST)Beantworten

Warum Quadrat

Warum hat man die Varianz mit dem Quadrat angesetzt? Warum nicht Betrag oder Hoch-4?


Außerdem: bei mir im Script steht auch was von dem Schätzwert der Varianz. Er lautet

Wie kommt's, dass da das 1/(n-1) als Vorfaktor steht?

Danke, --Abdull 00:30, 13. Jul 2005 (CEST)

Beim Quadrieren werden kleine Abweichungen wenig und große stark gewichtet. Das Quadrat hat zudem den Vorteil, dass die erste Ableitung eine lineare Funktion ist, was bei Optimierungsüberlegungen von Vorteil ist. Außerdem hat das Quadrat noch weitere wünschenswerte Eigenschaften wie die Streuungszerlegung, Verschiebungssatz etc.
Man teilt durch n-1, weil dann s*2 erwartungstreu ist, d.h. der Erwartungswert dieser Schätzfunktion ist gleich der Varianz in der Grundgesamtheit. Wenn man durch n teilte, würde man die Varianz systematisch unterschätzen, man hätte also eieine Verzerrung in der Schätzung. --Philipendula 12:05, 13. Jul 2005 (CEST)


Oder anders: bei der Schätzung ist der Erwartungswert unbekannt, d.h. der Freiheitsgrad verringert sich um Eins. Wenn du in der Ausgleichungsrechnung r unbekannte Größen hast, dann steht dort im Übrigen allgemein 1 / (n - r). Siehe auch Artikel "Fehlerfortpflanzung" (http://de.wikipedia.org/wiki/Fehlerfortpflanzung) unter Abschnitt Messabweichungen.

 Ok Gründe fürs quadrieren ergänzt.--JonskiC (Diskussion) 18:57, 25. Sep. 2017 (CEST)Beantworten

Neues Bild

Ich habe ein neues Bild eingefügt, das alte sah zwar toll aus, erklärte aber nichts. Ein Anfänger konnte mit dem alten wenig anfangen. Die Varianz eindeutig als Maß für die Breite der Normalverteilung ist am neuen Bild (Matlab) besser zu sehen. Biolippi, 12.5.06 00:24 MEZ

Ich finde das Bild zwar gut, aber deine Auslegung falsch: "Die orange Kurve hat eine geringere Varianz (...) als die grüne." Das ist genau falsch, die grüne hat eine geringere Varianz als die orange. --F GX 11:45, 19. Jun. 2009 (CEST)Beantworten

Notation

In der Vorlesung zur Wahrscheinlichkeitsrechung, wurde bei uns die Varianz - neben - folgendermaßen notiert:

bzw.

und die Standardabweichung analog, als

bzw. .

Wär vielleicht nicht schlecht, wenn man das im Artikel als alternative Noatation erwähnt, falls mein Professor nicht der einzige ist der das so schreibt. ;)--Falk 02:25, 12. Feb. 2008 (CET)Beantworten

habe ich so vorher noch nicht gesehen in der mathematik und informatik. wenn es also nicht in mehreren buechern so zu finden ist, bin ich einer aufnahme eher abgeneigt. -- seth 11:24, 12. Feb. 2008 (CET)Beantworten
+1 --Philipendula 12:16, 12. Feb. 2008 (CET)Beantworten
Naja, weit verbreitet ist es wirklich nicht. Und Bücher zu dem Thema hab' ich nicht da, aber hier mal ein paar Belege, dass die Notation durchaus gebraucht wird:
Wobei die kurze Google-Recherche auch nicht viel mehr an Beispielen zutage gebracht hat. für die Standardabweichung scheint aber durchaus gebräuchlich zu sein.--Falk 22:27, 13. Feb. 2008 (CET)Beantworten
 Ok Alte Notation ergänzt. --JonskiC (Diskussion) 18:58, 25. Sep. 2017 (CEST)Beantworten

Fragwürdige Aussage

Zitat "Die Varianz ist der Durchschnitt der Abweichungsquadrate vom Durchschnitt eines statistischen Merkmals."


Ich weiß was gemeint ist, jedoch finde ich es merkwürdig umschrieben.

Da steht der Durchschnitt eines statistischen Merkmals besitzt Abweichungsquadrate. So würd ich es normalerweise verstehen.

Alternativ würde ich vorschlagen: "Die Varianz ist der Durchschnitt (der Summe) der quadrierten Abweichung zum Durchschnitt eines statistischen Merkmals"

Soll nur eine Anregung sein. Aber nach meinem empfinden sollte es nicht so stehen bleiben. Vielleicht bin ich aber auch zu kleinlich.

Gruß Paolo

Es ist ohnehin Nonsens, die Einleitung des Artikels mit der Stichprobenvarianz zu beginnen, die gar nicht das Thema ist. -- Philipendula 09:15, 24. Aug. 2008 (CEST)Beantworten
Stammt von 18:17, 2. Dez. 2007 Benutzer:MiBü, http://de.wikipedia.org/w/index.php?title=Varianz&diff=next&oldid=39472013 . --NeoUrfahraner 15:07, 24. Aug. 2008 (CEST)Beantworten
nö, das stammt nicht von mir. von mir stammt lediglich der satz
"Die Varianz ist ein Maß, das beschreibt, wie sehr ein Sachverhalt "streut". Sie wird berechnet, indem man die Abstände der Messwerte vom Mittelwert quadriert, addiert und durch die Anzahl der Messwerte teilt."
ich denke, es ist nicht sinnvoll, wenn ein wikipedia-artikel gleich im ersten satz mit für laien schwer oder nicht verständlichen begriffen wie Zufallsvariable, Erwartungswert, Summe der quadrierten Abweichungen vom Mittelwert in einer Beobachtungsreihe mit der tür ins haus fällt. zugang erleichtern! --MiBü 21:03, 24. Aug. 2008 (CEST)Beantworten
Es geht hier aber um die Varianz in der Grundgesamtheit. Da hats keine Messwerte. -- Philipendula 22:51, 24. Aug. 2008 (CEST)Beantworten
zumindest laut titel gehts nicht um die "varianz der grundgesamtheit", sondern um den begriff varianz (an sich), und auch die stichprobenvarianz ist - wie der name schon sagt - eine varianz. aber ich bestehe nicht auf dem ausdruck messwerte. wichtig ist mir lediglich, dass der erste satz (oder vielleicht die ersten 2 sätze) allgemein verständlich sind.--MiBü 02:19, 26. Aug. 2008 (CEST)Beantworten
Ist da nicht eine WP:BKL am Anfang? --NeoUrfahraner 03:13, 26. Aug. 2008 (CEST)Beantworten
Anmerkung nach fast sieben Jahren ;-) Nein, die Stichprobenvarianz ist, auch wenn es sich sprachlich so anhört, keine Varianz. -- HilberTraum (d, m) 21:11, 28. Mai 2015 (CEST)Beantworten

Änderung des Artikels

Folgender Abschnitt sollte entfernt werden, da er mathematisch nicht korrekt ist. Es handelt sich nicht um eine Dichtefunktion!! Also kein gutes Beispiel!

Eine stetige Zufallsvariable habe die Dichtefunktion

Mit dem Erwartungswert

berechnet sich die Varianz mit Hilfe des Verschiebungssatzes als


Neben einigen Ergänzungen habe ich den folgenden Absatz rausgenommen.

(Der vorstehende, nicht signierte Beitrag – siehe dazu Hilfe:Signatur – stammt von 77.183.73.162 (DiskussionBeiträge) Uhrzeit, Datum des unsignierten Beitrags)

"Die Varianz ist ein Maß, das beschreibt, wie stark eine Messgröße „streut“."

Die heute eingestellte Definition ist grundsätzlich denke ich richtig. In der hier in der Wikipedia vorgenommenen Abgrenzung trifft sie aber eher die empirische Varianz. Dennoch wollen wir ja hier nicht unser eigenen Ding machen, sondern Wissen darstellen. Was nun? --source 12:03, 31. Okt. 2008 (CET)Beantworten

Naja, "Messgröße" ist besser als "Sachverhalt" und die Messgröße selbst kann ja als Zufallsvariable betrachtet werden. Empirische Varianz wird es, wenn man nicht die Messgröße an sich, sondern eine Serie von konkreten Messungen dieser Messgröße betrachtet. Wirklich glücklich bin ich mit der Formulierung aber auch nicht. Das richtige Wort wäre "Zufallsgröße", wie es weiter unten folgt. Das ist zwar korrekt, setzt aber voraus, dass man weiß was eine Zufallsgröße ist. --NeoUrfahraner 12:46, 31. Okt. 2008 (CET)Beantworten
Der zweite Satz ist eher problematisch: "und durch die Anzahl der Messwerte teilt". Zu einer Messgröße an sich gibt es keine "Anzahl der Messwerte", die gibt es erst, wenn konkrete Messungen vorliegen. Genauer ist wohl eine Formulierung der Art "die durchschnittliche quadratische Abweichung einer Messgröße von ihrem Mittelwert". --NeoUrfahraner 13:06, 31. Okt. 2008 (CET)Beantworten

Für wen wurde dieser Artikel geschrieben ?

Der Artikel richtet sich primär an Mathematiker, für den Laien bringt er so gut wie gar nichts. Das kann nicht das Ziel einer Enzyklopädie sein.--Titeuf24 21:49, 31. Aug. 2009 (CEST)Beantworten

Ich denke nicht, so für einen Mathematiker (der ttäglich ) ist das was hier steht eher schwach, bisher geht man nicht auf die Sigma-Algebren etc. ein und sowieso auch nur auf reellwertige Funktionen. Die Varianz ist eine Eigenschaft einer Zufallsvariabeln, so steht das gleich in ersten Satz da und wenn jemand nicht weiß, was eine Zufallsvariable ist, hat er natürlich Probleme den Artikel zu verstehen. Das ist aber normal und kein Problem. --Beben 22:50, 7. Dez. 2009 (CET)Beantworten

Heiszt das jetzt, dass der Artikel für niemanden geeignet ist? Ein paar etwas allgemeiner formulierte Sätze zur Aussage der Varianz wären dennoch ganz gut -- und eine Abgrenzung zu Empirische Varianz. Irgendwas in der Richtung: ,,theoretisch würfelt man jede Zahl gleich oft (wenn der Würfel perfekt ist), aber wenn man einen Würfel in die Hand nimmt und würfelt ..." --Empro2 15:14, 19. Feb. 2010 (CET)Beantworten
Nein, ich habe das nicht so gemeint, das er für niemanden geeignet ist. Er ist meiner Meinung nach für alle geeignet, die wissen, was eine Zufallsvariable und ein Erwatungswert ist, diese beiden Dinge sind elementar für das Verständnis der Varianz. Geeignet ist er z.b. für Studenten, insb. Mathematiker, aber auch Schüler höherer Stufe. Alle die das Lebesgue-Integral nicht kennen, verstehen jedoch den Artikel nur stückhaft (vgl. Berechnung bei diskreten, stetigen ZV), aber daran lässt sich nichts ändern.Aber es stimmt man sollte noch einen Bezug zu empirischen Varianz herstellen, so à la "Die Varianz einer Zufallsvariablen schätzt man häufig konsistent und asymptotisch erwartungstreu mit der emp. Varianz". Aber den Rest sollte der Artikel emp. Varianz erklären, dafür ist er ja da...--Beben 15:03, 20. Feb. 2010 (CET)Beantworten

Ich habe auch Probleme, die Erklärungen in den Artikel zu verstehen. Ich vermute, dass es anderen interessierten Laien ähnlich geht. Wäre es zur Heranführung nicht möglich, den Bezug zur leichter verständlichen Stichprobenvarianz aus der deskriptiven Statistik herzustellen bzw. die von Empro2 vorgeschlagnde Abgrenzung zur Empirischen Varianz zu erklären? --Simulo 10:33, 16. Mär. 2010 (CET)Beantworten

Verschiebung Varianz nach Varianz (Zufallsvariable)

In der Qualitätssicherung der Mathematik ist der Artikel vor einiger Zeit aufgetaucht (siehe auch Kommentare vorher). Ich habe vorgeschlagen den Artikel nach Varianz (Zufallsvariable) zu verschieben und stattdessen eine Begriffsklärung einzurichten. Falls noch jemand einen Kommentar dazu los werden will, dann bitte dort: Portal:Mathematik/Qualitätssicherung#Varianz. --Sigbert 20:00, 28. Feb. 2011 (CET)Beantworten

Wieso "Zufallsvariable"? Gibt es so viele Varianzen, dass man nichts allgemeineres nehmen könnte? Wie wäre es mit: Statistik, Mathematik oder Stochastik? --Moritzgedig 11:25, 2. Mär. 2011 (CET)Beantworten
Es gibt ein grundsätzliches Problem: für fast jeden statistischen Begriff gibt es eine empirischen Variante und eine theoretische Variante. Bei einigen Begriffe werden beide in einem Artikel erklärt, bei einigen Artikeln (z.B. der Varianz :) gibt es einen Artikel für die empirische Variante und einen Artikel für die theoretische Variante. Ich würde in einem solchen Fall gerne eine generelle Lösung zur Benennung finden und weil es eine Kategorie:Zufallsvariable gibt, dachte ich dies wäre ein geeigneter Klammerbegriff; aber Stochastik wäre noch besser. Mathematik und Statistik ist definitiv zu allgemein, darunter fallen alle Varianzen: Korrigierte Stichprobenvarianz, Varianz, Totale Varianz und Allan-Varianz. --Sigbert 18:48, 2. Mär. 2011 (CET)Beantworten

In manchen büchern wird zwischen varianz(tatsächlich) und streuung(stichprobe) unterschieden. Eine Trennung wäre begrüßenswert. --Moritzgedig 08:36, 3. Mär. 2011 (CET)Beantworten

Man sollte das vielleicht bei der korrigierten Stichprobenvarianz einbauen. --Sigbert 23:08, 29. Apr. 2011 (CEST)Beantworten

nur für Leute die das eh schon verstehen

Wie leider bei vielen Wikipedia Artikeln ist auch dieser so geschrieben, dass er für nicht-Spezialisten des betreffenden Fachgebiets unverständlich und damit wertlos ist. Ich habe mir inzwischen angewöhnt, Informationen lieber ausserhalb von Wikipedia zu suchen. (nicht signierter Beitrag von 195.243.78.242 (Diskussion) 13:20, 12. Mär. 2012 (CET)) Beantworten

Hallo und danke für die Rückmeldung. Was genau hast du denn für eine Information gesucht und nicht gefunden/nicht verstanden? Vielleicht hast du auch in Wirklichkeit die Stichprobenvarianz gesucht, die wird nämlich (leider) oft auch nur als Varianz bezeichnet. Gruß -- HilberTraum (Diskussion) 17:01, 12. Mär. 2012 (CET)Beantworten

Ich denke, es wäre sinnvoll, wenn die Einleitung zumindest in so fern verständlich wäre, dass ein Abiturient es versteht - was zumindest meiner Meinung nach ein gutes Maß für den Grad der optimalen Komplexität wäre, im Moment ist das wohl für Mathematikstudenten geschrieben - Zudem wäre eine genauere Herleitung interessant und hilfreich beim Verständnis.--77.2.92.123 14:04, 18. Okt. 2012 (CEST)Beantworten

Fehler in der Formel

/media/math/2/b/e/2be8fa39fe01284be83c831959251c01.png

In der Formel hier ist definitv ein Fehler, ich sehe 5 Klammern. Es fehlt " * P (X)", falls ich mich nicht irre?

http://de.wikipedia.org/wiki/Varianz_(Stochastik)#Diskrete_Zufallsvariable (nicht signierter Beitrag von 188.193.253.48 (Diskussion) 00:02, 15. Mär. 2015 (CET))Beantworten

Leider verstehe ich nicht, was das Problem ist. Was für 5 Klammern? Was sollte " * P (X)" in Formel? -- HilberTraum (d, m) 08:26, 15. Mär. 2015 (CET)Beantworten

Die im Beispiel verwendete Formel ist Var(X) = E ((X-E(X))²)

Die letzte Klammer wird nur geschlossen und nie geöffnet.
Ebenso in der Erläuterung des Verschiebungssatzes. Verstehe ich da nun etwas falsch oder ist die Formel unvollständig?

/media/math/f/2/a/f2ae749c9fcfd6b6a891b404eff96b98.png
/media/math/f/2/a/f2ae749c9fcfd6b6a891b404eff96b98.png

Die Klammer hinter dem Quadrat - so unmathematisch das nun auch ausgedrückt sein mag - scheint mir doch recht fehl am Platz. (nicht signierter Beitrag von 188.194.16.131 (Diskussion) 21:18, 18. Mär. 2015 (CET))Beantworten

Es gehen genau drei Klammern auf und genau drei Klammern zu. Wo ist das Problem? --Quartl (Diskussion) 21:45, 18. Mär. 2015 (CET)Beantworten

Unverständlich

Im zweiten Absatz des Artikels heißt es: "Die Varianz ist eine Eigenschaft der Verteilung einer Zufallsvariablen und hängt nicht vom Zufall ab". Eine Größe (die Varianz), die von einer Zufallsgröße (der Zufallsvariablen) abhängt, sollte ihrerseits nicht vom Zufall abhängig sein? Das ist unverständlich oder falsch. Das muss erläutert oder gelöscht werden. --Anjolo (Diskussion) 09:50, 28. Mai 2015 (CEST)Beantworten

Gemeint ist Folgendes: Der Wert einer Zufallsvariable hängt vom Zufall ab, das heißt von einem Element eines Wahrscheinlichkeitsraums (anschaulich dem Ausgang eines Zufallsexperiments). Die Varianz einer Zufallsvariable hängt jedoch nicht von einem bestimmten Element des Wahrscheinlichkeitsraums ab, sondern von allen Elementen, was dem sicheren Ereignis entspricht. Ich persönlich sehe aber auch die Formulierung „hängt nicht vom Zufall ab“ als potentiell missverständlich an und würde sie eher streichen. Viele Grüße, --Quartl (Diskussion) 11:49, 28. Mai 2015 (CEST)Beantworten
So etwas hatte ich schon vermutet. Ich finde aber, dass diese Überlegung etwa so ist, wie von "hinten durch die Brust ins Auge". Ich lösche sie jetzt mal.--Anjolo (Diskussion) 17:32, 28. Mai 2015 (CEST)Beantworten
Man könnte das evtl. so formulieren, dass die Varianz „nicht zufällig“ bzw. „eine Konstante“ ist. Das vielleicht nicht ganz selbstverständlich, z. B. ist ja im Gegensatz zur Varianz die Stichprobenvarianz selbst wieder eine Zufallsvariable. Übrigens ist die Aussage, dass die Varianz eine „Eigenschaft“ der Verteilung ist, meiner Meinung nach sprachlich/mathematisch auch nicht ganz in Ordnung. Was meint ihr? -- HilberTraum (d, m) 21:07, 28. Mai 2015 (CEST)Beantworten
Ich würde (wichtige) „Kenngröße“ statt „Eigenschaft“ schreiben, als „Konstante“ würde ich die Varianz aber nicht bezeichnen. Kennngröße trifft es denke ich am besten. Viele Grüße, --Quartl (Diskussion) 21:46, 28. Mai 2015 (CEST)Beantworten
 Ok Richtigen Begriff Kenngröße erläutert + Abschnitt dazu.--JonskiC (Diskussion) 18:58, 25. Sep. 2017 (CEST)Beantworten

diskrete "reelle" Zufallsvariable

Eine reelle Zufallsvariable mit einem endlichen oder abzählbar unendlichen Wertebereich A wird diskret genannt

vlt sollte man rationale Zahlen als Beispiel eines abzählbar unendlichen Wertebereichs erwähnen, da die einleitende reelle Zufallsvariable irritierend ist, oder sollte gar das falsche Wort da stehen? Ra-raisch (Diskussion) 00:22, 15. Nov. 2015 (CET)Beantworten

Kadidatur?

@HilberTraum: Was hälst du davon wenn man den Artikel zu Kandidatur stellen würde? Bzw. weist der Artikel aus deiner Sicht noch größere Mängel auf? Grüße. --JonskiC (Diskussion) 18:46, 23. Sep. 2017 (CEST)Beantworten

Wenn du den Artikel kandidieren lassen willst, solltest du ihn vielleicht besser vorher ins Review stellen. Das Thema ist ja nicht so „abgehoben“, da können sich bestimmt auch Nichtmathematiker einbringen. Ich schau mir den Artikel aber selbst auch die nächsten Tage mal durch. Grüße -- HilberTraum (d, m) 16:55, 24. Sep. 2017 (CEST)Beantworten

Verschiebungssatz

Hallo Benutzer:Rainald62. Danke erstmal für deine Ergänzung. Mir stellt sich jedoch bei der Formel eine Frage: Fehlt da beim Verschiebungssatz für den stetigen Fall nicht ein Quadrat und wie genau kommt diese Formel zustande? Beste Grüße. --JonskiC (Diskussion) 20:36, 27. Sep. 2017 (CEST)Beantworten

Hallo JonskiC,
ja das ^2 war bei meinem Edit verloren gegangen. Dort (nicht jedoch beim diskreten Fall) stand vorher , was mir widersinnig erschien, weil man den Verschiebungssatz doch anwendet, um nicht gesondert berechnen zu müssen.
Das Ersetzen von durch , ohne Beleg oder Herleitung (Hint: die Varianz ist translationsinvariant), stammt von meiner Methode, Mittelwerte im Kopf auszurechnen oder abzuschätzen: , mit glatten Werten . Dann haben die Summanden wenige Dezimalstellen (oft nur eine) und die Partialsummen werden auch nicht groß (entsprechend grob darf die Division ausfallen.
Gruß --Rainald62 (Diskussion) 01:22, 28. Sep. 2017 (CEST)Beantworten
Danke für die ausführliche Erläuterung und Grüße.--JonskiC (Diskussion) 12:24, 28. Sep. 2017 (CEST)Beantworten

Review-Diskussion, 24. September -31. Oktober 2017

Die Varianz (lat. variantia für „Verschiedenheit“), veraltet auch Dispersion (lat. dispersio „Zerstreuung“, von dispergere „verteilen, ausbreiten, zerstreuen“) oder Streuung, ist das wichtigste Streuungsmaß in der Stochastik und dient der Charakterisierung der Wahrscheinlichkeitsverteilung einer reellen Zufallsvariablen. Neben dem Erwartungswert ist die Varianz die zweite wichtige Kenngröße der Verteilung einer reellen Zufallsvariable. Im Gegensatz zum Erwartungswert, der die Wahrscheinlichkeitsmasse balanciert, ist die Varianz ein Maß für die Streuung der Wahrscheinlichkeitsmasse um ihren Erwartungswert. Genauer gesagt beschreibt die Varianz die mittlere quadratische Abweichung der Zufallsvariablen von ihrem Erwartungswert, wenn das Zufallsexperiment unendlich oft wiederholt wird. Damit stellt die Varianz das zweite zentrierte Moment der Zufallsvariablen dar.

Hallo liebe Wikipedianer, mein Ziel ist es diesen Artikel kandidieren zu lassen. Aus diesem Grund wollte ich vorerst in diesem Review vorstellig werden, damit noch mögliche Mängel benannt und ausgebessert werden können. Grüße. -- JonskiC (Diskussion) 17:17, 24. Sep. 2017 (CEST)Beantworten

Bitte zunächst die Beleglage deutlich verbessern und WP:OMA steht da auch ziemlich im Dunkeln. Meiner Meinung nach noch deutlich von einer erfolgreichen Kandidatur entfernt und ich meine auch noch zu früh für ein sinnvolles Review. --codc Disk 18:10, 24. Sep. 2017 (CEST)Beantworten
Ich schließe mich dem an, der Artikel ist noch nicht reviewfähig. Es gibt eine große Überschneidung zu Standardabweichung, da muss eine sinnvolle Aufteilung oder Integration beider Artikel geben. Außerdem ist eine Enzyklopädie kein Skript oder Lehrbuch, was sollen die zeilenweisen Umformungen bzw. Beweise? Dann ist vieles sprachlich noch schwammig, vor allem die Einleitung. Und fachlich fehlt auch noch vieles z. B. Verteilungen, für die die Varianz nicht existiert...--Duerer38 (Diskussion) 21:48, 24. Sep. 2017 (CEST)Beantworten
@Duerer38:Welche Formulierung ist konkret in der Einleitung schwammig? Verteilungen, für die die Varianz nicht existiert könnte man noch ergänzen, da hast du recht. Ansonsten kann ich keine große Redundanz mit der Standardabweichung erkennen, außer die Definition und der Verschiebungssatz, und man könnte Umformungen auch noch zusammenfassen wie du vorgeschlagen hast. Gruß --JonskiC (Diskussion) 22:22, 24. Sep. 2017 (CEST)Beantworten
Die Varianz ist einfach das Quadrat der Standardabweichung, also reicht ein Artikel und eine Weiterleitung. Die Einleitung kann man auf zwei Sätze beschränken, da reichen die Stichworte Streuungsmaß, mittlere quadratische Abweichung ... Guck doch mal in die englische Wikipedia, wie man das formulieren kann.--Duerer38 (Diskussion) 06:38, 25. Sep. 2017 (CEST)Beantworten
Wenn ich die Einleitung auf 2 Sätze beschränke, dann wird es später wieder welche geben die sich beschweren dass die Einleitung viel zu kurz ist. Man kann es auch keinem Recht machen:/. Die Einleitung in der englischen Wikipedia ist so kurz, weil dort Varianz (Stochastik) und Empirische Varianz in einem Artikel sind (meiner Meinung nach katastrophal gelöst). Deshalb kann man natürlich nicht gemeinsame Beschreibungen und Eigenschaften oder ähnliches finden die man in die Einleitung schreiben kann. Wenn man Standardabweichung (Wahrscheinlichkeitstheorie) in den Artikel integriert, dann wird m.E. der Artikel extrem lang und unübersichtlich. Grüße. --JonskiC (Diskussion) 13:23, 25. Sep. 2017 (CEST)Beantworten
 Ok Den etwas langen Beweis mit der Skalierung habe ich stark gekürzt und hoffe es ist so übersichtlicher. Gruß. --JonskiC (Diskussion) 15:27, 26. Sep. 2017 (CEST)Beantworten
 Ok Für das Verständnis habe ich den Artikel um einen Abschnitt Ausgangslage ergänzt. --JonskiC (Diskussion) 15:29, 26. Sep. 2017 (CEST)Beantworten
Das verschlimmert alles nur, denn du beziehst dich ja auf dich selbst und entwickelst deine eigenen Theorien z. B. Anmerkung 2. wie gesagt, du schreibst dir dein Skript und keinen enzyklopädischen Artikel. Und dann auch noch mit mathematischen Mängeln, siehe den Umgang mit undefinierten Wahrscheinlichkeiten. Und was soll am Betrag schwer sein. Guck doch bitte mal in eine Enzyklopädie oder ausgezeichnete Artikel und vergleiche mal den Stil.. So ist der Artikel nicht auszeichnungswürdig.--Duerer38 (Diskussion) 22:44, 26. Sep. 2017 (CEST)Beantworten
Für eigene Theorien die ich angeblich aufstelle gibt es keinen Anhaltspunkt für ein Skript auch nicht. Mathematische Mängel mit undefinierten Wahrscheinlichkeiten gibt es nicht, denn die Aussage ist belegt. Das mit der Betragsfunktion schwierig in diesem Kontext zu rechnen ist habe ich mir nicht ausgedacht, sondern zahlreiche Autoren sprechen davon bei der Hinleitung zur Varianz (siehe Volker Heun: Grundlegende Algorithmen). Somit ist diese Aussage auch belegt. Da die Betragsfunktion im Nullpunkt nicht differenzierbar wird diese nicht verwendet. Das ist ein Review und keine Kandidatur, deshalb wäre es hilfreich wenn nicht pauschal der Stil kritisiert wird sondern du mir einzelne Passagen nennst, wo der Stil verbessert werden kann. Danke. --JonskiC (Diskussion) 23:02, 26. Sep. 2017 (CEST)Beantworten
Wer ist Heun? Wenn wir über Stochastik sprechen, müssen wir auch Stochastiker zitieren, also meinetwegen Kolmogorov, Feller oder zumindest Georgii oder Henze. Aber zum Beleg dass fast jeder deiner Abschnitte Unstimmigkeiten enthält:
  • "dient der Charakterisierung der Wahrscheinlichkeitsverteilung einer reellen Zufallsvariablen" die Streuung charakterisiert nicht die Verteilung, das tut das Wahrscheinlichkeitsmaß oder die Dichte, wenn sie existiert
  • "wenn das Zufallsexperiment unendlich oft wiederholt wird. " Das ist der Definition der Varianz egal. Du gehst hier von der frequentistischen Definition der Stochastik aus, die längst widerlegt wurde.
  • "Sie ist niemals negativ" Das wäre auch ein mathematisches Wunder (siehe Definition)
  • "Dieser Nachteil kann mit dem Konzept der Standardabweichung behoben werden, welches in enger Beziehung zum Konzept der Varianz steht. " Ja, nämlich einfach die Quadratwurzel davon. Schreib das doch einfach...
  • "Das Konzept der Varianz lässt sich verallgemeinern. Allgemeiner spricht man dann von einer Kovarianz." Oben wurde von einer Zufallsvariablen gesprochen. Warum jetzt zwei?
  • "Der Begriff „Varianz“ wurde vor allem vom Statistiker Ronald Fisher geprägt." Hat das auch jemand anders behauptet außer Fisher? Oder geht es nur um den Namen? Das Konzept hat es mindestens schon bei Gauß gegeben...

So geht es dann munter Abschnitt für Abschnitt weiter. Das ist für mich kein enzyklopädischer Schreibstil...--Duerer38 (Diskussion) 17:43, 27. Sep. 2017 (CEST)Beantworten

Sry aber bitte denke dir nicht deine eigenen Theorien aus. Die Formulierung: "Dient der Charakterisierung der Wahrscheinlichkeitsverteilung einer reellen Zufallsvariablen" findet sich in jedem Grundlagenlehrbuch und der Zusatz "wenn das Zufallsexperiment unendlich oft wiederholt wird. " ist notwendig für die Definition der Varianz sonst wäre sie falsch (ist belegt und findet sich ebenfalls in jedem Lehrbuch). "Der Begriff „Varianz“ wurde vor allem vom Statistiker Ronald Fisher geprägt.", dass ist genau so gemeint wie es da steht, halt der Begriff, nichts anderes. Zum Punkt "Das Konzept der Varianz lässt sich verallgemeinern. Allgemeiner spricht man dann von einer Kovarianz.", jetzt zwei weil es eben die Verallgemeinerung darstellt was da auch steht. Das einzige was ich nachvollziehen kann ist die Formulierung bei der Standardabweichung, die kann man noch verbessern. --JonskiC (Diskussion)
Ich gebe es jetzt auf. Die Aussage "Genauer gesagt beschreibt die Varianz die mittlere quadratische Abweichung der Zufallsvariablen von ihrem Erwartungswert, wenn das Zufallsexperiment unendlich oft wiederholt wird" ist definitiv mathematischer Unsinn. Die Varianz ist schlicht das Quadrat der Standardabweichung eines Wahrscheinlickeitsmaßes. Da braucht überhaupt kein Experiment ausgeführt werden, sondern nur einmal integriert werden... und so geht es munter weiter. Mag sein, dass manches in manchem Lehrbuch als Veranschaulichung steht, aber es ist trotzdem nicht korrekt. Schau mal bei Henze nach. Und trenne bitte Referenzen und Anmerkungen. Sonst sieht manches als Beleg aus, was einfach nur eigene Meinung ist.Damit für mich Ende des Reviews.--Duerer38 (Diskussion) 22:39, 27. Sep. 2017 (CEST)Beantworten
Lies es doch bitte einfach mal in der Quelle nach: Therefore E[(X — \mu)^2] is interpreted as the average of the squared distance between the value of the random variable X and \mu when the experiment is repeated infinitely many times. Steht so auch in vielen weiteren Lehrbüchern und ist korrekt aufgrund der Definition des Erwartungswertes. Dass das falsch sein soll ist Unsinn. Wenn du sonst nichts zu melden hast außer dass ich Referenzen und Anmerkungen trennen soll kannst du es Gottseidank gerne lassen.--JonskiC (Diskussion) 23:05, 27. Sep. 2017 (CEST)Beantworten
Nach Quelle ist das eine (statistische) Interpretation, keine (mathematische) Beschreibung. Als Beschreibung der Varianz ist das falsch, die Interpretation bezieht sich auf die Stichproben-Varianz. Ich würde raten, etwas achtsamer zu zitieren und da das Lemma aus der Stochastik stammt, doch bitte auf Standard- Stochastik-Bücher zu referenzieren statt irgendwelche Bücher mit Anwendungen...--Duerer38 (Diskussion) 20:40, 28. Sep. 2017 (CEST)Beantworten
Die Interpretation bezieht sich nicht auf die Stichprobenvarianz, sondern auf die Varianz im stochastischen Sinne was auch in der Quelle nachlesbar ist. Außerdem handelt es sich nicht um irgendein Buch, sondern um eine umfangreiche Monographie. Ja es ist eine Interpretation, deswegen steht es auch in dem Abschnitt mit dem Namen Interpretation. Ich habe es jetzt aber aus der Einleitung genommen, da es schon unter dem Abschnitt Interpretation aufgeführt und für die Einleitung zu spezifisch war.--JonskiC (Diskussion) 02:34, 29. Sep. 2017 (CEST)Beantworten
Ich habe grundsätzlich Sympathie für Artikel zu schwierigen Themen, gerade im mathematisch angehauchten Bereich der Naturwissenschaft. Mir ist klar, dass bei diesen Artikeln früher oder später der Laie nicht mehr mitkommt, weil nur bis zu einem bestimmten Punkt vereinfacht werden kann. Bei diesem Artikel bin ich im Verständnis aber schon in der Einleitung kleben geblieben. Nehmen wir den Einleitungssatz:
  • Die Varianz (lat. variantia für „Verschiedenheit“), veraltet auch Dispersion (lat. dispersio „Zerstreuung“, von dispergere „verteilen, ausbreiten, zerstreuen“) oder Streuung, ist das wichtigste Streuungsmaß in der Stochastik und dient der Charakterisierung der Wahrscheinlichkeitsverteilung einer reellen Zufallsvariablen. Hm, sehr konkret ist das noch nicht. Was ist ein Streuungsmaß? Ein Dispersionsmaß, auch Streuungsmaß oder Streuungsparameter genannt, ist in der Stochastik eine Kennzahl der Verteilung einer Zufallsvariable beziehungsweise eines Wahrscheinlichkeitsmaßes. Okay, das steht ungefähr so auch im zweiten Halbsatz. Was ist denn ein Wahrscheinlichkeitsmaß? Ein Wahrscheinlichkeitsmaß, kurz W-Maß oder synonym[1] Wahrscheinlichkeitsverteilung beziehungsweise kurz W-Verteilung oder einfach Verteilung genannt, ist ein grundlegendes Konstrukt der Stochastik und Wahrscheinlichkeitstheorie. Seltener findet sich auch die Bezeichnung Wahrscheinlichkeitsgesetz. Wahrscheinlichkeitsmaße dienen dazu, Mengen eine Zahl zwischen null und eins zuzuordnen. Diese Zahl ist dann die Wahrscheinlichkeit, dass das durch die Menge beschriebene Ereignis eintritt. Puuuh, okay. Darüber muss man nachdenken, aber dann geht es.
Ich gehe jetzt nicht weiter durch den Text, aber schon am ersten Satz wird das Problem deutlich: Es ist voller Fachbegriffe, aber die erklärenden Artikel sind genauso schwer verständlich. Weitere Beispiele sind in der Einleitung sind die Links zum Zentralen Moment und zur Homogenen Funktion. Manches ist auch überhaupt nicht verlinkt, wie die "Wahrscheinlichkeitsmasse" oder "Dichtefunktion". In späteren Abschnitten fallen dann noch sinnlos eingestreute Fremdworte ("stammt originär aus der Physik") auf. Insgesamt drängt sich der Eindruck auf, dass da ein Statistiker für Statistiker schreibt und Nichteingeweihte gar nicht verstehen sollen, worum es geht.
Ich würde ja gerne weiter durch den Text gehen und Rückmeldung geben, aber das ergibt keinen Sinn, wenn ich mich durch einen für mich nur mühsam verständlichen Text quäle.
Pointe meines Reviews: Bitte dringend allgemeinverständlicher und anschaulicher schreiben! Ich wünsche gutes Gelingen :) --Jaax (Diskussion) 22:38, 24. Sep. 2017 (CEST)Beantworten

Zwei Sachen sind mir beim Drüberschauen gerade aufgefallen: 1. Im Abschnitt „Definition bei diskreten Zufallsvariablen“ macht „“ (eine Gleichung quadriert?) gar keinen Sinn. Mir ist auch nicht klar, was dort stattdessen gemeint sein könnte. 2. Um die Nichtnegativität der Varianz zu zeigen, braucht man nicht den Verschiebungssatz und die Jensen-Ungleichung. Das folgt doch direkt aus der Definition wegen . Grüße -- HilberTraum (d, m) 19:55, 26. Sep. 2017 (CEST)Beantworten

Hi HilberTraum. Mit der quadrierten Gleichung ist gemeint, dass der Ausdruck mit seiner Wahrscheinlichkeit gewichtet wird (laut Quelle), also mit . Vllt. sollte man (X=x_i) im zweiten Ausdruck weglassen, dann wird es verständlicher. Mit der Jensen-Ungleichung hast du Recht die könnte man weglassen. Hältst du den Artikel denn ansonsten für Kandidaturfähig bzw. was könnte man deiner Ansicht nach noch verbessern? Grüße. --JonskiC (Diskussion)
Was du über das Quadrieren aussagen willst, ist mir leider immer noch nicht klar: macht ja auch nicht viel Sinn, das ist die Wahrscheinlichkeit einer Zahl? Ich habe erst nur Zeit gefunden, den Artikel kurz „durchzublättern“, ihn aber noch nicht richtig gelesen. Wollte ich aber noch machen. Kann aber ein paar Tage dauern, ich sollte ja erstmal endlich meinen SW-Artikel „fertig“ machen. Grüße -- HilberTraum (d, m) 20:44, 26. Sep. 2017 (CEST)Beantworten
Es steht so in der Quelle aber vielleicht hat der Autor auch nur aus didaktischen Gründen die Notation verwendet und sie ist mathematisch nicht ganz korrekt. Viele Erfolg bei deinem Artikel;) und Gruß --JonskiC (Diskussion)
Das ist genauso mathematischer Unsinn wie oben. Wahrscheinlichkeiten werden für meßbare Mengen definiert, häufig auch als Ereignisse bezeichnet. In der Klammer steht aber eine Zahl, das ist undefiniert. Ob das im Lehrbuch steht oder ob das ein didaktischer Trick sein soll, ist da egal.--Duerer38 (Diskussion) 22:47, 27. Sep. 2017 (CEST)Beantworten
Die Formulierung ist schon längt ausgeklammert, also gibt es keinen Grund noch darüber zu reden.--JonskiC (Diskussion)

Ich bin etwas verwirrt: Die Varianz (Stochastik) ist doch das Quadrat der Standardabweichung (Wahrscheinlichkeitstheorie), warum gibt es da zwei Artikel? Ich würde vorschlagen, den Inhalt des einen in den anderen Artikel zu integrieren, und den eine Weiterleitung zu machen. Oder übersehe ich da etwas und es gibt doch einen weiteren Unterschied?--Tubssy (Diskussion) 17:23, 30. Sep. 2017 (CEST)Beantworten

Hallo Tubssy, nein du übersiehst nichts und es handelt sich lediglich um das Quadrat. Eine Zusammenführung der beiden Artikel könnte man eigentlich vornehmen. Allerdings sollte man bei einer so umfangreichen Änderung noch weitere Meinungen abwarten. Beste Grüße. --JonskiC (Diskussion) 17:36, 30. Sep. 2017 (CEST)Beantworten
Sollte es kein Einspruch geben, werde ich demnächst eine Auslagerung von Standardabweichung (Stochastik) in Varianz (Stochastik) und Stichprobenvarianz (Schätzfunktion) vornehmen.--JonskiC (Diskussion) 03:58, 3. Okt. 2017 (CEST)Beantworten
HilberTraum: Wolltest du dich nicht dein Feedback zu hiesigem Lemma geben?--JonskiC (Diskussion) 00:04, 14. Okt. 2017 (CEST)Beantworten
Ja, hatte ich ein bisschen aus den Augen verloren, aber heute oder morgen gehe ich den Artikel mal durch. -- HilberTraum (d, m) 11:02, 14. Okt. 2017 (CEST)Beantworten

Ich habe den Artikel jetzt durchgelesen. In der zweiten Hälfte geht es schon ziemlich in Richtung „Formelsammlung“. In weiß nicht so recht, ob das wirklich lesenswert sein kann, in dem Sinn, dass man es sich interessiert von vorne nach hinten durchliest. Das liegt aber natürlich vor allem auch am Thema. Sprachlich ist stellenweise auch noch Luft nach oben, Beispiel aus der Einleitung Das Konzept der Varianz lässt sich verallgemeinern. Allgemeiner spricht man dann von einer Kovarianz. Im Gegensatz zur Varianz, die lediglich Variabilität der betrachteten Zufallsvariable misst, misst die Kovarianz die gemeinsame Variabilität von zwei Zufallsvariablen. Hier meine inhaltlichen Notizen:

  • Auf die als veraltet bezeichneten Begriffe Dispersion und Streuung sollte irgendwo kurz eingegangen werden oder sie sollten wenigstens einen Einzelnachweis bekommen. War mit „Streuung“ wirklich die Varianz gemeint und nicht etwa die Standardabweichung?
  • Vor der Definition von Varianz muss nicht noch unbedingt Definition Varianz stehen.
  • Ich mag den Begriff „Träger einer Zufallsvariablen“ nicht, auch wenn er vielleicht manchmal in der Literatur verwendet wird. Und zwar weil eine Zufallsvariable ja theoretisch auch einen Träger (Mathematik) als Abbildung hat. Dieser Träger wird zwar normalerweise keine Rolle spielen, es kann aber mMn trotzdem verwirren.
  • Eine Zufallsvariable wird als stetig bezeichnet, wenn der Träger dieser Zufallsvariablen überabzählbar ist. Auch wenn diese Definition einen Einzelnachweis hat, kommt mir das sehr ungewöhnlich und unüblich vor. Das Hauptproblem damit ist, dass eine solche Zufallsvariable keine Dichte haben muss. Man könnte vielleicht einfach von Zufallsvariablen sprechen, die eine Dichtefunktion haben.
  • Der Abschnitt „Grenzübergang“ steht unter den diskreten Zufallsvariablen, sollte vom Inhalt mMn nach eher unter den stetigen stehen.
  • In Abschnitt „Verschiebungssatz“ scheint mir die allgemeine Verschiebung um doch sehr speziell bis irrelevant. Wann berechnet man denn Varianzen von Zufallsvariablen so numerisch und muss auf Auslöschung achten? Sowas tritt doch eigentlich nur bei Stichprobenvarianzen auf.
  • Die Stelle zum Beispiel habe ich erst gar nicht kapiert. Es ist die Währung Dollar zum Quadrat gemeint, oder? Das kam doch etwas überraschend. Vielleicht wäre ein optisch einfacheres Beispiel besser.
  • Bei „Beziehung zur Kovarianz“ gibt es den einzigen Beweis im ganzen Artikel. Wieso braucht es ausgerechnet diesen?
  • Man könnte ergänzen, dass die momenterzeugende Funktion ist und dass die n-te Ableitung bezeichnet.
  • Die Überschrift „Wichtige Varianzen“ sollte wohl eher „Varianzen wichtiger Verteilungen“ oder so heißen. Vielleicht könnte man dort noch die Poisson-Verteilung aufnehmen.
  • Im Abschnitt „Bedingte Varianzen“ ist nicht erklärt und ist mMn auch eine sehr ungewöhnliche Schreibweise.
  • Bei Ronald Fisher hat mich das beiläufig eingestreute „Vertreter der Eugenik“ überrascht. Ist das für diesen Artikel relevant? Bei der Beschreibung seines Modells wurde mir auch erstmal gar nicht klar, ob das was mit dem Begriff der Varianz zu tun hat. Erst beim Anklicken des Links zu seinem Theorem wurde es dann etwas klarer, auch wenn ich nicht viel Ahnung von Biologie habe.
  • In der Statistik gibt es noch weitere Streuungsmaße, die sich aber nicht alle sinnvoll für Verteilungen definieren lassen. Welche denn zum Beispiel? Im verlinkten Artikel werden keine genannt.

Soweit erst mal. Ist ein bisschen was zusammengekommen, aber ich hoffe das hilft weiter. Grüße -- HilberTraum (d, m) 20:16, 14. Okt. 2017 (CEST)Beantworten

Danke für die ausführlichen und hilfreichen Anmerkungen! Ich werde mich denen demnächst mal annehmen;) Grüße. --JonskiC (Diskussion) 20:45, 14. Okt. 2017 (CEST)Beantworten
 Ok - überflüssiges "Definition der Varianz" + Überschrift angepasst. --JonskiC (Diskussion) 20:51, 14. Okt. 2017 (CEST)Beantworten
 Ok Nicht belegten und unverständlichen Satz entfernt und nicht relevanten Zusatz "Vertreter" der Eugenik entfernt. --JonskiC (Diskussion) 20:55, 14. Okt. 2017 (CEST)Beantworten
 Ok Grenzübergang als Unterpunkt der "Definition bei diskreten Zufallsvariablen".--JonskiC (Diskussion) 20:58, 14. Okt. 2017 (CEST)Beantworten
 Ok Zusatz mit der momenterzeugenden Funktion ergänzt. --JonskiC (Diskussion) 21:02, 14. Okt. 2017 (CEST)Beantworten
 Ok Poisson-Verteilung ergänzt. --JonskiC (Diskussion) 21:16, 14. Okt. 2017 (CEST)Beantworten
 Ok Statt Dollar -> cm. --JonskiC (Diskussion) 21:19, 14. Okt. 2017 (CEST)Beantworten
 Ok Zu speziellen Zusatz mit numerischer Auslöschung entfernt. --JonskiC (Diskussion) 21:29, 14. Okt. 2017 (CEST)Beantworten
 Ok Statt Träger Wertebereich und Definition bei stetigen Zufallsvariablen über Existenz der W'keitdichte.--JonskiC (Diskussion) 21:46, 14. Okt. 2017 (CEST)Beantworten
 Ok Einzelnachweis für die Bezeichnung „Streuung“ eingefügt. Zu dem von dir genannten Punkt, dass die Varianz als „Streuung“ bezeichnet wurde habe ich keinen Beleg, aber dafür ein altes Lexikon, bei der die Varianz so bezeichnet wird. Dies könnte man ja als eine Art Referenz angeben. Meine Vermutung ist dass damals einfach alles was ansatzweise „gestreut“ hat mit „Streuung“ bezeichnet wurde (die Standardabweichung wurde ja auch mit „Streuung“ bezeichnet). Der Beweis bei der Beziehung zur Kovarianz, kann mE Beweis erbracht werden, da er sehr kurz und mE essentiell für das weitere Verständnis und das Verständnis im Allgemeinen ist. Zum Punkt zur Notation im Abschnitt „Bedingte Varianzen“ überlege ich mir noch was;) Beste Grüße.--JonskiC (Diskussion) 22:02, 14. Okt. 2017 (CEST)Beantworten
Ich habe den Beweis, wie von dir vorgeschlagen, jetzt doch entfernt, da er auch beim Artikel Kovarianz erbracht wurde und somit ohnehin redundant war.Grüße.--JonskiC (Diskussion) 12:28, 15. Okt. 2017 (CEST)Beantworten

Definition der Varianz

Genau wie der Erwartungswert kann die Varianz für eine allgemeine Zufallsvariable definiert werden. Das wird in der Wahrscheinlichkeitstheorie über das Lebesgue-Integral gemacht. Die Formeln für diskrete und stetige Verteilungen ergeben sich als Spezialfälle durch Einsetzen in die allgemeine Definition. Aber so ist die Varianz auch für beliebige gemischte Verteilungen definiert. Bez. der Bezeichnungen sind da alle Bücher etwas unterschiedlich. Ich habe die aus dem Lemma für den Erwartungswert übernommen, damit es innerhalb der Wikipedia einheitlich ist.

Durch die allgemeine Definition ist sofort klar, dass die Varianz nur für quadrat-integrierbare Verteilungen existiert. D. h. es gibt Verteilungen, die genauso symmetrisch und ähnlich einer Normalverteilung aussehen, für die die anschauliche Interpretation nicht gilt.

Beides war bisher im Artikel nicht fachlich korrekt dargestellt worden.