Zum Inhalt springen

Diskussion:Geburtstagsparadoxon

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 3. August 2007 um 15:16 Uhr durch 141.3.74.36 (Diskussion) (W oder p: erledigt, geloescht nach WP:DS). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 17 Jahren von NeoUrfahraner in Abschnitt Mathematische Herleitungen

Geburtstagsproblem - kleine Abweichung

Bei der Berechnung mit Excell komme ich nur auf 22 Personen, bei denen dann die Wahrscheinlichkeit mindestens 50% ist, dass zwei am gleichen Tag Geburtstag haben. Habe ich einen Rundungsfehler oder Denkfehler gemacht?

Ich habe n = 23 und eine W'keit von 0,5073 also echt größer als 0,5 ;-) MfG

Für n=23 stimmt dein Ergebnis, aber für n=22 erigbt sich 0,4757 --Robert 07:44, 2. Mär 2005 (CET)


wtf??

[...] 23 willkürlich ausgewählten Personen [...] [...] 50 Prozent[...] [...] 253 Personen [...]

23, 5(0), 2 5 3 (eine 5 zwischen 23)

  • angstbekomm* :)

Hehe, das gleiche dachte ich auch sofort. ;-) Die Illuminaten sind überall!--Maststef 16:31, 12. Okt 2005 (CEST)



Wissen ungewöhnlich

Dieser Artikel soll ev. Bestandteil von Wikipedia:WikiReader/Wissen.ungewöhnlich. werden.siehe Wikipedia Diskussion:WikiReader/Wissen.ungewöhnlich.


Weitere Werte

Weitere Werte - außer für p=0,5 wären interessant, vielleicht in Tabellenform! Benutzer:Imperatom, 17.9.

Hab das mal eingefügt, allerdings hält sich mein Tabellenwissen in (leider sichtbaren) Grenzen. Wäre schön, wenn jemand das mal aufpolieren könnte. :o)
-- Grüße, Dudenfreund 05:41, 22. Okt 2005 (CEST)


Warum Variationen und nich Kombinationen??

Ich frage mich warum die Anzahl der möglichen/günstigen Ereignisse mit Variation berechnet werden. Ist die Reihenfolge nicht völlig irrelevant?

Auf welche Formel beziehst Du Dich und wie sollte sie Deiner Meinung nach richtig lauten? --NeoUrfahraner 16:58, 31. Dez 2005 (CET)

Ja, warum sind den die Möglichkeiten 365 hoch n? meiner Ansicht nach müssten es (365+1-n) über (n) sein, weil es doch wurscht ist in welcher Reihenfolge sie geburtstag haben...

Bei 2 Personen ist die Wahrscheinlichkeit, dass eine am 1.1. Geburtstag hat und eine am 1.2. doppelt so groß, wie die, dass beide am 1.1. Geburtstag haben (natürlich vorausgsetzt, alle Tage sind gleich wahrscheinlich und die Geburtstage sind unabhängig voneinander). Wir haben diesen Fall also korrekterweise doppelt gezählt. --217.86.161.131 17:07, 17. Okt. 2006 (CEST)Beantworten

Ich persönlich verstehe durch die Antwort nicht, warum es sich hier um Variationen statt Kombinationen handeln soll. Ich bin nach wie vor der Meinung, dass die Reihenfolge der Geburtstage unerheblich ist und somit die Formeln für Kombinationen benutzt werden müssten. Das würde die Wahrscheinlichkeiten für zwei Geburtstage am selben Tag natürlich dramatisch steigern (über 70% bei 23 Personen), weshalb mir das seltsam vorkommt. Kann das vielleicht jemand detailliert und verständlich erläutern? -dfeng

Nochmal: Auf welche Formel beziehst Du Dich und wie sollte sie Deiner Meinung nach richtig lauten? --NeoUrfahraner 10:56, 3. Mai 2007 (CEST)Beantworten

Nur zur Klarheit, ich bin nicht der Author von oben, habe mich bloß über dasselbe gewundert. Es geht uns um die Formeln:

und

.

Diese sind ja die Formeln für Variationen, berücksichtigen also Reihenfolgen. Nun denken mein Vorauthor und ich, dass die Reihenfolgen egal sein und somit die entsprechenden Formeln für Kombinationen gelten müssten:

und

Vergleiche Formel auf der Wiki Seite unter dem Stichwort Kombinatorik. Vorsicht hier sind n und k vertauscht. -dfeng

Hm. Betrachte die Fälle:
  1. Anna hat am 1. Feb und Berta am 2. März Geburtstag
  2. Anna hat am 2. März und Berta am 1. Feb Geburtstag
Bedeutet beides das selbe? --NeoUrfahraner 13:22, 3. Mai 2007 (CEST)Beantworten


Intuitiv würde ich sagen, dass beide dasselbe bedeuten, da uns ja egal ist, wer gemeinsam und an welchem Tag Geburtstag hat, da liegt mein Problem. Faktisch weiß ich, dass die im Beitrag verwendeten Formel korrekt sind, da man das mit einem Empirischen Test belegen kann. Die Frage ist nur, warum. -dfeng

Du lernst auf einer Party Anna und Berta kennen. Wie groß ist die Wahrschenlichkeit, dass die eine am 1. Feb und die andere am 2. März Geburtstag hat? --NeoUrfahraner 13:51, 3. Mai 2007 (CEST)Beantworten

Die dürfte (1/365)² sein, aber das hilft hier nicht weiter. -dfeng

Und wie groß ist die Wahrscheinlichkeit, dass Anna am 1. Feb und Berta am 2. März Geburtstag hat? --NeoUrfahraner 16:33, 3. Mai 2007 (CEST)Beantworten

Ok, die Wahrscheinlichkeit für das oberen müsste (2/365)*(1/365) sein, weil es für den ersten Geburstag 2 Möglichkeiten gibt. Die für eine spezielle Kombination ist dann (1/365)². Sehe aber ehrlich gesagt noch keinen direkten Zusammenhang und wäre für eine exakte Erklärung dankbar, weiter Raten mach t nur die Seite hier voller und unübersichtlicher. -dfeng

Ich vesuch's einmal so zu erklären: hier wird die naive Definition der Wahrscheinlichkeit als Anzahl der günstigen Fälle durch Anzahl der möglichen Fälle genommen. Mit dieser Definition könnte man als "Fall" die Kombinationen genau so gut nehmen wie die Variationen, das liefert aber unterschiedliche Ergebnisse. Diese naive Definition stimmt nämlich nur, wenn alle Fälle gleich wahrscheinlich sind. Im konkreten Fall sind alle Variationen gleich wahrscheinlich, alle Kombinationen hingegen nicht:
  1. Kombinationen: Die Wahrscheinlichkeit, dass eine am 1. Feb und die andere am 2. März Geburtstag hat ist größer als die Wahrscheinlichkeit, dass beide am 1. Feb Geburtstag haben.
  2. Variationen: Die Wahrscheinlichkeit, dass Anna am 1. Feb und Berta am 2. März Geburtstag hat ist gleich groß wie die Wahrscheinlichkeit, dass beide am 1. Feb Geburtstag haben und gleich große wie die Wahrscheinlichkeit, dass Anna am 2. März und Berta am 1. Feb Geburtstag hat
Alle Variationen sind gleich wahrscheinlich, daher darf die Formel "günstige durch mögliche" für die Variationen genommen werden. Im Artikel kommt das aber zugegebenermaßen nicht deutlich genug raus. --NeoUrfahraner 17:23, 3. Mai 2007 (CEST)Beantworten

Das war jetzt eine sehr gute und schlüssige Erklärung, danke! Du schriebst "naive Wahrscheinlichkeit". Gibt´s da noch eine bessere Möglichkeit? Diese Form der Wahrscheinlichkeit liefert ja bei empirischen Tests schon sehr exakte Ergebnisse. -dfeng

Siehe Wahrscheinlichkeitsbegriff. Was ich als "naive Wahrscheinlichkeit" bezeichnet habe, heißt dort "klassische oder Laplacesche Auffassung". Mit "naiv" meine ich auch nicht, dass dieser Wahrscheinlichkeitsbegriff generell falsch ist, sondern vielmehr, dass er genauer hinterfragt gehört (und im 20. Jahrhundert auch wurde). --NeoUrfahraner 11:58, 4. Mai 2007 (CEST)Beantworten

Wahrscheinlichkeit, dass zwei Personen an einem Tag Geburtstag haben

Ich finde diese Überschrift irreführend. Man geht ja über "Alle Personen haben an unterschiedlichen Tagen Geburtstag", was das Gegenereignis zu "Mindestens zwei Personen haben am gleichen Tag Geburtstag" wäre. Im Text selber steht es auch so.

Rekrusion eigentlich Iteration?

Im Abschnitt 2 "Kleines Programm" ist von Rekusion die Rede, laut Wikipediadefinition ist Rekursion aber: "[..] Aufruf oder die Definition einer Funktion durch sich selbst." Dies sehe ich hier nicht. In meinem Augen handelt es sich einwandfrei um eine Iteration ("[..] sich der Lösung eines Rechenproblems schrittweise, aber zielgerichtet anzunähern. Sie besteht in der wiederholten Anwendung desselben Rechenverfahrens."

Es wird die Rekursionsformel benutzt, das Programm selber benutzt jedoch keine Rekursion. --DaB. 11:58, 20. Okt. 2006 (CEST)Beantworten

Geburtstagsparadoxon nur zu 9,735% wahrscheinlich !!!

09,01,2007

Habe mich in den letzten Tagen intensiv mit Wahrscheinlichkeitsrechnungen beschäftigt und sehr viele Beiträge gefunden.Das Geburtstagsparadoxon hat mich besonders angesprochen. Leider konnte ich die Formeln für die Berechnung nicht nachvollziehen.

Deshalb habe ich ein kleines Programm mit Excel erstellt, welches beliebig viele Zufallszahlen zwischen 1 und 365 (simuliert alle möglichen Geburtstage)erstellen kann.

In einem Beispiel werden die 23 ausgeworfenen Zufallszahlen (Geburtstage)untersucht ob es mindestens 2 gleiche Zahlen gibt. Die erste wird mit der zweiten 1-2 1-3 1-4 ....1-23 usw. verglichen, die 2-3 2-4 2-5 ..... 2-23 ..... 22-23 letzter Vergleich (die 23 wurde nach diesem System schon mit allen anderen Zahlen verglichen) Sobald ein Paar gefunden wurde wird die Suche abgebrochen und das Ergebniss gespeichert (Sollten mehr als 1 Paar gefunden werden wird nur 1 Paar gespeichert).

Bei meinem letzten Versuch mit 100.000 Durchläufen wurden 9783 mal mindestens 1 mal ein Paar gleicher Zahlen (Geburtstage)gefunden.

Daher 9,783 % !!!!!!!! und nicht über 50 %

Sollte jemand einen Fehler meinerseits beweisen können, oder mein kostenloses Programm testen wollen kann er mich unter werner.tischler@aon.at erreichen.

Sollte jemand 500 Euro von mir haben wollen, Biete ich eine Wette an: Mein Einsatz 100 Euro Einsatz Gegner 50 Euro

Wenn bei 23 zufälligen Zahlen Zwischen 1 und 365 kein Pärchen vorhanden ist gewinne ich, sonst mein Gegner!

Diese Wette können wir so lange wiederholen, bis meine 500 Euro verbraucht sind.

PS: Das einzig paradoxe an dem Geburtstagparadoxon ist, daß alle daran glauben. Dieser Blödsinn Lehrstoff an den Unis ist, Profesoren ihren Schülern Wetten anbieten, welche anscheinend nie angenommen wurden.


Die Wette würde ich an deiner Stelle nicht eingehen. Ich hab jetzt mal nur 10 Versuche gemacht, aber das mit den über 50% kommt hin. Wohl ein kleiner Fehler in deinem kleinen Excel Programm.--Fischkopp 16:14, 9. Jan. 2007 (CET) __________________________________________________________________Beantworten


Danke für deine Nachricht

Nachstehend 10 Zahlenreihen zuffällig erstellt

--0 von 1 Treffer 251 15 359 154 308 115 59 32 114 233 337 123 36 102 269 232 74 87 315 92 130 187 113 --0 von 2 Treffer 343 41 45 33 69 231 279 330 178 269 264 12 37 57 363 174 281 228 117 355 6 310 145 --0 von 3 Treffer 252 349 325 204 299 112 113 304 364 87 285 58 277 81 207 23 208 287 244 8 255 50 300 --0 von 4 Treffer 101 143 116 197 317 56 109 119 186 352 315 157 170 34 78 213 270 196 53 20 23 12 47 --0 von 5 Treffer 50 98 149 265 65 60 173 102 121 63 238 77 293 278 151 71 215 147 82 180 252 131 129 --0 von 6 Treffer 342 343 169 229 317 150 287 142 311 72 156 73 55 12 141 120 280 165 218 259 232 314 68 --1 von 7 Treffer (323) 63 214 224 290 91 323 165 275 138 183 340 32 323 180 147 151 139 174 69 20 70 283 106 --1 von 8 Treffer 145 258 284 304 245 56 259 110 364 333 253 32 329 265 362 70 314 311 222 126 317 109 197 --1 von 9 Treffer 36 271 28 294 323 139 56 38 360 124 103 263 51 224 265 238 320 342 81 232 242 308 12 --1 von 10 Treffer 350 191 301 68 209 344 304 230 88 151 155 143 178 73 24 74 287 13 8 121 147 166 108

Bei Zehn versuchen nur 1 Treffer Wenn der Zufallsgenerator keinen Fehler hat (nur schwer zu beweise) (habe aber die Zahlen von 1 bis 10 auf Ihre Zufälligkeit überprüft) hatte ich gerade 90-20 Euro gewonnen!!!



Deine Zahlen sind nicht „zufällig“, sondern durch einen Pseudozufallszahlengenerator erzeugt. Lass Dir nochmal Zahlen von /dev/random erzeugen. --Fomafix 19:12, 9. Jan. 2007 (CET)Beantworten

Danke für deine Nachricht

Leider konnte ich mit denem Link keine Zufallszahlen erzeugen, habe auch noch keinen anderen gefunden.

Der VB Zufallsgenerator ist meiner Meinung nach wircklich ein Pseudozufallszahlengenerator. Für mich trotzdem kaum vorstellbar, dass die Ergebnisse so verfälscht werden, dass aus einer Wahrscheinlichkeit von ca 10 % plötzlich über 50 % werden könnten.

Was meine Meinung bestärkt ist die Tatsache, wenn einige Zahlen mit dem Pseudozufallsgenerator öfter oder seltener als "normal" vorkommen würden, würde sich die Paarbildung erhöhen, was wiederum für den VB Zufallsgenerator spricht!

LG WT 09,01,2006


  1. Hole dir richtigen Zufall.
  2. Erhöhe die Instanzgröße (bei 10 Versuchen ist die Abweichung zu groß!)
  3. Klar ist der "WB_Zufallszahlengenerator]]" Pseudozufall, oder hast du einen Caesium-Zufalls-Apperatur zuhaus ? http://www.codinghorror.com/blog/archives/000728.html

Peritus 21:47, 9. Jan. 2007 (CET)Beantworten


Habe gerade den Fehler gefunden!! Hatte die Randomize Funktion bei Jeder Schleife neu gestartet, das war offensichtlich der Fehler. Bedeutet, das ich jede Zufallszahl abhängig von der Systemuhr erzeugt habe.Habe das jetzt geändert und nur mehr die erste erzeugte Zufallszahl von der Systemuhr abhängig gemacht.

Neuer Wert nach 100.000 Durchläufen 51262 Treffer = 51,262 %

Komischer weise habe ich die Zahlen von 1 bis 10 auf Ihre Zufälligkeit getestet, und keine besonderen Abweichungen von der "Norm" feststellen können.

Habe mitlerwiele auch andere Zufallsgeneratoren getestet und zum selben Ergebniss gekommen.

Ich möchte mich nochmals bei allen Personen entschuldigen dehnen ich unnötig Zeit geraubt habe. Meine Wette muss ich natürlich überdenken.

Trotzdem ist es Paradox , das der fehlerhafte Zufallsgenerator in nur einem (bisher) einzigen Fall(Geburtstagsparadoxon) so enorme Abweichungen aufweist, und sonst richtig funktioniert hat.

Ich habe heute zum ersten mal eine Wikipedia Diskussion geschrieben, und bin überascht wie viele Personen sich in so kurzer Zeit, zu Wort gemeldet haben.

LG WT 09,01,2007

Abweichung des faschen Zufallsgenerators

W.T. 10,01,2009

Nach dem ich den Fehler entdeckte, woltte ich die Unterschiede der beinen Zufallsgeneratoren erforschen.

Ergebnisse: Bei den Zahlen von 1 - 1000 konnte ich keine unterschiedliche Häüfigkeit der einzelenen Zahlen entdecken!

Einziger Unterschied war bei der Pärchenbildung sehr deutlich zu erkennen. Je höher der Zahlenbereich, desto grösser der Unterschied.

Tabelle Pärchensuche bei 1000 Durchgängen


Zahlen bis/ Anz. D. Zahlen (Personen)/ Treffer falscher Generator/ Treffer richtiger Generator/

50/ 10/ 637/ 642

100/ 15/ 607/ 683

365/ 23/ 138/ 524

1000/ 30/ 16/ 341

3000/ 50/ 8/ 307

Daher bei 50 Zahlen zwischen 1 und 3000 bildeten sich bei 0,8% der versuche ein Pärchen mit dem falschen Generator und zu 30,7% mit dem richtigen Generator!

Habe keine Erklärung für dieses Ergebniss!!


Hypergeometrische Verteilung und andere Ergänzungen

Zu http://de.wikipedia.org/w/index.php?title=Geburtstagsparadoxon&diff=32623621&oldid=32218207 und http://de.wikipedia.org/w/index.php?title=Geburtstagsparadoxon&diff=32648514&oldid=32623621 : Dir Größe der Grundgesamtheit "Menscheit" ("z.B. 365 000 Menschen") ist völlig irrelevant. Es geht darum, dass jeder der n betrachteten Personen eine iid (unabhängig und identisch verteilte) Zufallszahl g ("Geburtstag") aus der diskrteten Gleichverteilung auf (1,...,365) (Grundgesamtheit) zugeordnet wird. Es werden also nicht n Personen zufällig gewählt ("was im Urnenmodell einer Ziehung von n Kugeln ohne Zurücklegen entspricht"), sondern umgekeht, aus einer Urne mit 365 Kugeln (die mit 1. Jan bis 31. Dez. beschriftet sind) n Kugeln mit Zurücklegen gezogen. --NeoUrfahraner 15:19, 2. Jun. 2007 (CEST)Beantworten

Hallo, die Größe der Grundgesamtheit "Menschheit" ist sehr wohl relevant. Angenommen die "Menschheit" besteht aus 730 Personen, deren Geburtstage so auf das Jahr verteilt sind, dass je zwei Personen am selben Kalendertag Geburtstag feiern. Dann muss die Stichprobe sehr viel umfangreicher als n=23 sein um zu erreichen, dass die Wahrscheinlichkeit, dass zwei Personen an einem Tag Geburtstag haben, mehr als 50% beträgt. Gruß --172.180.66.241 00:56, 3. Jun. 2007 (CEST)Beantworten
Im von Dir angegeben Fall ist die Voraussetzung, dass "die Geburtstage der n Personen unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung" sind nicht erfüllt, dieser Fall ist somit in meiner Formulierung bereits ausgeschlossen. --NeoUrfahraner 21:20, 3. Jun. 2007 (CEST)Beantworten
Da also kein Einwand kommt, habe ich wieder die Version 16:49, 2. Jun. 2007 hergestellt. --NeoUrfahraner 07:59, 5. Jun. 2007 (CEST)Beantworten
Du weißt hoffentlich, dass deine Formulierung nicht der originalen Problemstellung entspricht. Das Geburtstagsproblem lautet:"Wie hoch ist die Wahrscheinlichkeit dafür, dass bei 23 anwesenden Personen mindestens zwei am gleichen Tag Geburtstag haben?" Es geht also um 23 verschiedene Personen, die aus einer (unbekannten) Grundgesamtheit zufällig ausgewählt werden müssen (was im Urnenmodell einer Ziehung von n Kugeln ohne Zurücklegen entspricht; Modell 1). Also ist der Umfang der Grundgesamtheit von zentraler Bedeutung für die Berechnung.
Deine Formulierung entspricht der Problemstellung:"Wie hoch ist die Wahrscheinlichkeit dafür, dass bei 23-maliger Zufallswahl einer Person aus einer gleichbleibenden Grundgesamtheit von 365 Personen mindenstens eine Person zweimal ausgewählt wird?" Es geht also um 365 verschiedene Personen, aus denen 23 mal eine Zufallsstichprobe von 1 Person genommen werden muss (was im Urnenmodell einer Ziehung von n Kugeln mit Zurücklegen entspricht; Modell 2)
Wichtig ist nun die Begründung dafür, warum das Ursprungsproblem Modell 1 durch das Modell 2 ersetzt werden darf. Ohne diese Begründung ist die mathematische Argumentation lückenhaft, und es ist nicht einsehbar, dass die Behauptung "die Geburtstage der n Personen sind unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung" gültig sein soll. Strenggenommen ist sie nämlich nicht gültig! Schließlich ist der Umfang der Grundgesamtheit "Menschheit" endlich. --62.180.196.84 19:36, 5. Jun. 2007 (CEST)Beantworten
Die Bedingung "die Geburtstage der n Personen sind unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung" ist auch nie exakt erfüllt. Es wird lediglich für die Rechnung als Modellannahme hergenommen. Die Endlichkeit der Menschheit ist aber auch nicht das Problem. Nimm 100 Mädchen zwischen 6 und 10 Jahren, warte ein paar Jahre bis die ersten 23 davon Kinder haben und versammle die 23 Erstgeborenen in einem Raum. Zweifelst Du daran, dass iid in diesem Fall ein schlechtes Modell für die Geburtstagsverteilung ist? --NeoUrfahraner 22:21, 5. Jun. 2007 (CEST)Beantworten
Du sagst:"Die Bedingung "die Geburtstage der n Personen sind unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung" ist auch nie exakt erfüllt." Das stimmt, aber die zugrundeliegende Gesamtheit wird als so groß sowie deren Verteilung derart angenommen, dass der Rechenfehler sehr gering ausfällt.
Deine Frage lässt sich so nicht beantworten. Vor einer Berechnung muss zuerst die Grundgesamtheit und deren Verteilung angegeben werden. Erst dann kann man eine Aussage über eine Stichprobe machen. Wenn du annimmst, die Grundgesamtheit und die Stichprobe könnten identisch sein mit 23 Personen, dann unterliegst du einem logischen Irrtum. Denn die 23 Neugeborenen können niemals diskret auf 365 Jahrestage gleichverteilt werden. Du brauchst stattdessen mindestens 730 Personen, um eine sinnvolle diskrete Gleichverteilung (von 2 pro Tag) herzustellen.
Solange du nur mit den Jahrestagen argumentierst und nicht das Ursprungsproblem Modell 1 betrachtest, bleibst du in einem logischen Zirkel gefangen. --62.180.196.41 23:39, 5. Jun. 2007 (CEST)Beantworten
Woher kommen denn in Deutschland die Geburtstage der im Jahr 2007 Neugeborenen? Erzeugt der Staat da eine Grundgesamtheit von 3,65 Mio Kindern, von denen je 10 000 am selben Tag Geburtstage haben, zieht daraus zufällig eine knappe Million Kinder ohne Zurücklegen und schmeißt am Jahresende die verbliebenen weg? Oder kommen die Geburtstage vielleicht doch aus einer anderen Grundgesamtheit? --NeoUrfahraner 08:13, 6. Jun. 2007 (CEST)Beantworten
Vielleicht noch zur Klarstellung: Ich rede nicht von Stichproben, sondern von Zufallsvariablen. --NeoUrfahraner 08:41, 6. Jun. 2007 (CEST)Beantworten
Die Geburtstage sind ja nichts anderes als nummerierte Schachteln, die benutzt werden, um die Neugeborenen hineinzulegen. Jede Person erhält also solch eine Nummer. Die Grundgesamtheit besteht sinnvollerweise zum Schluss aus den Personen bzw. deren Nummernzettel in einer Urne, wobei jede Nummer sooft vorkommt wie Personen an diesem Tag Geburtstag haben. Daraus werden nun 23 Nummernzettel ohne Zurücklegen gezogen.
Du behauptest stattdessen, dass die Geburtstage selbst, also die nummerierten Schachteln, die Grundgesamtheit bilden müssten. Das macht aber keinen Sinn, denn wenn du am Ende des Jahres 2007 eine der Schachteln auswählst, hast du mit einer sehr großen Wahrscheinlichkeit mehr als ein Baby in dieser Schachtel. Du benötigst also bestimmt keine 23 Schachteln, um im Durchschnitt mehr als ein Neugeborenes pro Tag zu finden.
Solange du dich nicht von dem Modell 2 gedanklich lösen kannst, wirst du die eigentliche Problemstellung verfehlen. Das gilt unabhängig davon, welchen mathematischen Apparat du verwenden willst. Zuerst sollte das Problem klar erkannt werden, dann kann man über technische Details reden. --62.180.196.75 19:32, 6. Jun. 2007 (CEST)Beantworten
Kurze Antwort: Modell 2 war ja schon in Deiner Version 14:49, 2. Jun. 2007 vorhanden. Es geht ja nur um die Frage, ob man dazu als Voraussetzung unbedingt eine große Grundgesamtheit braucht. Da wir uns anscheinend nicht einigen können und Du jetzt ohne Diskussion auch noch aus der richtigen Binomialverteilung eine falsche Hypergeometrische Verteilung machst, gehe ich zurück auf die Version 17:37, 23. Mai 2007 Trublu, bevor einer von uns was zum strittigen Thema gesagt hat. --NeoUrfahraner 15:58, 7. Jun. 2007 (CEST)Beantworten
Die Hypergeometrische_Verteilung ist an dieser Stelle genau richtig, denn es geht um Versuche ohne Zurücklegen (Modell 1). Das entspricht Situationen, bei denen sich die Gesamtzahlen und damit die Chancen für Erfolg und Misserfolg von Teilschritt zu Teilschritt ändern. Wenn eine Person A ausgewählt wurde, gehört sie nicht mehr zur restlichen Gesamtheit, aus der weitere Personen gezogen werden. Die Wahrscheinlichkeit, eine weitere Person B mit demselben Geburtstag zu ziehen, vermindert sich, weil die Besetzungszahl dieses Kalendertages sich um die Person A verkleinert hat. Andererseits erhöht sich die Wahrscheinlichkeit, eine bestimmte andere Person zu ziehen, weil die Grundgesamtheit sich ebenfalls verkleinert hat. Deswegen ist es wichtig zu wissen:
1. Wie groß ist die Grundgesamtheit
2. Wie groß ist die (durchschnittliche) Besetzungszahl pro Kalendertag.
Beispiel: Die Grundgesamtheit bestehe aus 730 Personen, von denen jeweils 2 am gleichen Kalendertag Geburtstag haben. Wir haben dann eine Gleichverteilung mit der Besetzungszahl 2. Wenn wir nun 23 Personen zufällig auswählen und berechnen, wie groß die Wahrscheinlichkeit für mindestens einen doppelten Geburtstag ist, erhalten wir als Ergebnis . Bei Anwendung von Modell 2 hätten wir jedoch . Da macht sich der Modellunterschied deutlich bemerkbar.
Die Binomialverteilung wird übrigens im Artikel gar nicht benutzt. Stattdessen wird über plausible Annahmen eine Gegenwahrscheinlichkeit berechnet. --62.180.196.71 17:17, 8. Jun. 2007 (CEST)Beantworten
Hast Du den Artikel überhaupt gelesen? Dann wüßtest Du, dass die Binomialverteilung für eine andere Frage, nämlich für die Wahrscheinlichkeit, dass jemand an einem ganz bestimmten Tag Geburtstag hat verwendet wird. Und nochmals: Du gehst davon aus, dass die 23 Personen eine Stichprobe aus einer Grundgesamtheit mit einer bekannten Zusammensetzung sind. Davon steht aber im Artikel nichts, und diese Annahme ist auch unnötig. Siehe Dein Satz oben: Jede Person erhält also solch eine Nummer. (19:32, 6. Jun. 2007) Wer vergibt diese Nummern? Sind diese Nummern auch Stichproben aus einer Grundgesamtheit? --NeoUrfahraner 17:45, 8. Jun. 2007 (CEST)Beantworten
Hast Du den Artikel überhaupt gelesen? Dann wüßtest Du, dass die Binomialverteilung auch nicht für die andere Frage, nämlich für die Wahrscheinlichkeit, dass jemand an einem ganz bestimmten Tag Geburtstag hat verwendet wird. Auch hier wird über plausible Annahmen eine Gegenwahrscheinlichkeit berechnet.
Du sagst:"Davon steht aber im Artikel nichts". Das ist ja gerade einer der großen Mängel des Artikels, dass dort die Voraussetzungen, die die Benutzung des Modells 2 erst möglich machen, nicht explizit ausgesprochen werden.
Die Nummern vergibt z.B. ein Amt. Diese Nummern sind natürlich keine Zufallsstichproben, sondern werden dem Geburtstag der Person entsprechend vergeben. Wenn z.B. der 10.Mai der "rote" Tag im Jahr ist, dann wird für jedes an diesem Tag Neugeborene eine rote Kugel in die große Urne mit der Grundgesamtheit gelegt. Außerdem werden die Kugeln, die Tote repräsentieren, aus der Urne entfernt. Das Geburtstagsproblem befasst sich ja explizit nur mit lebenden Personen. Somit ist in der Urne jede Farbe mit soviel Kugeln vertreten wie lebende Personen an diesem "Farbtag" geboren wurden.
Soweit erstmal. Jetzt aber mal eine Frage: bist du überhaupt in der Lage, meine Argumentation nachzuvollziehen? Kannst du oder willst du meine Argumente nicht verstehen? Ich gewinne langsam den Eindruck, dass ich gegen eine Wand schreibe... --62.180.196.7 21:15, 8. Jun. 2007 (CEST)Beantworten
Ich habe soeben eine korrektere Fassung des Artikels eingestellt. Wir können gerne darüber diskutieren, wenn du etwas nicht verstehst. Aber lass bitte diese Fassung solange stehen, bis wir zuende diskutiert haben. --62.180.196.7 21:21, 8. Jun. 2007 (CEST)Beantworten
Umgekehrt. Solande kein Konsens zur Änderung besteht, bleibt die alte Fassung. --NeoUrfahraner 08:04, 9. Jun. 2007 (CEST)Beantworten
Selbstverständlich verstehe ich Deine Argumentation: siehe oben: "Du gehst davon aus, dass die 23 Personen eine Stichprobe aus einer Grundgesamtheit mit einer bekannten Zusammensetzung sind." --NeoUrfahraner 08:17, 9. Jun. 2007 (CEST)Beantworten

Amüsante Diskussion. Die aktuelle (i. e. Neourfahraners) Version beschreibt das Geburtstagsparadoxon so, wie es in der Literatur vorkommt und sollte daher jeder anderen Version vorgezogen werden, Stichwort Wikipedia:Theoriefindung. Was man selbst von der i.i.d. diskreten Gleichverteilung auf den Tagen des Jahres hält und wie man das glaubt "verbessern" zu können, ist für die Wikipedia unerheblich, sondern eine Frage für die Wissenschaft. Wenn sich die Version der IP dann durchgesetzt hat, wird auch der Artikel abgeändert. --Scherben 08:44, 9. Jun. 2007 (CEST)Beantworten

Ich verstehe nicht ganz: in der Literatur kommt die aktuelle Version mit gleichwahrscheinlichen Geburtstagen nicht vor, wenn es um realistisch ungleichmäßig verteilte Geburtstage geht. Das ist ja auch ein wichtiger Punkt im Artikel, der durch alle 4 Literaturangaben belegt wird. Niemand, auch ich nicht, zweifelt daran, dass die einfache Lösung mit Modell 2 eine gute Näherung darstellt. Man sollte allerdings verstehen, warum das so ist, und genau das ist mein Anliegen hier. Meine Ergänzungen im Artikel stellen ja den Lösungsansatz nicht in Frage und verändern den Artikel nicht grundsätzlich, sondern sollen den Leser darauf hinweisen, dass es zu jedem Rechenmodell bestimmte Randbedingungen und Annahmen gibt. Wenn man diese Annahmen nicht nennt, kann ein unbedarfter Leser den Lösungsansatz hier als allgemeingültig missverstehen, so wie es NeoUrfahraner offensichtlich tut.
Ich habe weiter oben (17:17, 8. Juni) gezeigt, dass eine Beispielrechnung gemäß Modell 1 (Ziehung von Personen ohne Zurücklegen), welches 100%ig der Problemstellung entspricht, ein anderes Ergebnis bringen kann als die Rechnung gemäß Modell 2 (Ziehung von Geburtstagen mit Zurücklegen). Was das mit Theoriefindung zu tun haben soll, musst du mir mal erklären. Zumal die Rechnungen bei ungleichmäßig verteilten Geburtstagen nach Modell 2 (alle Geburtstage sind immer gleichwahrscheinlich) sowieso keinen Sinn machen. --62.180.196.112 15:27, 9. Jun. 2007 (CEST)Beantworten
Eigentlich wollte ich mich nicht mehr zum Thema äußern; trotzdem noch ein kurze Anmerkung: "In der Literatur kommt die aktuelle Version mit gleichwahrscheinlichen Geburtstagen nicht vor, wenn es um realistisch ungleichmäßig verteilte Geburtstage geht." Das stimmt. Ein gutes Beispiel ist ja z.B. der zitiert Bloom, D. (1973). Der wesentliche Punkt dabei ist aber, dass bei D. Bloom zwar nicht mehr alle 365 Tage gleich wahrscheinlich sind, die Geburtstage aber weiterhin i.i.d. sind. Modell 1 (Ziehen ohne Zurücklegen) ist aber nicht i.i.d. Die Aussage dass für nicht gleichmäßig verteilte Geburtstage die Wahrscheinlichkeit zunimmt, dass zwei Personen am gleichen Tag Geburtstag haben gilt ebenfalls nur für i.i.d.; beim Ziehen ohne Zurücklegen hingegen hängt es wesentlich von der Zusammensetzung der Grundgesamtheit ab, ob die Wahrscheinlichkeit für doppelte Geburtstage zu- oder abnimmt. Das Geburtstagsparadoxon ist außerdem weniger für sich selbst als wegen der Anwendungen interessant (z.B. Geburtstagsangriff), und in den Anwendungen interessiert man sich ebenfalls üblicherweise nur für den i.i.d. Fall. Sofern Du nicht irgendwelche Literaturstellen anbieten kannst, die den nicht-i.i.d. Fall (Ziehen ohne Zurücklegen) als relevant für das Geburtstagsparadox ansehen, sehe ich das Thema als abgeschlossen. --NeoUrfahraner 22:22, 9. Jun. 2007 (CEST)Beantworten
Du sagst:"dass bei D. Bloom zwar nicht mehr alle 365 Tage gleich wahrscheinlich sind, die Geburtstage aber weiterhin i.i.d. sind". Ja und? Das funktioniert ja nur deswegen, weil wie auch bei Hugo Pförtner die Besetzungszahlen eines Tages mit mehreren Tausend Personen so hoch sind, dass der Rechenfehler entsprechend vernachlässigt werden kann. Da wird aus rechentechnischen Gründen dieselbe Vereinfachung vorgenommen wie im Artikel.
i.i.d. hat nichts mit den "Besetzungszahlen eines Tages" zu tun, sondern damit, ob Du mit oder ohne Zurücklegen ziehst. --NeoUrfahraner 10:18, 11. Jun. 2007 (CEST)Beantworten
Es hat was damit zu tun, ob die Wahrscheinlichkeit p eines Geburtstages dieselbe bleibt, egal ob dieser schon einmal gezogen wurde oder nicht. i.i.d. heißt auch, dass p als nicht veränderlich angenommen wird. Bei einer Besetzungszahl von 8000 für diesen Tag und einem Grundgesamtheitsumfang von 2920000 ist . Bei Ziehung ohne Zurücklegen wäre die neue Besetzungszahl 7999 für diesen Tag und damit , eine Abweichung von 0,00034246575/1000. Dieser Fehler wird zwecks Vereinfachung (Ziehung mit Zurücklegen) billigend in Kauf genommen. --62.180.196.26 20:56, 11. Jun. 2007 (CEST)Beantworten
Glaubst Du ernsthaft, dass die Wahrscheinlichkeit, dass der nächste Papst am 16. April Geburtstag hat, geringer wird, bloß weil der jetzige Papst am 16. April Geburtstag hat? --NeoUrfahraner 23:08, 11. Jun. 2007 (CEST)Beantworten
Wie würdest du diese Wahrscheinlichkeit denn berechnen? --62.180.196.83 19:51, 12. Jun. 2007 (CEST)Beantworten
Beantworte Du zuerst meine Frage. --NeoUrfahraner 10:24, 13. Jun. 2007 (CEST)Beantworten
Ich habe dir hier schon so viel vorgerechnet, jetzt bist du mal dran. Also... --62.180.196.68 15:01, 13. Jun. 2007 (CEST)Beantworten
Beantworte Du zuerst meine Frage. --NeoUrfahraner 16:24, 13. Jun. 2007 (CEST)Beantworten
Dazu müsste man zunächst mal wissen, ob die Papstwahl etwas mit dem Geburtstag der in Frage kommenden Kardinäle zu tun hat. Es könnte auch sein, dass unter den Kardinälen nur der jetzige Papst war, der am 16. April geboren wurde, und damit würde der nächste Papst mit Sicherheit nicht an diesem Tag geboren sein. Man muss also etwas über die Grundgesamtheit wissen, um eine sinnvolle Aussage machen zu können.
Wenn du behauptest, mit Modell 2 etwas über eine unbekannte Grundgesamtheit aussagen zu können, dann stimmt das so nicht. Denn du setzt ja Gleichverteilung usw. voraus, stützt dich also auf Annahmen, die eine schon bekannte Grundgesamtheit beschreiben. Damit widersprichst du dir.
Was ist denn nun die Wahrscheinlichkeit dafür, dass der nächste Papst am 16. April Geburtstag hat? --62.180.196.18 22:10, 14. Jun. 2007 (CEST)Beantworten
Ich setze sie in erster Näherung mit 1/365,25 an, jedenfalls völlig unabhängig vom Geburtstdatum des aktuellen Papstes. Da Du allerdings ständig von "Grundgesamtheit" sprichst - kann es sein, dass Du mit Deiner Wahrscheinlichkeitsauffassung im 19. Jahrhundert stecken geblieben bist und nur den Laplaceschen Wahrscheinlichkeitsbegriff kennst? --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)Beantworten
Ich glaube nicht, dass für die Papstwahl 365,25 Kardinäle (oder Vielfache davon) in Frage kommen, deren Geburtstage auch noch über das Jahr gleichverteilt sein müssten.
Wenn dir der Begriff "Grundgesamtheit" suspekt ist, dann hast du dich wohl nie wirklich mit Wahrscheinlichkeitstheorie beschäftigt. Lies doch einfach mal diesen Artikel oder Literatur dazu. Auch in anderen Artikeln wird dieser Begriff richtigerweise verwendet.
Der Laplacesche Wahrscheinlichkeitsbegriff ist für die Betrachtungen hier völlig ausreichend. Allerdings müsstest du ein Grundverständnis dafür mitbringen, wie man für konkrete Problemstellungen mathematische Lösungsmodelle entwickelt. Mit einem rein axiomatischen (und deduktiven) Wahrscheinlichkeitsbegriff bist du dazu aber vielleicht gar nicht in der Lage. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)Beantworten
Zur "Grundgesamtheit" siehe meinen nächsten Beitrag weiter unten. Mein Grundverständnis ist irrelevant, relevant ist vielmehr was in der Literatur zum Geburtstagsparadoxon steht. --NeoUrfahraner 20:18, 17. Jun. 2007 (CEST)Beantworten
Du sagst:"Die Aussage dass für nicht gleichmäßig verteilte Geburtstage die Wahrscheinlichkeit zunimmt, dass zwei Personen am gleichen Tag Geburtstag haben gilt ebenfalls nur für i.i.d.". Warum das denn? Nimm z.B. eine Geburtstagsverteilung von 730 Personen auf 365 Tage derart an, dass an 182 Tagen keine, an 182 Tagen genau zwei Personen und am 365. Tag 366 Personen Geburtstag haben. Man sieht schon ohne Rechnung, dass es im Durchschnitt nur weniger Ziehungen bedarf, um mit zwei Personen vom gleichen Tag zu erhalten.
"beim Ziehen ohne Zurücklegen hingegen hängt es wesentlich von der Zusammensetzung der Grundgesamtheit ab, ob die Wahrscheinlichkeit für doppelte Geburtstage zu- oder abnimmt." Für eine andere Zusammensetzung der Grundgesamtheit kann die Wahrscheinlichkeit abnehmen. --NeoUrfahraner 09:41, 11. Jun. 2007 (CEST)Beantworten
Dieser Punkt ist eigentlich nicht sehr wichtig für die Relevanz meiner Ergänzungen. Aber interessehalber: Könntest du mir ein Beispiel nennen? --62.180.196.26 20:56, 11. Jun. 2007 (CEST)Beantworten
Wenn in der Grundgesamtheit kein Geburtstag doppelt vorkommt, kann auch in keiner Stichprobe ein Geburtstag doppelt vorkommen. --NeoUrfahraner 23:08, 11. Jun. 2007 (CEST)Beantworten
Das ist der triviale Fall, der in der Wirklichkeit auch vorkommen kann. Dieser Fall wird z.B. durch Modell 2 gar nicht erfasst. Das heißt, die Rechnung mit i.i.d. würde glatt fehlschlagen und eine unsinniges Ergebnis erbringen. Aber nenn mir doch bitte einen nichttrivialen Fall! --62.180.196.83 19:51, 12. Jun. 2007 (CEST)Beantworten
Der triviale Fall reicht als Beweis meiner Ausssage. --NeoUrfahraner 10:24, 13. Jun. 2007 (CEST)Beantworten
Das ist doch kein Beweis deiner Aussage. Du sagtest weiter oben:"Beim Ziehen ohne Zurücklegen hingegen hängt es wesentlich von der Zusammensetzung der Grundgesamtheit ab, ob die Wahrscheinlichkeit für doppelte Geburtstage zu- oder abnimmt." Im trivialen Fall ändert sich diese Wahrscheinlichkeit beim Ziehen überhaupt nicht, weil immer gilt, sie nimmt also auch nicht ab. --62.180.196.68 15:01, 13. Jun. 2007 (CEST)Beantworten
Genau. Dieser Wert ist niedriger als die angegebenen "mehr als 50%" für 23 Personen. Ziehst Du hingegen mit Zurücklegen 23 Kugeln aus einer Urne, die eine beliebige Mischung von Kugeln mit der Aufschrift "1.Jan" bis "31. Dez" enthält, so ist die Warhscheinlichkeit, dass dabei zwei Kugeln mit der gleichen Aufschrift gezogen werden, immer größer als 50%, unabhängig von der konkreten Zusammensetzung der Kugelmischung in der Urne. --NeoUrfahraner 16:24, 13. Jun. 2007 (CEST)Beantworten
Deshalb ist dein Ergebnis für den trivialen Fall auch falsch; Modell 2 ergibt hier einen unsinnigen Wert, weil du Annahmen über die Grundgesamtheit machst, die nicht stimmen. --62.180.196.18 22:10, 14. Jun. 2007 (CEST)Beantworten
Es geht hier nich um mein Ergebnis, sondern um die Aussage von D. Bloom. Du zweifelst also die Ergebnisse der Fachliteratur an? --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)Beantworten
Du sagtest oben:"Wenn in der Grundgesamtheit kein Geburtstag doppelt vorkommt, kann auch in keiner Stichprobe ein Geburtstag doppelt vorkommen." Damit stellst du selbst dein Modell und die Aussage von D. Bloom in Frage. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)Beantworten
Nein, es ist ganz einfach so, dass bei Bloom keine bekannte Grundgesamtheit vorkommt. --NeoUrfahraner 20:18, 17. Jun. 2007 (CEST)Beantworten
Du sagst:"in den Anwendungen interessiert man sich ebenfalls üblicherweise nur für den i.i.d. Fall". Na klar, dieser Fall ist ja auch wesentlich leichter zu implementieren als der andere Fall mit sich ändernden Wahrscheinlichkeiten. Das ist aber kein Grund, die Vereinfachungen, die den Lösungsweg nach Modell 2 plausibel machen, nicht wenigstens im Artikel zu erwähnen.
Beim Geburtstagsangriff gibt es keine "sich ändernden Wahrscheinlichkeiten". --NeoUrfahraner 09:41, 11. Jun. 2007 (CEST)Beantworten
Ja klar, weil nach Modell 2 gearbeitet wird. Bei Modell 1 ändert sich die Wahrscheinlichkeit p eines Geburtstages jedesmal, wenn dieser Geburtstag gezogen worden ist. Das entspricht ja eigentlich auch der Wirklichkeit und der Problemstellung des Geburtstagsproblems. Im Übrigen ist es unsinnig, von einer "Anwendung des Geburtstagsparadoxons" zu sprechen. Man kann eine Formel oder eine Theorie anwenden, aber keine Problemstellung. --62.180.196.26 20:56, 11. Jun. 2007 (CEST)Beantworten
Inwiefern entspricht Modell 1 der "Wirklichkeit" des Geburtstagsangriffs? Erleichtert Modell 1 Dir irgendwie das Finden eines doppelten Hashwertes? --NeoUrfahraner 23:08, 11. Jun. 2007 (CEST)Beantworten
Ich schrieb:"Wirklichkeit und der Problemstellung des Geburtstagsproblems" und nicht des "Geburtstagsangriffs". Wer lesen kann ist klar im Vorteil. --62.180.196.83 19:51, 12. Jun. 2007 (CEST)Beantworten
Und ich schrieb vorher Beim Geburtstagsangriff gibt es keine "sich ändernden Wahrscheinlichkeiten". --NeoUrfahraner 10:24, 13. Jun. 2007 (CEST)Beantworten
Du nimmst hier einfach einen anderen Artikel, auf den in diesem Zusammenhang als "Anwendung" verwiesen wird, und willst ihn als Kronzeugen dafür benutzen , dass dieser Artikel keiner Ergänzungen bedarf. Das ist Unfug, und zwar in doppelter Hinsicht: 1. Wie schon erwähnt gibt es keine Anwendung eines Problems in der Wissenschaft und 2. Es ist für einen Artikel unerheblich, ob ein anderer Artikel Lösungsansätze daraus verwendet, Hauptsache diese Ansätze werden im Artikel diskutiert uns sind nicht falsch. Das hindert aber nicht daran, weitere korrekte Ansätze aufzunehmen, die in anderen Artikeln momentan nicht verwendet werden. --62.180.196.68 15:01, 13. Jun. 2007 (CEST)Beantworten
Also stimmt jetzt meine Aussage Beim Geburtstagsangriff gibt es keine "sich ändernden Wahrscheinlichkeiten"? --NeoUrfahraner 16:24, 13. Jun. 2007 (CEST)Beantworten
Diese Aussage ist für die Diskussion und den Artikel hier völlig irrelevant. --62.180.196.18 22:10, 14. Jun. 2007 (CEST)Beantworten
Du drückst Dich schon wieder von einer Antwort. --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)Beantworten
Du versuchst dauernd, die Diskussion zu zerfasern in zum Teil hier unwichtige Detailfragen. Wenn du den Artikel Geburtstagsangriff diskutieren willst, dann suche dir jemanden dort. Für mich ist dieser Diskussionsstrang hier irrelevant. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)Beantworten
Was für Dich irrelevant ist, zählt nicht; was zählt ist, dass in der Literatur zum Geburtstagsparadoxon der Geburtstagsangriff sehr wohl relevant ist. --NeoUrfahraner 20:18, 17. Jun. 2007 (CEST)Beantworten
Du sagst:"Sofern Du nicht irgendwelche Literaturstellen anbieten kannst..." Ich glaube, dass die meisten Wikipedia-Artikel Sätze und Formulierungen beinhalten, die so nicht in der Literatur zu finden sind. Das wäre ja auch eine eklatante Verletzung von Copyright-Rechten.
Ein sauberes Zitat ist keine Urheberrechtsverletzung, ansonsten siehe WP:ZIT und WP:Q. --NeoUrfahraner 09:41, 11. Jun. 2007 (CEST)Beantworten
Ich brauche doch keine Zitate, wenn ich in einem Artikel eine Aufgabenstellung beschreiben möchte. Das ergibt sich doch aus dem Verständnis der jeweiligen Autoren. Ansonsten müssten alle Wikipedia-Artikel mit Zitaten und deren Quellenangaben so gespickt sein, dass sie dann nicht mehr lesbar wären. Außerdem kann ich deine Bedenken überhaupt nicht nachvollziehen. Der Artikel verliert durch die Ergänzungen nichts von seinem Gehalt; der theoretische Ansatz wird für den Leser allerdings besser nachvollziehbar, und man beugt Missverständnissen, wie sie bei dir scheinbar auftreten, vor. Wenn du Probleme mit meinen Formulierungen hast, kann man da ja drüber reden, aber inhaltlich hast du meinen Ergänzungen bisher nichts entgegensetzen können. Du trittst hier nur als Blockierer auf ohne erkennbaren Willen zur konstruktiven Arbeit, z.B:
Die komplette "i.i.d.-Diskussion" ist völlig absurd, denn im i.i.d.-Postulat stecken ja die ganzen Vereinfachungen, welche ich explizit im Artikel begründen möchte, schon drin. Also, was soll das? --62.180.196.26 20:56, 11. Jun. 2007 (CEST)Beantworten
Ist Deine Begründung des i.i.d. Postulats die einzig Mögliche? --NeoUrfahraner 23:08, 11. Jun. 2007 (CEST)Beantworten
Allerdings, weil es hier um die Begründung geht, warum man Modell 1 (reale Bedingungen) durch Modell 2 (idealisierte Bedingungen) ersetzen darf ohne einen allzu großen mathematischen Fehler zu machen. --62.180.196.83 19:51, 12. Jun. 2007 (CEST)Beantworten
Nun, ich gab am 5.6.2007, 22:21 eine andere Begründung, nämlich Geburtstage sind i.i.d. weil Schwangerschaften (nur Tag und Monat betrachtet, Jahreszahl vernachlässigt) i.i.d. sind. --NeoUrfahraner 10:24, 13. Jun. 2007 (CEST)Beantworten
Diese i.i.d.-Diskussion bringt bisher überhaupt keinen Erkenntnisgewinn. Weder kann damit das Modell 1 in Frage gestellt werden noch liefert es Argumente für Modell 2. Es ist eine rein formale Diskussion ohne inhaltliche Relevanz. Was meinst du denn konkret damit:"Geburtstage sind i.i.d. weil Schwangerschaften (nur Tag und Monat betrachtet, Jahreszahl vernachlässigt) i.i.d. sind"? --62.180.196.68 15:01, 13. Jun. 2007 (CEST)Beantworten
Doch, es liefert Argumente für Modell 2. Was ich damit meine, habe ich schon am 5.6.2007, 22:21 erklärt. Wenn Du eine fixe Menge von Mädchen hernimmst (z.B. 100 Stück) und nach ein paar Jahren die Geburtstage der Erstgeborenen ansiehst, so sind diese Daten i.i.d., also wenn das erste Mädchen ihre erstes Kind am 13. Juni gebiert, so ändert sich die Wahrscheinlichkeit nicht, dass das zweite Mädchen beispielsweise ihr erstes Kind am 12. Juni gebiert. Dieses Experiment kannst Du beliebig oft wiederholen und meine Aussage ist, dass sich die Geburtstage nicht statistisch signifikant von i.i.d. Realisierungen einer Zufallsgröße auf der Menge {1.Jan ... 31.Dez} unterscheinden. --NeoUrfahraner 16:24, 13. Jun. 2007 (CEST)Beantworten
Aus welcher Grundgesamtheit (Alter, Kultur, ehelicher Stand usw.) stammen deine Mädchen eigentlich? Wie sind ihre Monatszyklen verteilt und wie ist das Sexleben mit ihren Männern beschaffen? Haben alle den gleichen Kinderwunsch, vielleicht sogar zur gleichen (Jahres-)Zeit? Du versuchst hier etwas zu beweisen, was du schon in bestimmte Voraussetzungen hineinstecken musst: dass nämlich all diese Bedingungen zusammengenommen schon "i.i.d." sind. Da beißt sich die Katze in den Schwanz (aus i.i.d. folgt i.i.d.), oder wie ich weiter oben (23:39, 5. Juni) schon bemerkt habe:"...bleibst du in einem logischen Zirkel gefangen". --62.180.196.18 22:10, 14. Jun. 2007 (CEST)Beantworten
Also wenn ich alle die Details weiß, brauche ich keine Wahrscheinlichkeitsrechnung - dann ist es ja schon fast deterministisch. Ich vermute immer mehr, dass Du nicht über die Laplacesche Wahrscheinlichkeitsauffassung hinausgekommen bist. --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)Beantworten
Du verwechselst Wahrscheinlichkeitsrechnung mit Statistik. Das sind zwei verschiedene Paar Stiefel. Für erstere werden die Grundgesamtheiten immer als bekannt vorausgesetzt (Münze mit zwei Seiten, Würfel mit 6 Seiten, Urnen mit Mischungen von Kugeln usw.). Bei zweiterer werden vorwiegend unbekannte Grundgesamtheiten mittels Stichproben auf ihre Zusammensetzung untersucht. Dabei müssen Fehler berücksichtigt und/oder Schätzungen vorgenommen werden. Dies ist beim Geburtstagsproblem nicht erforderlich, weswegen dieses Problem zu Ersterer gehört. Das hat nichts mit einer bestimmten Wahrscheinlichkeitsauffassung zu tun. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)Beantworten
Ob ich etwas verwechsle, ist egal. Was vielmehr zählt, ist die Literatur zum Geburtstagsproblem, und die setzt eben keine bekannte Grundgesamtheit voraus. --NeoUrfahraner 20:18, 17. Jun. 2007 (CEST)Beantworten
Außerdem: es gibt keine "Theorie des Geburtstagsproblems", die irgendwo festgeschrieben sein könnte. Es gibt aber eine Wahrscheinlichkeitstheorie und es gibt das Geburtstagsproblem, welches mithilfe jener gelöst werden kann. Die Wahrscheinlichkeitstheorie bietet verschiedene Modelle an für unterschiedliche Problemstellungen. Und hier geht es darum, die passenden Modelle vorzustellen und zu begründen, warum man sich für eines dieser Modelle entscheidet. Das hat nichts mit Theoriefindung zu tun, und einer Literaturangabe bedarf es deshalb auch nicht. Ein Einwand gegen meine Ergänzungen wären nur dann legitim, wenn diese mathematisch nicht korrekt wären. --62.180.196.10 16:09, 10. Jun. 2007 (CEST)Beantworten

Noch zur hypergeometrischen Verteilung: genausogut wie Du (grundlos) annimmst, dass die 23 Personen Stichprobe aus einer einzigen Grundgesamtheit sind, kann ich behaupten, dass die eine Fußballmanschaft aus einer Grundgesamtheit und die anderen Fußballmannschaft aus einer anderen Grundgesamtheit und der Schiedsrichter aus einer dritten Grundgesamtheit kommen. Dann hilft Dir die hypergeometrischen Verteilung auch nichts, sondern die Sache wird komplizierter. Vielleicht sind auch alle 23 Personen aus 23 Grundgesamtheiten (die erst aus Aachen, die zweite aus Bonn, ...), dann hat man immerhin unabhängige, wenn auch nicht identische Verteilungen. Solange also nichts konkret darüber gesagt wird, wie die 23 Personen ausgewählt wurden, gibt es keinen Grund, die hypergeometrische Verteilung im Artikel zu erwähnen. --NeoUrfahraner 16:35, 13. Jun. 2007 (CEST)Beantworten

Grade auch wenn die Grundgesamtheiten verschieden sein könnten, macht es Sinn, die hypergeometrische Verteilung im Artikel zu erwähnen. Denn mit ihr kann eine sinnvolle Betrachtung des Problems durchgeführt werden. Man kann z.B. die betreffenden Grundgesamtheiten zusammenfassen, oder die einzelnen Grundgesamtheiten nacheinander für sich betrachten. Wenn z.B. die einzelnen der 23 Grundgesamtheiten aus Personen bestehen, die am selben Tag Geburtstag haben, wobei in jeder Grundgesamtheit ein anderer gemeinsamer Geburtstag gefeiert wird, dann versagt Modell 2 wieder einmal, während Modell 1 das korrekte Ergebnis liefert, nämlich für 23 Personen, wobei je eine aus einer dieser Grundgesamtheiten stammt.
Dass die Geburtstage gleichwahrscheinlich und unabhängig verteilt sind, ist eine Forderung an die Wahrscheinlichkeitsverteilung bzw. Voraussetzung für die Anwendbarkeit von Modell 2. Aber umgekehrt darfst du nicht aus dem Modell 2 folgern , dass die Wirklichkeit so ist. Das wäre dann ein Fall für die Statistik. Also bitte nicht immer wieder Voraussetzung und Schlussfolgerung verwechseln bzw. tautologisch argumentieren. --62.180.196.18 22:10, 14. Jun. 2007 (CEST)Beantworten
Klar, Modell 2 ist ein Modell, so wie Modell 1 ein Modell ist. Auch Modell 1 ist nicht die Wirklichkeit. --NeoUrfahraner 22:43, 14. Jun. 2007 (CEST)Beantworten
Modell 1 berücksichtigt die reale Zusammensetzung der Grundgesamtheit und liefert deswegen immer korrekte Werte, während Modell 2 Annahmen macht, die so im Allgemeinen nicht richtig sein müssen und ist deswegen nicht immer korrekt. --62.180.196.41 19:17, 17. Jun. 2007 (CEST)Beantworten
Anscheinend glaubst Du wirklich, Modell 1 ist die Wirklichkeit. Wie aber schon mehrmals gesagt, die Literatur verwendet nicht Modell 1. Siehe Scherben 08:44, 9. Jun. 2007: Wenn sich Modell 1 in der Literatur durchgesetzt hat, wird auch der Artikel abgeändert. --NeoUrfahraner

Programmierbeispiel

Man sollte das Programmierbeispiel nicht in C sondern in einer leichter lesbaren Sprache oder in Pseudocode schreiben. Alleins schon die Zeilenumbrüche "\n" oder die "double"-Variable verstehen viele Leute nicht. 141.70.124.103 16:37, 1. Jul. 2007 (CEST)Beantworten

Mathematische Herleitungen

Zitat:"Im Folgenden wird der 29. Februar vernachlässigt und angenommen, dass die Geburtstage der Personen unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung auf der 365-elementigen Menge sind." Warum? --172.181.142.171 20:36, 18. Jul. 2007 (CEST)Beantworten

Warum der 29. Februar vernachlässigt wird? Weil der 29. Feb. die Herleitung komplizierter macht, aber am Ergebnis nicht viel ändert. --NeoUrfahraner 07:10, 19. Jul. 2007 (CEST)Beantworten