Wikipedia:Wikipedistik/Wachstumsprognose

Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 28. April 2010 um 21:46 Uhr durch Stefan040780 (Diskussion | Beiträge) (Berechnungen auf Grundlage der Wikipedia:Meilensteine). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Heute ist der 15.05.2025 und in der deutschsprachigen Wikipedia gibt es 3.015.094 Artikel.
Über Wikipedia

Bisherige Entwicklung der Artikelzahl seit 2004

Seit etwa März 2004 wächst die deutschsprachige Wikipedia linear mit durchschnittlich 400 neuen Artikeln pro Tag (Quelle: Daten aus Erik Zachtes Wikistat (bis April 2004) sowie Wikipedia:Meilensteine). Der Korrelationskoeffizent R2 liegt über 0,99. Betrachtet man die Zeit von April bis Oktober 2005, so ist das Wachstum mit etwa 457 neuen Artikeln pro Tag wieder etwas stärker, allerdings ist das Wachstum geringfügigen Schwankungen unterworfen. Ob die deutschsprachige Wikipedia vollständig in eine Phase linearen Wachstums übergegangen ist oder der eher lineare Verlauf Teil eines Übergangs in ein anderes Wachstumsverhalten ist, kann nur vermutet werden. Im ersten Quartal 2006 ist jedenfalls ein Anstieg des täglichen Artikelzuwachses auf knapp 500 auszumachen, betrachtet man nur die letzten Februarwochen/Anfang März, ergibt sich sogar ein Tagesschnitt von 520 für diese 30 Tage.

Entwicklung 2006

 
Wachstumskurve der deutschsprachigen Wikipedia Wachstumskurven aller Sprachen im Vergleich
 
Neue Artikel in der Wikipedia; Zahlen erfasst am Vormittag des jeweiligen Folgetages
  • In den ersten zwölf Junitagen wuchs die deutschsprachige Wikipedia täglich um durchschnittlich 553,84 Artikel (*
  • In den letzten 30 Tagen (Stand: 28. Juni, 14:12 Uhr) wuchs die dtspr. Wikipedia um täglich durchschnittlich 539,50 Artikel(**
  • Mit Stand vom 4. Juni 2006 wuchs die deutschsprachige Wikipedia im Jahr 2006 täglich um durchschnittlich 488,84 Artikel (***

Diese Zahlen lassen ein deutliches Ansteigen des täglichen Artikelzuwachses erkennen. Es kann jedoch nicht ausgeschlossen werden, dass es sich bei den stark erhöhten Zuwächsen der letzten Wochen nur um vorübergehende Ausreißer handelt, wie es sie immer wieder gibt. So war zwischen Mitte November und Ende Dezember 2005 eine deutliche Delle nach unten in der dt. WP-Wachstumskurve auszumachen, was den "15.000-Artikel-erreich-Dauer-Durchschnitt" (laut Meilensteine) um über 100 Artikel täglich sinken ließ. Seither setzt sich das Wachstum in dem Maße fort, wie es bereits auch in den Monaten vor November 2005 stattgefunden hat, nämlich 10 bis 11 Tage für 5000 Artikel. Geht man von einem leichten Wachstum aus, was anhand der aktuellen März-Zahlen sicher nicht fehl am Platz ist, kann man behaupten, dass für das restliche Jahr durchschnittlich 10 Tage für 5000 Artikel benötigt werden, da gegen Jahresende die Dauer laut aktuellen Zahlen vermutlich zwischen 9 und 10 Tagen betragen wird, was die derzeitige Spanne von 10 bis 11 Tagen ausgleichen dürfte. Das sind natürlich nur Spekulationen, die jedoch nicht allzu weit von der Realität abschweifen können, sofern keine außerordentlichen Ereignisse statt finden, was den täglichen Artikelzuwachs betrifft.

Am 31. Dezember 2006 23:59:59 (MEZ) waren in der deutschsprachigen Wikipedia 520.181 Artikel registriert. (Siehe auch: Wikipedia:Wette für 2006)

(* laut Spezial:Newpages 1.6. 0 h bis 12.6. 24 h; minutiös genaue Abgrenzung; nachträgliche Löschungen (nach 13.6., 11:35 Uhr) nicht berücksichtigt;
(** Laut Spezial:Newpages 16.185 neue Artikel zwischen 29.5., 14:12 h und 28.6., 14:12 h, divid. durch 30 Tage
(*** Berechnung aus Wikipedia:Meilensteine

Berechnungen auf Grundlage der Wikipedia:Meilensteine

Da die Wikipedia:Statistik derzeit noch auf dem Stand von Februar 2008 ist, hier eine Ableitung zur aktuellen Artikelzuwachsentwicklung aus den Wikipedia:Meilensteinen.

Die Liste gibt die Anzahl der Tage wieder, die für 5.000 neue Artikel benötigt werden. Die Liste beginnt bei 10.000. Der Tagesdurchschnitt des Artikelzuwachses wird anhand der Zeitspanne berechnet, die für den Zuwachs der jeweils letzten 15.000 Artikel benötigt wurden. Diese, 3 Meilensteine übergreifende Zeitspanne, soll eine glaubwürdigere Vergleichbarkeit der Werte ermöglichen, womit Tendenzen besser erkannt werden können. Die Angaben erfolgen in Tausend:

 
Zahl der täglich neu erstellten Artikel in dewiki
 
Neue Artikel pro Tag


Von
(in Tsd.)
Auf
(in Tsd.)
Tage Datum Ø tägl. Zuwachs Bemerkung
10 15 107 11.05.2003
15 20 54 04.07.2003
20 25 23 27.07.2003 tgl. Zuwachs der letzten 3 Meilensteine (gleitender Durchschnitt: 82)
25 30 51 16.09.2003 117
30 35 48 03.11.2003 122
35 40 34 07.12.2003 113
40 45 33 09.01.2004 130
45 50 30 08.02.2004 155
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 0-50 Tsd. Artikel: 51
50 55 19 27.02.2004 183 Sendung Tagesthemen am 25.02.2004
55 60 11 07.03.2004 250
60 65 08 15.03.2004 395
65 70 12 27.03.2004 484
70 75 11 07.04.2004 484
75 80 12 19.04.2004 429
80 85 13 02.05.2004 417
85 90 14 16.05.2004 385
90 95 15 01.06.2004 357
95 100 12 13.06.2004 369
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 50-100 Tsd. Artikel: 400
100 105 11 24.06.2004 395
105 110 12 06.07.2004 429
110 115 10 16.07.2004 455
115 120 10 26.07.2004 469
120 125 14 09.08.2004 441
125 130 14 23.08.2004 395
130 135 10 02.09.2004 395
135 140 11 13.09.2004 429
140 145 12 25.09.2004 455
145 150 13 08.10.2004 417
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 100-150 Tsd. Artikel: 435
150 155 12 20.10.2004 405
155 160 14 03.11.2004 385
160 165 12 15.11.2004 395
165 170 11 26.11.2004 405
170 175 12 08.12.2004 429
175 180 13 21.12.2004 417
180 185 17 06.01.2005 357
185 190 15 21.01.2005 333
190 195 12 02.02.2005 341
195 200 13 15.02.2005 375
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 150-200 Tsd. Artikel: 394
200 205 15 02.03.2005 375
205 210 14 16.03.2005 357
210 215 17 02.04.2005 326
215 220 15 17.04.2005 326
220 225 13 30.04.2005 333
225 230 13 13.05.2005 366
230 235 11 24.05.2005 405
235 240 11 04.06.2005 429
240 245 12 16.06.2005 441
245 250 12 28.06.2005 429
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 200-250 Tsd. Artikel: 376
250 255 10 08.07.2005 441
255 260 11 19.07.2005 455
260 265 09 28.07.2005 500
265 270 10 07.08.2005 500
270 275 08 15.08.2005 556
275 280 10 25.08.2005 536
280 285 11 05.09.2005 517
285 290 12 17.09.2005 455
290 295 11 28.09.2005 441
295 300 09 07.10.2005 469
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 250-300 Tsd. Artikel: 505
300 305 10 17.10.2005 500
305 310 10 27.10.2005 517
310 315 11 07.11.2005 484
315 320 13 20.11.2005 441
320 325 18 08.12.2005 357
325 330 12 20.12.2005 349
330 335 13 02.01.2006 349
335 340 10 12.01.2006 429
340 345 11 23.01.2006 441
345 350 10 02.02.2006 484
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 300-350 Tsd. Artikel: 435
350 355 10 12.02.2006 484
355 360 11 23.02.2006 484
360 365 10 05.03.2006 484
365 370 09 14.03.2006 500
370 375 11 25.03.2006 500
375 380 10 04.04.2006 500
380 385 11 15.04.2006 469
385 390 11 26.04.2006 469
390 395 11 07.05.2006 455
395 400 11 18.05.2006 455
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 350-400 Tsd. Artikel: 472
400 405 09 27.05.2006 484
405 410 08 04.06.2006 536
410 415 09 13.06.2006 577
415 420 10 23.06.2006 555
420 425 12 05.07.2006 484
425 430 09 14.07.2006 484
430 435 10 24.07.2006 484
435 440 09 02.08.2006 536
440 445 09 11.08.2006 536
445 450 07 18.08.2006 600
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 400-450 Tsd. Artikel: 556
450 455 09 27.08.2006 600
455 460 08 04.09.2006 625
460 465 09 13.09.2006 576
465 470 10 23.09.2006 555
470 475 11 04.10.2006 500
475 480 10 14.10.2006 484
480 485 10 24.10.2006 484
485 490 10 03.11.2006 500
490 495 09 12.11.2006 517
495 500 11 23.11.2006 500
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 450-500 Tsd. Artikel: 526
500 505 10 03.12.2006 500
505 510 08 11.12.2006 517
510 515 10 21.12.2006 536
515 520 10 31.12.2006 536
520 525 09 09.01.2007 517
525 530 10 19.01.2007 517
530 535 10 29.01.2007 517
535 540 11 09.02.2007 484
540 545 10 19.02.2007 484
545 550 10 01.03.2007 484
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 500-550 Tsd. Artikel: 510
550 555 10 11.03.2007 500
555 560 10 21.03.2007 500
560 565 11 01.04.2007 484
565 570 11 12.04.2007 469
570 575 12 24.04.2007 441
575 580 11 05.05.2007 441
580 585 11 16.05.2007 441
585 590 11 27.05.2007 455
590 595 11 07.06.2007 455
595 600 11 18.06.2007 455
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 550-600 Tsd. Artikel: 467
600 605 13 01.07.2007 429
605 610 12 13.07.2007 417
610 615 12 25.07.2007 405
615 620 12 06.08.2007 417
620 625 11 17.08.2007 429
625 630 11 28.08.2007 441
630 635 11 08.09.2007 455
635 640 08 16.09.2007 500
640 645 12 28.09.2007 484
645 650 11 09.10.2007 484
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 600-650 Tsd. Artikel: 450
650 655 12 21.10.2007 429
655 660 11 02.11.2007 484
660 665 12 14.11.2007 429
665 670 12 26.11.2007 429
670 675 12 08.12.2007 417
675 680 12 20.12.2007 417
680 685 10 30.12.2007 441
685 690 10 09.01.2008 469
690 695 11 20.01.2008 484
695 700 10 30.01.2008 484
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 650-700 Tsd. Artikel: 450
700 705 10 09.02.2008 484
705 710 09 18.02.2008 517
710 715 10 28.02.2008 517
715 720 10 09.03.2008 517
720 725 10 19.03.2008 500
725 730 10 29.03.2008 500
730 735 13 11.04.2008 455
735 740 12 23.04.2008 429
740 745 11 04.05.2008 417
745 750 13 17.05.2008 417
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 700-750 Tsd. Artikel: 467
750 755 11 28.05.2008 429
755 760 13 10.06.2008 405
760 765 12 22.06.2008 417
765 770 11 03.07.2008 417
770 775 12 15.07.2008 429
775 780 11 26.07.2008 441
780 785 10 05.08.2008 455 Artikelmarathon August 2008
785 790 10 15.08.2008 484
790 795 10 25.08.2008 500
795 800 12 06.09.2008 469
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 750-800 Tsd. Artikel: 459
800 805 13 19.09.2008 429
805 810 16 05.10.2008 366
810 815 13 18.10.2008 357
815 820 13 31.10.2008 357
820 825 12 12.11.2008 395
825 830 12 24.11.2008 405
830 835 14 08.12.2008 395
835 840 13 21.12.2008 385
840 845 10 31.12.2008 405 Weihnachtsmarathon 2008
845 850 10 10.01.2009 455
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 800-850 Tsd. Artikel: 403
850 855 11 21.01.2009 484
855 860 11 01.02.2009 469
860 865 12 13.02.2009 441
865 870 10 23.02.2009 455
870 875 10 05.03.2009 469
875 880 11 16.03.2009 484
880 885 12 28.03.2009 455
885 890 13 10.04.2009 417
890 895 12 22.04.2009 405
895 900 12 04.05.2009 405
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 850-900 Tsd. Artikel: 439
900 905 12 16.05.2009 417
905 910 13 29.05.2009 405
910 915 09 07.06.2009 441 Artikelmarathon Mai 2009
915 920 12 19.06.2009 441
920 925 13 02.07.2009 441
925 930 12 14.07.2009 405
930 935 13 27.07.2009 395
935 940 12 08.08.2009 405
940 945 13 21.08.2009 395
945 950 12 02.09.2009 405
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 900-950 Tsd. Artikel: 424
950 955 11 13.09.2009 417
955 960 13 26.09.2009 417
960 965 13 09.10.2009 405
965 970 12 21.10.2009 395
970 975 11 01.11.2009 417
975 980 13 14.11.2009 417
980 985 13 27.11.2009 405
985 990 12 09.12.2009 395
990 995 09 18.12.2009 441 Weihnachtsmarathon 2009
995 1000 09 27.12.2009 500
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 950-1000 Tsd. Artikel: 435
1000 1005 08 04.01.2010 577
1005 1010 10 14.01.2010 556
1010 1015 10 24.01.2010 536
1015 1020 10 03.02.2010 500
1020 1025 10 13.02.2010 500
1025 1030 11 24.02.2010 484
1030 1035 11 07.03.2010 469
1035 1040 10 17.03.2010 469
1040 1045 11 28.03.2010 469
1045 1050 10 07.04.2010 484
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 1000-1050 Tsd. Artikel: 495
1050 1055 11 18.04.2010 469
1055 1060 10 28.04.2010 484
1060 1065
1065 1070
1070 1075
1075 1080
1080 1085
1085 1090
1090 1095
1095 1100
Durchschnittlicher täglicher Artikelzuwachs im Bereich von 1050-1100 Tsd. Artikel:

Hinweis: Über die Sortierung der Spalte "Von(in Tsd.)" werden die Zwischenüberschriften mit dem tägl. Artiklzuwachs im 50.000 Intervall untereinander dargestellt.

Durchschnittliche Tageszuwächse je Monat

2006:

  • der durchschnittliche, tägliche Artikelzuwachs im Januar: 501,24
  • der durchschnittliche, tägliche Artikelzuwachs im Februar: 482,14
  • der durchschnittliche, tägliche Artikelzuwachs im März (hier: exakte Berechnung*): 597,67
  • der durchschnittliche, tägliche Artikelzuwachs im April: 454,67
  • der durchschnittliche, tägliche Artikelzuwachs im Mai: 505,97
  • der durchschnittliche, tägliche Artikelzuwachs im Juni: 597,24
  • der durchschnittliche, tägliche Artikelzuwachs im Juli: 521,68
  • der durchschnittliche, tägliche Artikelzuwachs im August: 600,35
  • der durchschnittliche, tägliche Artikelzuwachs im September: 522,73
  • der durchschnittliche, tägliche Artikelzuwachs im Oktober: 497,94
  • der durchschnittliche, tägliche Artikelzuwachs im November: 500
  • der durchschnittliche, tägliche Artikelzuwachs im Dezember: 532,26

Der durchschnittliche, tägliche Artikelzuwachs im Jahr 2006 lag bei 507,805.

2007:

  • der durchschnittliche, tägliche Artikelzuwachs im Januar: 513,19
  • der durchschnittliche, tägliche Artikelzuwachs im Februar: 485,39


Erläuterungen zur Berechnung und Genauigkeit der Zahlen: Aus den Zeitspannen, die für je 5000 Artikel benötigt werden, lässt sich durch Abgrenzung (5000 Artikel, die in einer Zeitspanne, die 2 Monate übergreift, der Wikipedia zuwachsen, werden rechnerisch auf den jeweiligen Monat umgerechnet. Am Beispiel 23.2.2006 bis 5.3.2006 bedeutet das, dass die 5000 Artikel durch die 10 Tage dividiert werden, und dann auf die beiden Monate je nach Anzahl der Tage, umgerechnet werden. Das sind in diesem Beispiel jeweils 5 Tage - bedeutet also 2500 Artikel entfallen auf jeden der beiden Monate, was diese Zeitspanne betrifft. Zu diesen abgegrenzten Zahlen werden dann noch die "eindeutigen" Zahlen (Zahlen, die nicht auf 2 Monate aufgeteilt werden müssen) hinzugezählt. In unserem Beispielmonat Februar ergibt dies 1000 (rechnerisch abgegrenzte) Artikel aus der Zeitspanne 23.1.2006 bis 2.2.2006 + 10.000 Artikel aus der Zeitspanne 2.2. bis 23.2. + 2500 (rechnerisch abgegrenzte) Artikel aus der Zeitspanne 23.2. bis 5.3. = 13.500 Artikel im Februar. Diese Zahl wird dann durch die Anzahl der Tage des Monats dividiert. In diesem Beispiel 28. Ergibt 482,14

Dass diese Zahl natürlich in einem gewissen, geringen Ausmaß von der tatsächlichen Zahl abweicht, die man erlangen würde, hätte man exakte Zahlen zu jedem einzigen Tag, ist natürlich klar. Schon wesentlich exakter wären die Ergebnisse, würde man nicht nach Monaten, sondern nach Meilenstein-Zeitspannen umrechnen. Hier wäre dann die einzige Ungenauigkeitsquelle diese, dass die Tageszeit, zu der der jeweilige Meilenstein erreicht wurde, nicht bekannt ist, und in Extremfällen die Summe um mehrere Hundert Artikel pro Monat vom errechneten Wert abweichen kann, was sich auf den Tagesdurschnitt durchaus mit bis zu 20 Artikeln auswirkt. Diese "Tageszeit-Ungenauigkeit" trifft natürlich auch auf die Monatsabgrenzungen zu, wobei hier noch die "Tages-Ungenauigkeit" hinzukommt, da die täglichen Zuwachszahlen auch einer gewissen Schwankung unterliegen, diese jedoch bei der "Monatszuwachsberechnung laut Meilensteinen" auf die gesamte Zeitspanne verteilt werden, was das Ergebnis wiederum merkbar verfälschen kann.

Überdies gibt es seit Einführung der Sommerzeit zwei Monate als Ausreißer mit je einem Tag mit 23 (März) bzw. einen mit 25 Stunden (früher September, nun Oktober), was die Statistik weiter verfälscht (will man nicht gleich in UTC umrechnen).

Daraus lernen wir: die folgenden Zahlen sind (leider nur) mit äußerster Vorsicht zu genießen, da theoretisch Abweichungen im mittleren, zweistelligen Bereich möglich wären. Das Ganze wird natürlich dadurch etwas relativiert, da diese Ungenauigkeit auf jeden Monat in gleichem Maße zutrifft und vor allem, da die tatsächlichen täglichen Schwankungen in Wahrheit vergleichsweise äußerst gering sind, meist zwischen 10 und 30%, wodurch sich die Zahlen der "5000er-Zeitspannen", die ja meist um die 10 Tage betragen, in der Regel nur noch kaum unterscheiden (können). Sprich: Ist eine Tendenz erkennbar, so stimmt diese auch tatsächlich, da die rechnerische Abgrenzung auf zwei Monate in einem Vergleichszeitraum von mehreren Monaten relativiert wird. Lediglich die exakten Zahlen sind nur als Richtwerte anzusehen. Denn logischerweise werden die Zahlen immer genauer, je länger der Rechenzeitraum ist. Also wäre für das ganze Jahr 2006 die Abweichung vom tatsächlichen Wert verschwindend gering. Ich würde behaupten ein paar 100 (da Ungenauigkeiten lediglich bei den abgegrenzten Zahlen aus den Zeitspannen, die die Jahreswechsel übergreifen, auftreten können und aufgrund der relativ gleichmäßigen Artikelzuwachsrate nicht höher als ein paar 100 sein können) dividiert durch den Artikelzuwachs in 365 Tagen, der locker über 100.000 sein wird, gehen wir mal von 120.000 aus, was sich dann auf den Tagesdurchschnitt nicht mal im Ausmaß von 0,01 (nämlich 0,004 laut diesem Beispiel) auswirken würde.

Diese Zahlen sind daher lediglich als Orientierungshilfe anzusehen, werden aber umso genauer, je länger die Berechnungszeiträume sind. Die monatlichen Abweichungen vom tatsächlichen Tagesdurchschnittzuwachs dürften in einer Abweichungsspanne von 3 bis 7 Artikeln/Tag liegen (wenn man von den üblichen täglichen Artikelzuwachsschwankungen ausgeht).

* Berechnung laut Angabe in Spezial:Newpages mit exaktem Berechnungszeitraum 1. März, 0 Uhr bis 6. März, 23:59 Uhr = 3.586 neue Artikel (Löschungen nach 6. März, 23:59 Uhr, nicht berücksichtigt)

Lineares Wachstum

Zwischen April 2004 und der Wikipedia-Konferenz hatten wir ein relativ konstantes lineares Wachstum von durchschnittlich 350 bis 400 neuen Artikeln pro Tag. Seither sind es rund 500 täglich. In den Monaten Februar bis April 2004 wuchs die deutschsprachige Wikipedia kurzzeitig exponentiell mit einer durchschnittlichen Wachstumsrate von bis zu 1 %, die von da an wieder abnahm.

Zwischen Mitte Mai und Mitte September 2006 erlebte die deutschsprachige Wikipedia ein besonders starkes Wachstum - mit Ausnahme der letzten Juni- und der ersten Juliwoche. Im eingangs erwähnten Zeitrahmen mit etwas über 550 neuen Artikeln täglich. Abgesehen von diesem Ausreißer nach oben, an manchen Tagen wurden über 600 Artikel eingestellt, pendelt die Zuwachsrate seit Januar 2006 zwischen 417 und 517 Artikeln täglich - zuletzt (seit April 2008) meist weniger als 455 Artikel täglich.

Mit zunehmender Größe der Wikipedia ist zu erwarten, dass das relative Wachstum weiter abnimmt, selbst bei leichten Anstiegen der absoluten Anzahl täglich neuer Artikel.

Mit den folgenden PHP-Formeln können die prognostizierten Termine für das Erreichen bestimmter Artikelanzahlen bei linearem und exponentiellem Wachstum ermittelt werden:

  • date('d.m.Y', strtotime(date('Y-m-d', time()).' + '.floor(($milestone-$articles_now)/$abs_increase).' days'));
  • date('d.m.Y', strtotime(date('Y-m-d', time()).' + '.floor(log($milestone/$articles_now)/log($rel_increase)).' days'));

wobei die Variablen folgende Bedeutung haben:

  • $articles_now: aktuelle Artikelanzahl (in der Tabelle: 312805; November 2005 ????)
  • $abs_increase: absoluter Zuwachs pro Tag (in der Tabelle: 400)
  • $rel_increase: relativer Zuwachs pro Tag (in der Tabelle: 1.0014)
  • $milestone: zu erreichende Artikelanzahl
Anzahl Prognose bei 400 täglich Prognose bei 440 täglich Prognose bei 500 täglich Prognose bei 515 täglich Prognose bei 0,13 % täglich erreicht am
750.000 17.05.2008 18.05.2008 20.10.2007 2.10.2007 17.05.2008
800.000 9.09.2008 06.09.2008 06.09.2008
900.000 5.05.2009 28.04.2009 25.04.2009 24.04.2009 04.05.2009
1.000.000 11.01.2010 8.12.2009 22.10.2009 16.10.2009 27.12.2009

Stand der Aktualisierung der Tabelle: 10.April 2009, 890.090 Artikel(absolut),8. Februar 2007, 539.300 Artikel(relativ)

Siehe auch: Prognose zum 2.000.000 Artikel anhand der aktuellen Zahlen auf dem Toolserver

Die meisten Wachstumskurven haben einen s-förmigen Verlauf. Sollte dies auch auf die Wikipedia zutreffen, so befinden wir uns zur Zeit in der Wachstumsphase und in diesem Bereich eines Wachstumprozesses ist der Kurvenverlauf fast linear. Doch auch bei Wikipedia wird eine Sättigung eintreten und der Kurvenverlauf sich abflachen. Der Volksmund sagt: "Die Bäume wachsen nicht in den Himmel!"

Es ist jedoch weniger damit zu rechnen, dass es mit der Wikipedia "bergab" geht. Höchstens das Wachstum wird prozentual oder vielleicht auch mal absolut schwächer werden: es geht dann höchstens nicht mehr ganz so steil bergan und wegen der Menge irgendwann nur noch unmerklich.

Wenn wirklich Artikel absolut gesehen weniger werden sollten, dann trifft das wohl erst in einer ziemlich fernen Zukunft ein, in einer Qualitätsbildungs-, Konsolidierungs- und Bereinigungsphase. Wenn es dann zahlenmäßig bergab geht, dann geht es aber qualitativ bergauf. Um bei der Bergsteigersprache zu bleiben: der Gipfel ist dann evtl. nicht mehr höher, den wir erklimmen, aber der Schwierigkeitsgrad/Anspruch steigt.

Richtigkeit der Prognosen zur Erreichung der 500.000-Artikel-Marke

Prognose vom 24. Oktober 2006:[1] Die Prognose, dass die Wikipedia 500.000 Artikel am 23. November 2006 erreiche, wurde am 24. Oktober 2006 gemacht. Zu einem Zeitpunkt, als die Wikipedia 485.000 Artikel erreichte. Die exponentielle (tgl. 0,14 %) ging vom 15. November aus. Die Prognose, die von 400 Artikeln täglich ausging, lag mit dem 1. Dezember um rund eine Woche daneben.

Prognose vom 6. September 2006: [2]
Die Prognose vom 6. September, die bei einem Artikelstand von 461.500 getroffen wurde, prophezeite das Erreichen der 500.000-Artikel-Marke für den 22. November 2006, also nur einen Tag zuvor, als es tatsächlich der Fall war. Die exponentielle (tgl. 0,14 %) ging vom 3. November aus. Die Prognose, die von 400 Artikeln täglich ausging, lag mit dem 12. Dezember deutlich daneben.

Noch ältere Prognosen lagen immer deutlicher daneben, wobei jene Prognose, die von 500 Artikeln täglich ausging, immer am nähesten war. So wurde mit Zahlen vom 18. August auf den 27. November 2006 für die Erreichung der 500.000-Artikel-Marke getippt.

Analysierend kann man feststellen, dass kein exponentielles Wachstum in Höhe von 0,14 % gegeben ist. Da die 500-Artikel-pro-Tag-Prognose mit zunehmender Entfernung des Prognosedatums ebenfalls immer unkorrekter wird, ist davon auszugehen, dass entweder ein exponentielles Wachstum in anderer Höhe als 0,14 % vorliegt, oder täglich durchschnittlich eine Anzahl von etwas mehr als 500 Artikeln verfasst wird - etwa 505 bis 510. Weitere Prognosen sollten diese Erkenntnisse zu Grunde legen, damit sich erweisen kann, ob und wie sich das Wachstum der Wikipedia anhand aktueller Gegebenheiten voraussagen lässt.

Mögliche zukünftige Entwicklungen: aktuelle Prognosen und Thesen

Neue Vermutungen, Spekulationen, Theorien, Thesen und Prognosen können hier veröffentlicht und nachvollzogen werden. Scheint sich eine zu bewahrheiten, kann sie natürlich zur „aktuellen Entwicklung“ verschoben werden, wo die Theorie dann gepflegt wird, bis sie nicht mehr aktuell ist, oder nachweislich nicht (mehr) zutrifft.


Logistisches Wachstum von de.wikipedia.org

Auf commons:User:HenkvD/Articles habe Ich das logistische Modell für en.wikipedia beschrieben. Weil aber keine aktuellen Datenbankauszüge für en.wikipedia vorhanden sind, untersuche ich in weiteren Analysen den Zustand der deutschen Wikipedia im Detail.

   
Wachstum auf de.wikipedia Selber Graph in logarithmischer Form

Hier sind 5 Statistiken zu sehen, die das Wachstum darstellen. Sollte kein einziger Benutzer beitragen, ist bei allen das Wachstum Null.

  • Neue Artikel pro Monat
  • Wachstum in Wörtern
  • Datenbankbearbeitungen pro Monat
  • Neue Wikipedianer pro Monat
  • Sehr aktive Wikipedianer

Als Erstes bemerkte ich das ungewöhnliche Wachstum im März 2004, das bei allen 5 Statistiken sichtbar ist, am deutlichsten bei 'Neue Artikel' und 'Neue Wikipedianer'. Diese Periode ist durch eine rote Ellipse auf beiden Graphen gekennzeichnet. Probably caused by a report in the newsshow "Tagesthemen" on tv at 25.2.2004.

Außerdem denke ich, dass diese Graphen Zeichen für logistisches Wachstum zeigen, am deutlichsten bei 'Neue Wikipedianer'. Die Anzahl der neuen Wikipedianer am 1.1.2008 beträgt nur 40% des Maximums (ca. 2006).

Die Wendepunkte sind wahrscheinlich in der Nähe von:

  • Sept 05 – Apr 06 für 'Neue Wikipedianer pro Monat'
  • Sept 2006 für 'Neue Artikel pro Monat'
  • Sept 2006 für 'Wachstum in Wörtern'
  • April 2007 für 'Datenbankbearbeitungen pro Monat'
  • Juni 2007 für 'Sehr aktive Wikipedianer'

Siehe auch


Abstrakte Theorien

Theorien à la „Was wäre wenn“:

Wie die deutschsprachige Wikipedia innerhalb von 10 Jahren 25 Mio. Lemmata erreichen könnte

Prognose vom 16. September 2005 für das Jahr 2010: 5 Mio. Lemma; für 2015: 25 Mio. Lemma

Die Wikipedia.de umfasst zurzeit mit etwa 500.000 Einträgen nur einen winzigen Bruchteil der sinnvollen Lemmata.

Allein das Allgemeine Lexikon der Bildenden Künstler von der Antike bis zur Gegenwart, auch Thieme-Becker genannt, umfasst in seiner aktuellen CD-Version über 280.000 Künstler. Die ersten 148.180 Künstler- sowie 15.082 versteckten Biographien wurden in den Jahren 1907 bis 1950 im wesentlichen von ca. 400 Autoren geschaffen. Der Lexikograph Hans Vollmer fügte 1953 bis 1962 noch einmal 47.229 Künstlerbiographien hinzu.

Diese Viertelmillion Einträge umfasst also von den Künstlern nicht die Komponisten und auch keine Dichter, keine Sänger, Schauspieler und Regisseure. Es gibt auch noch Tänzer, Artisten, Gedächtniskünstler, Zauberer, Kaberettisten und viele weitere kleinere Künste von Puppenspielern bis Schattenspielern. Schon die Künstler bieten Stoff für über 3 Mio. Einträge (hauptsächlich Autoren).

Wenn alle Künstler erfasst wären, wäre noch kein Erfinder, Forscher, Naturwissenschaftler, Entdecker, Mathematiker, Philosoph, Geschichtswissenschafter, die hundert größten Entwickler der Funktechnik etc., etc. erfasst.

Könige, regierende Fürsten, Politiker, Bürgermeister gibt es über die Jahrhunderte zu Hunderttausenden.

Feldherren und Militärs, die eine Rolle in der Geschichte gespielt haben, gibt es auch über Hunderttausend.

Bischöfe, Lamas, Prediger, Sektenführer, Päpste, Patriarchen und viele weitere Religionsführer haben auch Geschichte mitbestimmt, sicher finden sich in der Literatur über Hundertausend.

Abertausende haben sich um ihre Heimatgemeinden so verdient gemacht, dass Straßen nach ihnen benannt wurden oder sie zu Ehrenbürgern wurden. Allein die mehrhundertseitige über 150 Jahre alte (und damit urheberrechtsfreie) Chronologie meiner Heimatstadt mit mehrhundertjähriger Geschichte wäre Grundlage für über tausend sinnvolle Einträge. Ein pensionierter Lehrer mit Zeit, Liebe zur Geschichte, seiner Vaterstadt, der Chronologie kann nur einfach so in einem Jahr 1.000 Einträge zu unserer Stadt einstellen.

Hinzu kommt, dass weltweit neue „relevante“ Persönlichkeiten täglich in weitaus größerer Zahl entstehen, als neue Artikel entstehen, d. h. die Schere zwischen vorhandenen und potentiellen Personenartikeln öffnet sich immer weiter.

Auch warten noch einige hunderttausende Städte, Dörfer, Berge, Flüsse, Bäche weltweit sowie über 2 Millionen Tier- und Pflanzenarten auf ihren Eintrag. Es sind aber auch einige zehntausend untergegangene Siedlungsplätze wiederentdeckt, ausgegraben, erforscht und bezeichnet worden.

Wenn nur eine Million der über 100-Millionen Menschen mit Muttersprache Deutsch sich an den PC setzt und anfängt, jeden Tag eines der oben beschriebenen Lemmas einzugeben, dann (Server auf Google-Niveau vorausgesetzt) gäbe es nach einem Jahr 365 Millionen Einträge.

Für diese Zahl reichen schon die pensionierten Akademiker mit Internetanschluss und vollem Bücherregal, die es heute schon gibt.

Für 10.000 gute Bilder würde in meiner kleinen Stadt schon der Leicaclub reichen, überwiegend pensionierte Akademiker aus praktisch allen Fachrichtungen vom Arzt bis zum Chemiker.

Nur 10.000 Wiki-Freaks - Studenten, Pensionäre oder sonst Leute mit Zeit und Lust - die jeden Tag drei Einträge machen, haben in weniger als drei Jahren über 10.000.000 Einträge geschaffen.

Das „Allgemeine Lexikon der Bildenden Künstler von der Antike bis zur Gegenwart“ mit seinen über 250.000 Einträgen, das weltweit größte Lexikon dieser Art, wurde auch über zwei Weltkriege hinweg nicht aufgegeben. Dies zeigt, dass es auch im deutschsprachigen Raum Menschen gibt, die so etwas mögen und deshalb machen.

Internet und Wikipedia müssen nur in das Milieu der örtlichen Historischen Vereine, der Numismatiker, Naturfreunde, Vogelbeobachter, Technikvereine, etc. diffundieren. Ich sage in 5 Jahren mindesten 5 Mio. Einträge und in zehn Jahren mindestens 25 Mio. Einträge voraus. Das ist nur das etwa Hundertfache des Thieme-Becker.

Anmerkung, nur mal so am Rande: Wenn noch keine Stadt oder Gemeinde in Frankreich beschrieben wäre, und du würdest morgen damit anfangen und täglich ein Lemma erstellen, wärest du in etwa 100 Jahren damit fertig.

Widerlegte Thesen

Ältere Theorien, Prognosen und Thesen, die sich nachweislich nicht bewahrheitet (Blick in die Statistik) haben, werden hierher verschoben, um neuen Theorien Platz zu machen. Alte Theorien können hier nachgelesen werden.

Die deutschsprachige Wikipedia folgt der englischen Wikipedia

Inhaltliche Aktualität des Absatztextes: Ende 2004/Anfang 2005

Die deutschsprachige Wikipedia ist die Zweitgrößte[3] nach der englischen[4].

Wagen wir die Annahme, dass die Wachstumskurve von de mit dem Wachstum von en in irgendeiner Weise korreliert. Im Juni 2004 erreichte die Deutschsprachige eine Artikelzahl, die die Englische 17 Monate zuvor hatte. Dieser „zeitliche Abstand“ verringerte sich seither auf 14 Monate im September 2004 und auf 12 Monate im Dezember 2004. Sollte der Abstand von 12 Monaten konstant bleiben, wird die Deutschsprachige Wikipedia 300.000 Artikeln ca. im Juli 2005 erreichen. Der Abstand scheint sich in den letzten Monaten jedoch wieder zu vergrößern. Die englische Wikipedia scheint seit Anfang 2004 wieder exponentiell zu wachsen, während die deutschsprachige Wikipedia seit April 2004 nur noch linear wächst.

Dass die deutschsprachige Wikipedia momentan immerhin noch rund 1/3 so viele Artikel wie die englische hat und damit noch immer die zweitgrößte Sprachversion ist, ist zwar schön, aber die Tendenz ist eben schon seit Monaten fallend. Wenn es so weitergeht, hat de bald wieder nur noch 1/4 von en, dann 1/5...

Diese unterschiedlichen Wachstumsraten lassen sich verschiedenartig erklären:

  • Von allen Benutzern, die www.wikipedia.org besuchen, gehen gemäß alexa.com 63% auf en, 9% auf ja, 8% auf de, 4% auf es. Sprich, die de-Wikipedia ist noch nicht so in der Gesellschaft angekommen wie die en-Wikipedia. Jetzt, wo auch die deutschsprachigen Medien auf die Wikipedia aufmerksam werden, kann sich das jedoch bessern. Vor kurzem lag der Prozentsatz noch bei 3%. Der Abstand ist aber immer noch immens.
  • Ganz eindeutig die unerträgliche Langsamkeit von Wikipedia, die auch das reine Lesen zur Qual macht. En wird in Frankreich gecached (Squid Proxy), de läuft in Florida. Dies sorgt für große Antwortzeiten. Besserung ist eventuell mit dem von Yahoo gespendeten Serververbund zu erwarten.
  • Wikipedia hat in Deutschland inzwischen eine gute Durchdringung. En hat den Weltmarkt, mit vielen Gebieten in denen Wikipedia bis jetzt kaum bekannt ist.
 
Artikel pro Sprach-Sprecher; siehe auch Wikipedia:Wikipedistik/Soziologie/Erhebungen
  • Die englische Sprache hat mit 340 Millionen etwa 2,8 mal so viele Muttersprachler wie die deutsche Sprache (120 Millionen). Englisch hat inklusive Zweitsprachlern sogar mehr als zehnmal so viele Sprecher.
  • Deutschsprachige Wikipedia-Artikel werden laut Alexa nur rund ein Zehntel mal so oft gelesen wie die englischen.
  • Wikipedia (de) wird nicht die nötige (und ihr auch zustehende) Wertschätzung zuteil.
  • Die meisten Artikel in der de-Wikipedia sind deutlich umfangreicher und besser geschrieben als in der en-Wikipedia.
  • De besitzt ein ganz anderes Qualitätsmaß als en. So werden oft Artikel wegen fehlender Relevanz einfach wieder gelöscht. Hierbei ist die Relevanz sehr hoch angesetzt. Das bedeutet, dass viele Artikel, die in en sind, niemals in de sein werden. Auf en gilt im Wesentlichen: ein Artikel wird nur gelöscht, wenn er eine URV ist oder absoluten Schwachsinn enthält. Stubs werden nicht gelöscht, sondern mit einem „Stub“-Label versehen und bleiben, bis sie jemand erweitert. „Irrelevante“ Lemmata werden nicht gelöscht, außer sie sind wirklich nachweislich total irrelevant. Auf de dagegen werden Stubs als Ärgernisse angesehen, die man besser löscht, damit jemand anders den Artikel ganz von neu schreiben kann. Und Artikel, die die strengen „Relevanzkriterien“ nicht erfüllen, fliegen raus, auch wenn sie gut sind.

Einzelnachweise

  1. http://de.wikipedia.org/w/index.php?title=Wikipedia%3AWikipedistik%2FWachstumsprognose&diff=22968768&oldid=22636786]
  2. http://de.wikipedia.org/w/index.php?title=Wikipedia%3AWikipedistik%2FWachstumsprognose&diff=22968768&oldid=22636786
  3. http://www.phil.uni-passau.de/histhw/TutSuch/ch12s01.html
  4. http://en.wikipedia.org/wikistats/DE/PlotsPngArticlesTotal.htm