Zum Inhalt springen

Diskussion:COVID-19-Pandemie/Statistik

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 31. März 2020 um 15:13 Uhr durch Iiigel (Diskussion | Beiträge) (Welche Quelle verwenden?). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 5 Jahren von Iiigel in Abschnitt Welche Quelle verwenden?

Was soll das werden?

Hallo Eulenspiegel1, was wird das, wenn es fertig ist und vor allem, warum erwähnst Du mich und augenscheinlich auch andere in den Kommentarzeilen deiner schrittweisen Übernahme dieser Statistik? Soll ich da etwas überprüfen, korrigieren, beantworten oder was anderes für dich tun? Die zwei Original-Edits in deren Zusammenhang Du mich erwähnt hast, sind ja schon vor rund 3 Wochen passiert. Im Übrigen versehe ich nicht, warum Du dir so viel Mühe machst/gemacht hast. Statt mühselig jeden einzelnen Edit von der original Lemma-Seite raus zu picken, hätte ich den aktuellen original Quelltext einfach hier her kopiert und in wenigen Sekunden wäre alles erledigt gewesen. Wg UHR dann noch auf Versionsgeschichte-Seite verlinkt, evtl mit Zeitangabe von – bis.--Ciao • Bestoernesto 23:29, 18. Mär. 2020 (CET)Beantworten

Es war auf der Diskussionsseite von COVID-19-Pandemie unklar, ob man jetzt die komplette Versionshistorie kopieren sollte oder ob ein einfacher Link (oder gar keine Erwähnung) ausreichend ist. Ich habe mich sozusagen für den Kompromiss entschieden: Aus urheberrechtlicher Sicht erfüllt eine reine Datensammlung meiner Laienmeinung nach nicht die Schöpfungshöhe. Andererseits haben sich die Autoren teilweise viel Mühe mit der Wartung der Tabelle gemacht. Von daher finde ich es fair, sie zu erwähnen. --Eulenspiegel1 (Diskussion) 23:41, 18. Mär. 2020 (CET)Beantworten
Vielen Dank für die Arbeit, Eulenspiegel, ich finde den Kompromiss gelungen. Man kann vielleicht über die „Schöpfungshöhe“ diskutieren, aber sich dennoch in diejenigen versetzen, die sich Abend für Abend an den PC setzen und die Daten im WHO-Bericht heraussuchen und möglichst ohne Fehler in die Wiki-Tabellensyntax übertragen. Just for the record: ich gehöre nicht zu den Tabellenbearbeitern, schätze aber deren Arbeit.
P.S. Vielleicht hier noch einen Verweis/Wikilink auf die lange Disk. im Hauptartikel setzen? Viele Grüße, --A doubt (Diskussion) 00:57, 19. Mär. 2020 (CET)Beantworten

Monate

Ich schlage vor, monatliche Datenblätter anzulegen. Dann wird die Breite nicht mehr so ein Problem. -- Willi The Kid (Diskussion) 16:01, 19. Mär. 2020 (CET)Beantworten

Die Tabellen sind viel zu breit

@Willi The Kid: Die aktuell am 21.3.2020 vorhandenen Tabellen sind viel zu breit, um sie gut zu erfassen, zu drucken oder per PDF zu speichern. Man sollte ältere Daten daher nur mehr mit Spalten im Wochenabstand darstellen, und noch ältere im Monatsabstand. Man hätte dann also als einen Umsetzungsvorschlag 3 Tabellen:

  • Oben eine im Tagesabstand max. 31 Tage breit
  • Dann eine Tabelle mit Spalten im Wochenabstand, gleich breit wie die oberste Tabelle
  • Eventuell später noch eine "ausgedünnte" Tabelle mit je 1 Spalte im Monatsabstand, auch gleich breit wie die oberste Tabelle

In jeder Tabelle sollten Zeilen ohne einen einzigen WHO-Wert entfallen --S563 08:47, 21. Mär. 2020 (CET)Beantworten

Ich glaube nicht, dass wir im Moment Wochenstatistiken brauchen. Die Tabellen lassen sich aber durchaus in Monatsblätter aufbrechen. -- Willi The Kid (Diskussion) 08:55, 21. Mär. 2020 (CET)Beantworten

Im Zuge des (nun wieder rückgängig gemachten) automatischen Einklappens: Was ist mit der Idee, pro Monat eine Tabelle zu machen? Es wäre gut, wenn die Benutzer, die an den Tabellen arbeiten, sich dazu melden würden. Dankeschön vorab und viele Grüße, --A doubt (Diskussion) 23:44, 24. Mär. 2020 (CET)Beantworten

Lemma

Ein besseres Lemma fände ich Tagesstatistiken der COVID-19-Pandemie. -- Willi The Kid (Diskussion) 16:06, 19. Mär. 2020 (CET)Beantworten

Zuwachs Neuinfektionen: Ländervergleich

Experten wie Christian Drosten halten die Statistiken zwischen den Ländern für nicht vergleichbar: [1] Dies muss hier für die Wikipedia berücksichtigt werden. Eigene Zusammenhänge aus Daten herzustellen ist außerdem eine Variante der Theoriefindung. @Siddharta.563: --TheRandomIP (Diskussion) 20:18, 20. Mär. 2020 (CET)Beantworten

Wenn Statistiken zwischen Ländern nicht vergleichbar wären, dürfte es das ganz Lemma nicht geben. Wegen einer Einzelmeinung einen Abschnitt ohne Diskussion zu löschen verstößt gegen WP:NPOV. Auf der Diskussionsseite COVID-19-Pandemie_in_Österreich vertreten andere User wie @Colazivi: die Meinung, dass dieser Abschnitt interessant wäre und hierher gehöre.--S563 20:40, 20. Mär. 2020 (CET)Beantworten
Für die Einfügung brauchst du einen Konsens, genau wie man für das Löschen lange etablierter Informationen diesen benötigt. Kein Konsens von meiner Seite. HÖRE DIR AN, WAS DER EXPERTE SAGT! Wenn wir aus dieser Krise eins lernen sollten, dann DASS WIR MAL ÖFTER AUF EXPERTEN HÖREN SOLLTEN! [...] Natürlich sind diese Statistiken in gewisser Weise irreführend. Ich würde mich nicht dagegen wehren, es komplett zu löschen. Aber das ist nicht Konsens. Hier führen wir zudem eine Diskussion über diese "Augenwischerei bei Fallzahlen" (nicht meine Worte) --TheRandomIP (Diskussion) 20:45, 20. Mär. 2020 (CET)Beantworten
Das ist übrigens toll, dass ihr das im Österreich-Artikel unter euch aus gemacht habt. Hier ist das ein anderer Artikel. Hier ist das neu. Hier brauchst du einen Konsens fürs Einfügen. --TheRandomIP (Diskussion) 20:48, 20. Mär. 2020 (CET)Beantworten
Es ist auch nicht nur ein Experte, der das sagt, es ist die Konsens-Meinung der Experten. Folgendes steht im Hauptartikel:
"Generell vermuten Experten eine sehr hohe Dunkelziffer von nicht erkannten Infektionen und von Infektionen, die symptomfrei verlaufen, und bezweifeln die Zuverlässigkeit der Zahlen der gemeldeten Fälle. Siehe dazu auch den Abschnitt Modellrechnungen. (mit ganz vielen Einzelnachweisen)"
--TheRandomIP (Diskussion) 20:52, 20. Mär. 2020 (CET)Beantworten
1. Dass man für jede Einfügung in ein Wiki einen Konsens braucht, ist mir neu. Dann können wir gleich jede IP sperren, die suchen selten vorher nen Konsens, bevor sie zu einem Wiki was beitragen.
2. Die Daten werden ja nicht miteinander verglichen, sondern in eine Tabelle gestellt. Es wird nichts interpretiert oder dazugedichtet. Das ist momentan informativ und enzyklopädisch im Zeitverlauf auch noch relevant.
3. Was die Dunkelziffer, die es wohl auch im lt Prof Drosten sicher vorbildlichen Deutschland gibt, damit zu tun hat, erschließt sich mir nicht ganz. Um die geht's ja ganz explizit nicht, sondern um die gemeldeten offiziellen Zahlen der WHO. Dass die sicher in keinem Land der Welt die Realität abbilden, ist klar. Aber es gibt die Zahlen der WHO und aus den Situation Reports die new cases durch die total cases zu dividieren und in eine Tabelle zu stellen, ist problematisch? Das finde ich lustig, gerade in dem Artikel da.
4. Wenn die Daten eh alle Mist sind, können wir den Hauptartikel auch gleich entrümpeln. Da steht ziemlich oft 'nach Daten der WHO'. Da werden munter Fälle zusammengezählt, Diagramme gebastelt mit den einzelnen Fällen pro Region, usw usf.
5. Also ehrlich: Die Entfernung kann ich nicht nachvollziehen. --Colazivi (Diskussion) 21:17, 20. Mär. 2020 (CET)Beantworten
Für jede Art von Änderung, die auf Widerspruch stößt, ist Konsens nötig. Schon immer. Also diskutieren wir das mal. Ja, es gibt derzeit viele Statistiken und Diagramme "nach den Daten der WHO". Das ist teilweise problematisch, teilweise nachvollziehbar. Wenn da einfach nur ein Land aufgezählt wird, dann ist das noch eher vergleichbar. Zwischen den Ländern wird es schon schwer. Herr Drosten sagt ganz klar, es gibt Grenzen bei den Testkapazitäten. Sobald ein Land diese Kapazitäten erreicht hat, können einfach nicht mehr Fälle gemeldet werden. z.B. könnte es sein, in Deutschland können nicht mehr als 10.000 Tests pro Tag gemacht werden. Dann kann die Statistik auch nie um mehr als 10.000 pro Tag anwachsen. In Italien sehen wir das gerade, die haben auf wundersame Weise einen recht niedrigen R0-Wert. Dabei fahren gerade dort Lastwagen-weise die Leichen umher. Wie kann das sein? Italien schaut einfach nicht mehr so genau hin. Diese Tabelle erschien mir besonders problematisch, es wurde sogar noch farblich hervorgehoben welche Länder "gut" (grün) und welche "schlecht" (rot) seien. Das kann man so einfach nicht machen. Der R0-Wert, also die relative Zunahme von Fällen, ist eigentlich in jedem Land ähnlich. Nicht umsonst errechnet man für Krankheitserregern einen globalen R0-Wert. Wie sich die Statistik dann im Einzelnen verhält, hängt jedoch von ganz vielen weiteren Faktoren ab. Die absoluten Zahlen sind in gewisser Weise aussagekräftig, weil sie eine untere Schranke definieren, aber mehr auch nicht. Die Zunahme ist aber noch weniger aussagekräftig, weil es sein kann, ab Tag X verfügt die Regierung massenweise Tests und dann kommen da so Werte wie 100% Zunahme in den USA raus. Ist das realitisch? Wohl kaum. Das müsst ihr mal einsehen. Investiert eure Zeit, um Zusammenhänge zu verstehen und zu erklären, nicht nur Daten-Newstickerei. Das brauchen wir hier eigentlich nicht mehr. --TheRandomIP (Diskussion) 21:45, 20. Mär. 2020 (CET)Beantworten
Und wenn, nachdem bei euch dieser Erkenntnis-Prozess stattgefunden hat, ihr zu der Einsicht kommt, dann brauchen wir das Lemma gar nicht. Herzlichen Glückwunsch! Dann sind wir schon zu dritt. :-) Dann lasst uns auch noch die ganzen anderen Newsticker-begeisterten überzeugen diese Statistiken wieder massiv abzubauen und zu reduzieren. Meine Unterstützung habt ihr. --TheRandomIP (Diskussion) 21:49, 20. Mär. 2020 (CET)Beantworten
Ich hab die Tabelle nicht gemacht, aber soweit ich das verstanden habe, waren nicht die 'guten' Länder grün und die bösen rot, sondern jene mit einer örtlichen Nähe zum deutschsprachigen Raum.
Die absoluten Zahlen repräsentieren dann also eine untere Schranke, die relativen nicht? Wenn bei Italien eine Steigerung von x% rauskommt, wird man wohl auch geneigt sein zu sagen, ja niedriger wirds wohl net sein.
Die Anzahl der Tests hat natürlich Einfluss auf alle Daten. Aber eben auf alle. Auch Deutschland hat nicht unbegrenzt Tests, kein Land hat das, jedes Land hat unterschiedliche Kriterien, wer getestet wird, usw. Die Daten der WHO sind das beste, was wir haben, um einen Artikel über eine Pandemie zu schreiben.
Aber nochmal, es geht nicht um die Qualität der Daten, die wir verwenden. Darum ging es in dem Abschnitt nicht, es geht um deren eine triviale Aufbereitung. Wenn schon die Steigerungsraten in einem Diagramm verbildlicht werden, dann geht wohl auch so ein Abschnitt.--Colazivi (Diskussion) 22:04, 20. Mär. 2020 (CET)Beantworten

Darstellung Zuwachs Neuinfektionen in % als Ländervergleich ist wichtige Basis zur Beurteilung der Maßnahmen

Ich bin der Überzeugung, der Ländervergleich ist eine sehr nützliche Information, wo man auch zeitnah sehen kann, wie unterschiedliche Pandemiemaßnahmen in verschiedenen Ländern auch unterschiedlich wirken. Nur ein Vergleich von Neuinfektionen als Zuwachs in Prozent bietet die Möglichkeit ganz verschieden große Regionen sinnvoll zu vergleichen, mit absoluten Fallzahlen werden Unterschiede der Folgen verschiedener Länder-Strategien nicht so klar sichtbar. Dies ja ja auch der Sinn von Benchmarks, wie sie fast alle großen Industriebetriebe machen, um Verbesserungen aus Vergleichen mit Konkurrenzunternehmen abzuleiten und auch Verbesserungsbedarf sichtbar zu machen. Was machen andere Unternehmen/Länder anders und wie wirkt sich das aus? Es geht darum, was einzelne Länder jetzt und zeitnah voneinander lernen können, da man ja zur aktuellen dramatischen Situation nicht wirklich Rezepte in vergangenen Pandemien findet. Da es kaum frühere Beispiele für eine derart gravierende weltweite Pandemie gibt, bietet nur der Vergleich verschiedener Herangehensweisen unterschiedlicher Länder die Chance, zu sehen, welche Maßnahmen sich wie auswirken. Viele haben da wohl Zweifel, ob Maßnahmen in einzelnen Ländern zu streng sind, oder zu wenig weitreichend. Dies bietet große Chancen, für Bevölkerung und auch für die Regierungen, die doch recht einschneidenden Maßnahmen besser in der Wirkung zu verstehen und zu gemeinsamen Überzeugungen zu kommen. Colazivi und ich sind der Meinung, der Abschnitt Zuwachs Neuinfektionen: Ländervergleich solle wiederherstellt werden, während es es dazu nur eine Gegenmeinung von TheRandomIP gibt. Ich schlage daher vor, den Abschnitt Zuwachs Neuinfektionen: Ländervergleich wiederherzustellen, falls TheRandomIP keine besseren Argumente anführen kann, welche von einer Mehrheit an Diskutanten geteilt werden.--S563 22:23, 20. Mär. 2020 (CET)Beantworten

Auch @W!B:: vertritt in der Diskussion zu "COVID-19-Pandemie in Österreich" wie ich die Ansicht, dass ein Vergleich über den Tellerrand nützlich wäre:

„Interessant hingegen wäre, ausgewählte knappe Daten der Nachbarn neben die jeweiligen Österreich-Diagramme zu stellen, damit man einen Vergleich über den Tellerrand und die Wirksamkeit der unterschiedlichen Maßnahmen hat“

.

Ich kann jedoch die folgende Meinung von Colazivi in der Diskussion zu "COVID-19-Pandemie in Österreich" recht gut verstehen:

„Der Abschnitt Ländervergleich ist zwar zweifellos interessant, gehört aber finde ich nicht in den Artikel hier (in Österreich), sondern in den Überartikel. Der Grund ist einfach der, dass dieselbe Tabelle mit denselben Zahlen ja auch im Deutschland-, Schweiz- oder xy-Artikel drinstehen könnte. Das sollte aber vereinheitlicht werden, um nicht x Tabellen mit demselben Inhalt zu haben und vor allem warten zu müssen. Wenn das im Hauptartikel drinsteht, kann man das von diesem Artikel hier (Österreich) auch gezielt verlinken, damit die Leser die Infos auch finden.“

-S563 22:43, 20. Mär. 2020 (CET)Beantworten

———————————————————————————————

Das ist natürlich nicht fair, wenn da jetzt haufenweise Leute angepingt werden, die alle deiner Meinung sind. Deswegen ist es aber gut, dass hier die Argumente zählen und nicht bloß die Anzahl der User, die für / gegen etwas sind.
"Das beste, was wir haben" ist aber vielleicht nicht gut genug. Ob die Änderungsraten auf den Folgen der Maßnahmen beruhen, wissen wir nicht. Es ist gut möglich, aber nicht sicher. Das zu beurteilen ist Aufgabe der Forscher, die Daten analysieren, Mittelwerte über Zeiträume bilden und Regressionskurven erstellen, sowie die Daten mit Modellrechnungen und Annahmen erweitern. Das ist alles sehr komplex und nicht für einen durchschnittlichen Wikipedianer geeignet. Gerne könnt ihr aber solche Analysen von Forschern suchen und sie hier einbauen. Ich bin mir sicher, schon bald werden wir viele solcher Studien und Meta-Studien sehen.
Die Zunahmen sind weder eine untere Schranke noch eine obere Schranke. Es gibt zwei Effekte, die dies verzerren können, wie bereits gesagt: 1) Durch neu geschaffene Testkapazitäten werden Tests aus der Vergangenheit "nachgeholt", die eigentlich den Vortagen zugeordnet werden müssten => Überschätzung der wahren Zunahme. Hier hilft nur Durchschnittswerte über mehrere Tage bilden. 2) Durch mangelnde Testkapazitäten oder politischem Willen (wie in China, ihr glaubt doch nicht wirklich, dass die nun ihre Pandemie vollständig überwunden haben?) werden gar nicht alle neuen Fälle getestet => Unterschätzung der wahren Zunahme. Dies muss durch Modellrechnungen und Schätzung der Dunkelziffer ausgeglichen werden.
Sicher sind viele Dinge interessant, wenn man sie wüsste, aber wenn es diese genauen Infos gar nicht gibt, dann ist das halt leider so. Dann dürfen wir nicht ersatzweise irgendwelche unzuverlässigen Daten nehmen und so tun, als seinen dies die gewünschten, "interessanten" Informationen. Das ist Selbstbetrug.
Ganz im Gegenteil ist es gefährlich, diese Daten hier nun als zuverlässige Statistiken zu präsentieren. Nicht jeder blickt ja, dass die unbearbeiteten Rohdaten total verrauscht sind. Dies kann im schlimmsten Fall zu falschen Entscheidungen bei einzelnen oder Politikern / Medien führen. Ihr müsst euch überlegen, was für eine Wirkung solch sehr "pseudo-seriös" aufgemachte Tabellen bei den Lesern haben. Das ist ja genau das, was in "Augenwischerei bei Fallzahlen" kritisiert wurde. Gerne könnt ihr euch in diese grundsätzliche Diskussion einklinken.
Nicht umsonst gibt es WP:KTF. Die einzelnen Daten sind die Primärquelle. Daraus abgeleitete Forschungsarbeiten mit Mittelwerten und Modellrechnungen sind die gewünschte Sekundärliteratur. --TheRandomIP (Diskussion) 23:04, 20. Mär. 2020 (CET)Beantworten
Passend dazu, gerade entdeckt: Wer darf sich noch auf Covid-19 testen lassen?: "Corona-Tests sind ein knappes Gut. Die meisten Gesundheitsämter testen nur noch Risikopatienten. Aus Sicht von Medizinern ist das sogar sinnvoll – schon weil viele Ergebnisse gar nicht stimmen." hmm... => Hiermit in den Artikel eingebaut. --TheRandomIP (Diskussion) 23:37, 20. Mär. 2020 (CET)Beantworten

———————————————————————————————

Per Excel-VBA-Makro in 2. Tabelle Durchschnittswerte über 7 Tage bilden

@TheRandomIP: Du schriebst um 23:37 am 20. Mär. 2020: "Hier hilft nur Durchschnittswerte über mehrere Tage bilden." Hier teile ich Deine Meinung, dass man so die Gefahr von Missdeutungen/Überinterpretationen auf Grund tatsächlich an manchen Tagen stark schwankender Testzahlen reduzieren kann. Trotzdem würde ich nur bei klaren Fehlern (z.B. irrtümlich 0 statt Tagesdifferenz) von den WHO-Werten abweichen. Ich hätte auch diese Tabelle wie folgt gehandhabt:

  • Vorerst eine Tabelle für die letzten 5-7 Tage mit 3 Spalten je Tag, also 15-21 Spalten. Mehr wäre auch für die Darstellung genauso zu breit wie die jetzt vorhandenen Spalten im Tagesabstand (statt links im Wochenabstand) der Mega-Tabellen (noch dazu mit vielen Zeilen ohne Werte) in COVID-19-Pandemie/Statistik schon viel zu viel (für eine gute Wahrnehmbarkeit oder z.B. zum Ausdrucken) sind. Diese Tabelle "Zuwachs Neuinfektionen in %" für die letzte Woche (oder einfach 7 Tage auch mit mehr als 1 Tag Abstand, soweit das eben jemand einpflegt, müsste immer aktuell gehalten werden, bis die Pandemie in den erfassten Ländern abgeklungen ist. Auch @Colazivi: vertrat ja in der Diskussion zu "COVID-19-Pandemie in Österreich" die Ansicht: "Sehr gut, danke! Ich werd noch schauen, dass ich die Tabelle so umbaue, dass sie nach unten wächst, damit das nicht so ein Kaliber wird".
  • Dann darunter eine weitere Tabelle "Zuwachs Neuinfektionen in %" mit 5 od. 6 Datumswerten im Wochenabstand und per Excel daraus abgeleiteten Differenzen je Woche.
Der Wikipedia-Text wird dann aus der Excel-Tabelle mit 1 Klick per VBA-Makro aus Wikipedia:Technik/Text/Basic/EXCEL-Tabellenumwandlung erzeugt.
  • Dann im Fall einer allgemeinen Zustimmung dafür darunter noch eine weitere Tabelle "Zuwachs Neuinfektionen in %" mit 5 od. 6 Datumswerten im Monatsabstand und per Excel daraus abgeleiteten Differenzen je Monat.

--S563 08:30, 21. Mär. 2020 (CET)Beantworten
———————————————————————————————

Überlass das doch einfach den Wissenschaftlerinnen und Wissenschaftlern. Die wissen, über wie viele Tage man Durchschnittswerte bilden sollte, wie stark man von der WHO abweichen darf usw. Die haben auch noch viel bessere statistische Werkzeuge wie Durschnittswerte, die robust gegenüber Ausreißern sind (Median) und vieles mehr. Aber ich nenne das nur als Beispiel, ich weiß ja selber nicht mal, wie man da am besten vorgehen sollte. Wie gesagt, für den durchschnittlichen Wikipedianer ist so etwas nicht geeignet, ich würde mir auch nicht zutrauen, das selber zu machen. Das Risiko, dass durch meine falsche Anwendung dieser Werkzeuge krasse Fehlschlüsse gezogen werden in der Bevölkerung, das möchte ich doch beim besten Willen nicht eingehen wollen... --TheRandomIP (Diskussion) 09:03, 21. Mär. 2020 (CET)Beantworten
@Siddharta.563: Bevor du noch weiter den durch die Admins unterbundenen Edit-War fortsetzt, hast du ja nun ganz viele Argumente, an denen du dich abarbeiten kannst, und Vorschläge, wie man es besser machen kann (Finden von Sekundärliteratur aus der Wissenschaft). Bitte tue das. Aber dass du dich selber auf eine Stufe mit Wissenschaftlern stellst und selber hier regelwiderigerweise (WP:KTF) Analysen erstellst, ist nicht angebracht. Da bin ich absolut dagegen. --TheRandomIP (Diskussion) 09:43, 21. Mär. 2020 (CET)Beantworten

WPner sollten keine eigenen Rohdatenanalysen erstellen, sondern sich darauf beschränken, dass wiederzugeben, was auf entsprechenden Fach- oder Institutseiten, amtlichen Seiten oder in der Literatur veröffentlicht wird. Dementsprechende bitte keine eigenen Bastelleien mit Excel-Makros oder anderer Software, da das unabhängig von der Fehleranfälligkeit und Trugschlüssen letztlich ein Verstoß gegen WP:TF ist. Gerade bei einem wichtigen und aktuellen Thema wie Corona sind die Projektregeln strikt einzuhalten.--Kmhkmh (Diskussion) 11:09, 22. Mär. 2020 (CET)Beantworten

Völlige Zustimmung, mich hat es auch schon spontan in den Fingern gejuckt solche Ableitungen zu erstellen, aber das ist hier nicht unser Job und wir haben nicht die Expertise. Es schleichen sich ganz schnell gravierende Fehler ein wenn man die Zusammenhänge nicht versteht. Zum Vergleich siehe unten, bildet man naiv den Zuwachs der WHO-Daten, hätte sich in Deutschland von FR auf SA die Zahl der Fälle enorm erhöht, tatsächlich hat im Gegenteil der Zuwachs leicht abgenommen. Die Fachleute wissen das auch, aber Wikipedia hätte dann die Tatsachenbehauptung einer Zuwachssteigerung in die Welt gesetzt. So was darf nicht sein, deshalb bitte nur wiedergeben, nicht interpretieren! -- Theoprakt (Diskussion) 12:38, 22. Mär. 2020 (CET)Beantworten
Wobei das, wie sich gerade herauszustellen scheint, wohl richtig war (RKI-Daten waren unvollständig). Das Umsetzen von Rohdaten in Balkendiagramme und auch die Berechnung des prozentualen Zuwachs der Rohdaten pro Tag halte ich noch für in Ordnung, das ist auch meiner Sicht noch keine (problematische) Analyse sondern nur eine visuelle Darstellung/Aufarbeitung der Rohdaten. Problematisch wird es mit der Ermittlung und Verwendung diverser Durchschnittswerte, Ermittlung von Exponentialkurvenparametern, Regressionen und Ähnlichen, der Übergang/Vermischung von Rohdaten und Infektionsraten, dem Vergleich von Ländern und Regionen, dass alles und weiteres sollte nur aus Publikationen von Experten übernommen und nicht selbst erstellt werden.--Kmhkmh (Diskussion) 05:08, 23. Mär. 2020 (CET)Beantworten
@Kmhkmh: Bei solchen Meldungen denkst du wirklich, das sei eine gute Idee? So etwas passiert ständig, auch bei der WHO. Ich denke die Steigerungsraten nochmal extra hervorheben und prominent platzieren ist keine gute Idee und lädt nur zu falschen Schlussfolgerungen ein. So etwas darf immer nur im Kontext gesehen werden und muss immer interpretiert werden, durch seriöse Sekundärliteratur. Diese Interpretation kann dann Eingang in die Wikipedia finden. --TheRandomIP (Diskussion) 17:13, 23. Mär. 2020 (CET)Beantworten
Jein. Denn das nicht nichts mit der Steigerungsrate zu tun sondern mit den Fallzahlen, die unzuverlässig sind. Sprich, dann dürfte man eigentlich in WP keine Fallzahlen bzw. Rohdaten veröffentlichen sondern müsste ein paar Jahre warten was ich hier ehrlich gesagt nicht für praktikabel halte. Wenn man aber Fallzahlen veröffentlicht, dann kann auch die prozentuale Zunahme daneben schreiben. Wie prominent man das im Artikel platziert wird ist eine andere Frage und natürlich muss im Artikel prominent auf die Probleme mit den Fallzahlen hingewiesen (Dunkelziffer, eingeschränkte Vergleichbarkeit und so weiter). Aber wenn man schon aktuelle Fallzahlen angibt, dann sehe ich nicht wirklich ein Problem darin diese als Balkendiagramem zu visualisieren und ihren relativen Zuwachs anzugeben.--Kmhkmh (Diskussion) 18:34, 23. Mär. 2020 (CET)Beantworten

Verschieden Zahlen, verschiedene Interpretationen

Während die Tagesschau unter Berufung auf das RKI einen langsamen Rückgang der Neuinfektionen meldet, enthalten die Daten der WHO für Deutschland vom 20. auf den 21. März einen dramatischen Anstieg von rund 11000 auf über 18000 Fälle (die letzte Zahl stimmt dann wieder weitgehend überein). Sind das einfach Verzögerungseffekte in Bürokratie- und Meldewesen, die aber letztlich aus der gleichen Quelle stammen? Wenn ja, könnte man das hier irgendwie deutlich machen und belegen? Wie sinnvoll ist es, für Deutschland hier überhaupt WHO Daten, oder vielmehr, exklusive WHO-Daten anzugeben, wenn die RKI-Daten genauer scheinen? Vielleicht sollte man eine Spalte mit den RKI-Daten hinzufügen? -- Theoprakt (Diskussion) 12:21, 22. Mär. 2020 (CET)Beantworten

Steht da ja, aber scheinbar übersehen alle die Anmerkungen... COVID-19-Pandemie#Anmerkungen_zu_den_Daten_und_Falldefinition_der_WHO. Ja, es sind Verzögerungseffekte. Weißt du, wie man das besser deutlich machen könnte? --TheRandomIP (Diskussion) 12:25, 22. Mär. 2020 (CET)Beantworten
Ich habe kurz überlegt ob man für Deutschland vielleicht statt dessen die RKI-Daten in die Tabelle eintragen könnte, aber man kann ja auch nicht einfach nach Belieben die Datenquelle wechseln, nur weil einem die Ergebnisse der Quantisierung gerade besser gefallen :D -- Theoprakt (Diskussion) 12:33, 22. Mär. 2020 (CET)Beantworten

Sortierung?

Ich hätte noch einmal eine Nachfrage bezüglich der Rückgängigmachung meiner Änderung durch Benutzer:Olivenmus. Grundsätzlich kann ich die Begründung nachvollziehen, jedes Land muss bei dem Kontinent dargestellt werden, zu dem es gehört. Wenn ich mir allerdings diese Version, mit meiner Änderung anschaue, dann wird jedes Land genau be dem Kontinent dargestellt, zu dem es gehört, zumindest solange ich nicht auf die Pfeile klicke. Gleichzeitig hat man, ohne dass das jetzt makaber klingen soll, einen schnellen Überblick, welches Land am stärksten betroffen ist, …, wenn man eine Sortierbarkeit zulässt. HenSti (Diskussion) 17:35, 22. Mär. 2020 (CET)Beantworten

Da gebe ich dir grundsätzlich recht. Jedoch, wie bereits erwähnt, wirft das dann die ganze Sortierung durcheinander, sobald man sortieren will nach den meistbetroffenen Ländern. Eine Idee, den Konflikt zu lösen, habe ich aktuell aber leider nicht. Einen schönen Sonntag gewünscht von – OlivenmusProblem? Bitte hier entlang!Beiträge18:24, 22. Mär. 2020 (CET)Beantworten
Jetzt passiert es auch bei mir. Ich bin mir ziemlich sicher, dass gestern noch alles richtig funktioniert hat, das habe ich extra noch einmal geprüft, bevor ich diesen Beitrag verfasst habe. ??? Merkwürdig. HenSti (Diskussion) 07:31, 23. Mär. 2020 (CET)Beantworten
Ich wollte gerade prüfeno, ob der verwendete Browser das Problem sein könnte, da habe ich mal zwei verschiedene getestet (Chrome & Edge), dann hat es wieder mit beiden korrekt funktioniert. ??? HenSti (Diskussion) 07:51, 23. Mär. 2020 (CET)Beantworten

Fehler werden mehr / größer

Moin, ich habe bei Übertragung der Daten in Excell (muss ich machen, um die Zahlen hierfür COVID-19-Pandemie#Infektionen_(kumuliert)_nach_Ländergruppen auszurechnen) folgende Diskrepanzen gefunden: Summe der Tabelleneinträge (ohne China, mit Taiwan): 37411 44125 51816 61563 72521 86494 98056 110103 128738 152863 184776

Zeile "Welt ohne Volksrepublik China(b)": 37.411 44.116 51.816 61.568 71.772 86.497 98.062 110.078 128.742 152.873 184.927 (wobei ich die letzte Zahl korrigiert habe, weil sie so aus dem Originalreport entnommen werden kann und vorher eine noch ganz andere Zahl drin stand.) Wir haben also eine immer größer werdende Fehlerquote.--Designtheoretiker (Diskussion) 20:32, 22. Mär. 2020 (CET)Beantworten

Mir fielen auch schon Zahlen auf, die am Folgetag plötzlich viel niedriger waren als vorher. Einen schönen Sonntag gewünscht von – OlivenmusProblem? Bitte hier entlang!Beiträge22:33, 22. Mär. 2020 (CET)Beantworten
Der Fehler in der letzten Zahl rührt daher, dass Taiwan zweimal reingerechnet wurde. Hier die Daten laut WHO am 20. März:
Welt insgesamt: 266.073 Fälle
China inkl. Taiwan: 81.416 Fälle
Taiwan (nicht aus WHO-Daten ablesbar, sondern aus externen Daten): 135 Fälle
Mit diesen Daten kann man das folgende berechnen:
China ohne Taiwan: 81.416 - 135 = 81.281
Welt ohne China (aber inkl. Taiwan) = 266.073 - (81.416 - 135) = 184.792
Das ist die richtige Zahl, die man auch unten in die Tabelle eintragen muss. Irgendjemand dachte aber wohl, er müsse Taiwan nochmal hinzuaddieren, hat also 184.792+135=184.927 gerechnet und diesen falschen Wert eingetragen.
Ich gehe gleich nochmal die ganze Tabelle durch und korrigiere die Werte in der dortigen Summenzeile. In die Summenzeile gehört jeweils: Welt ohne China = Welt(laut Tabelle) - China(laut Tabelle) --Eulenspiegel1 (Diskussion) 23:24, 22. Mär. 2020 (CET)Beantworten
Nein, das ist leider nicht der Grund bei den anderen Spalten. Bin weiter am schauen, woran es liegen kann. --Eulenspiegel1 (Diskussion) 00:09, 23. Mär. 2020 (CET)Beantworten
Dies zeigt eigentlich nur, dass die Zahlen gar nicht dazu gedacht sind, dass man sie im Detail seziert und ganz viele Analysen daraus erstellt. Es geht hier nur um die Größenordnung, also wie viele Ziffern die Zahl hat. Sind es ca. 100 oder 1.000 oder 10.000 usw. Alles anderes ist durch den systematischen Fehler eh irrelevant, sei es durch Dunkelziffer, zu späte Übertragungen durch Mitgliedsstaaten, mangelnde Testkapazitäten usw., also kommt es nun auch nicht darauf an, dass die vierte signifikante Stelle noch korrekt ist oder nicht. Das ist typisch Wikipedia dass man denkt, es handele sich hier bis zur letzten Stelle um eine super-korrekte Zahl. Wenn die WHO sagt, es gäbe 184776 infizierte, dann seien es auch genau 184776, nicht 184777 und nicht 184775, so denkt sich wohl mancher Wikipedianer hier. Davon müssen wir uns verabschieden... Macht euch also keinen Kopf um solch unbedeutende Anomalien. Es gibt echt wichtigeres. --TheRandomIP (Diskussion) 23:32, 22. Mär. 2020 (CET)Beantworten
Darum geht es nicht. Wenn etwas immer weiter abweicht, deutet es z.B. darauf hin, dass vergessen wurde, einen Staat einzutragen. Der Abgleich, ob die Summen übereinstimmen ist immer ein guter Test um zu überprüfen, ob man alle Zeilen eingetragen hat. --Eulenspiegel1 (Diskussion) 00:09, 23. Mär. 2020 (CET)Beantworten
wie Eulenspiegel1: ich habe bis vor 4 Tagen jeweils bei der Übernahme aus der Tabell in Excell bei Abweichungen den WHO-Bericht gegengecheckt: nur ein einziges Mal hat die WHO die falsche Summe gezogen gehabt (S.1 anders, als hinten in der Liste). Ansonsten war immer ein Land vergessen gewesen, oder der Report nachträglich geändert worden. Und um ein paar juckts mich nicht, aber wenn hier Abweichungen in der Größenordnung von 700 in der Summe auflaufen (war bis zu meiner Korrektur gestern der Fall), dan muss man schon hinterhergehen. Vielen Dank Eulenspiegel1, dass Du das diesmal übernimmst.--Designtheoretiker (Diskussion) 18:39, 23. Mär. 2020 (CET)Beantworten

Fehler nach Korrekturen: Summe der Tabellenzellen Welt o. China:
72522 86495 98056 110103 128738 152860 184776 210782
Zeile "Welt o. China"
72522 86497 98062 110078 128742 152873 184792 210797
Differenz (- bedeutet zahlen fehlen in Diagramm)
0 -2 -6 25 -4 -13 -16 -15
Der Fehler ist somit im Bereich des Erträglichen.--Designtheoretiker (Diskussion) 19:26, 23. Mär. 2020 (CET)Beantworten

Tagesstatistiken

Ich finde es ziemlich unschön, dass die Ländernamen in der Tabelle der Tagesstatistiken zentriert sind. Mit Linksbündigkeit würde das Ganze deutlich übersichtlicher, einheitlicher und ordentlicher aussehen. CanePlayz (Jacob) (Diskussion) 12:17, 23. Mär. 2020 (CET)Beantworten

@Antonsusi: ich habe deine Änderung rückgängig gemacht. Vorher war alles vernünftig linksbündig geschrieben. Durch deine Änderung kamen Zeilenumbrüche hinzu und es wurde zentriert geschrieben. Hinzu kam, dass deine Änderung den Einleitungssatz und das erste Kapitel verdoppelt hat. --Eulenspiegel1 (Diskussion) 13:26, 23. Mär. 2020 (CET)Beantworten
Danke CanePlayz (Jacob) (Diskussion) 22:49, 23. Mär. 2020 (CET)Beantworten
Und wieder hat es wer verändert. Ich habs einmal zurückgesetzt mit verweis auf diese Diskussion, ein weiteres zurücksetzen meienrseits wäre Editwar. Also wer anderes müsste ran, wenn man es linksbündig behalten möchte.--Maphry (Diskussion) 21:58, 24. Mär. 2020 (CET)Beantworten
Durch die Aktualisierung von Hambre ist die ursprüngliche Ausrichtung nun wiederhergestellt. Ich denke, es hat etwas mit der Benutzung der Vorlage:Flagge zu tun, siehe hier: Wikipedia:WikiProjekt Vorlagen/Werkstatt#Flagge Neukaledoniens. Viele Grüße, --A doubt (Diskussion) 23:36, 24. Mär. 2020 (CET)Beantworten

Tabellen standardmäßig eingeklappt

Hallo zusammen, ich habe mal die Tabellen standardmäßig eingeklappt augrund von sehr langen Ladezeiten der Seite. Ich hoffe das stellt kein Problem dar. Gruß --Einen schönen Montag gewünscht von – OlivenmusProblem? Bitte hier entlang!Beiträge23:06, 23. Mär. 2020 (CET)Beantworten

Hallo Olivenmus, danke, dass du die Änderung hier zur Diskussion stellst (ich wollte gerade darauf hinweisen). Nun meine Meinung aus Lesersicht: Dieser Artikel mit dem Lemma COVID-19-Pandemie/Statistik dient dem Zweck, die Statistiken über Infektionsfälle und Todesfälle während der COVID-19-Pandemie darzustellen, d. h. die Tabellen sind das Wichtigste an diesem Artikel, daher macht es keinen Sinn, sie standardmäßig zu „verstecken“ (also eingeklappt darzustellen). Als sie Bestandteil im Hauptartikel waren, habe ich das Einklappen nachvollziehen können, aber nicht mehr in diesem Artikel. Aber es sollten noch weitere Benutzer ihre Meinung/Argumente nennen. Viele Grüße, --A doubt (Diskussion) 12:31, 24. Mär. 2020 (CET)Beantworten
Die Ladezeiten werden durch das "Einklappen" sogar erhöht: zuerst wird der komplette Inhalt der Seite geladen undd enn per Script ausgeblendet. Verbaucht also auch noch Rechenzeiten beim Darstellen. Besser auf dieser Seite nicht machen wir haben die Tabellen ja grade deshalb ausgelagert.--Designtheoretiker (Diskussion) 13:08, 24. Mär. 2020 (CET)Beantworten
Danke für eure Meinungen. A doubt: Natürlich ergibt das Sinn, dass auf einer Seite, in der es um Statistiken geht, eine Tabelle mit Statistiken nicht eingeklappt sein sollte. Zuletzt habe ich eh gelesen, dass das wohl allgemein unerwünscht ist. Designtheoretiker: bei mir haben sich die Ladezeiten tatsächlich deutlich verringert, das Laden der Tabelle dauerte mit Abstand am längsten, während der Rest bereits dargestellt wurde, lud die Tabelle noch 2 Sekunden. Aber ich denke, der Konsens ist eindeutig: ich mache die Änderung rückgängig. Viele Grüße --Einen schönen Dienstag gewünscht von – OlivenmusProblem? Bitte hier entlang!Beiträge21:33, 24. Mär. 2020 (CET)Beantworten
Danke, Olivenmus. Dann wünsche ich schon jetzt einen schönen Mittwoch, --A doubt (Diskussion) 23:40, 24. Mär. 2020 (CET)Beantworten

Fälle absolut vs. Fälle/Einwohner

Wieso wird meist die stumpfe Anzahl veröffentlicht? Wäre nicht eine gewichtete Zahl sehr viel nützlicher? Gruss, --Markus (Diskussion) 16:18, 27. Mär. 2020 (CET)Beantworten

Die Krankheit breitet sich zunächst in Clustern aus. Heisst es hängt eher davon aus, wieviele Cluster in einem Land sich befinden als wieviele Fälle an sich (Pro Bevölkerung ist quasi eine Nullaussage). Zudem berichtet man hier Fakten und keine Theorien. Die Bevölkerungszahl in vielen Ländern ist eine extrem unsichere Größe. Und das einzige was gemessen wird ist nun mal das Vorliegen eines positiven Testes, alles andere sind Vermutungen.--Maphry (Diskussion) 16:23, 27. Mär. 2020 (CET)Beantworten
Es kommt darauf an: In der Anfangszeit, wo das Virus noch lokal ist, sind die absoluten Zahlen wichtiger. Später, wenn sich das Virus im gesamten Staat ausgebreitet hat, sind die relativen Zahlen wichtiger. Sowohl Fälle/Einwohner als auch Fälle/Fläche.
Wenn du eine reputable Quelle kennst, die die relativen Fälle beschreibt, kannst du diese gerne verwenden, um eine weitere Tabelle einzufügen. --Eulenspiegel1 (Diskussion) 16:26, 27. Mär. 2020 (CET)Beantworten
Als Quelle kann man einfach die amtliche Statistik (1) nehmen, und durch die EW-Zahlen aus WD teilen. Und dann dazu passende Landkarten machen. Vielleicht sollte man auch noch die Verschiebung der länderspeifischen Startzeit erwähnen? oder besser: abbilden? Bin leider nicht so der Tabellen-Spezialist... Gruss, --Markus (Diskussion) 17:50, 27. Mär. 2020 (CET)Beantworten

Hinterher hängen...

Man spricht davon, dass einige Länder anderen "hinterher hängen", z.B. Deutschland Italien. Dann könnte man doch die Entwicklungsgrafiken (bezogen auf EW-Zahl) an der Startzeit orientieren. Dann bekäme man vermutlich mehr oder weniger deckungsgleiche Kurven? Und könnte Hypothesen oder Erekenntnisse über unterschiedliche Verläufe beschreiben? Beispielsweise bessere/schlechterere Testmethoden, unterschiedliche Definitionen, transparente/zurückhaltende Datenfreigabe, konsequentere und/oder bessere Schutz-Strategien, "Leugnung"/nicht ernst nehmen bis zum Tag-x, etc. etc. Gruss, --Markus (Diskussion) 16:18, 27. Mär. 2020 (CET)Beantworten

Das Hinterherhängen ist Theorie. Man weiss es nicht mit Gewissheit, da Teststrategien bzw. Testkapazitäten von Land/Region zu Land/Region extremst schwanken. Daher ist ein normalisieren der Daten zwar hübsch für soziale Medien, aber Unsinn in Wikipedia. Vielleicht wird man in einiger Zeit dazu mehr in der Literatur finden, beispielsweise wenn mit Antikörpertests eine bessere Einordnung der aktuellen PCR-Tests möglich ist. Bis dahin bleibt es bei Fakten und das ist die Meldung eines positiven Testes über die nationalen Meldebehörden bei der WHO.--Maphry (Diskussion) 16:29, 27. Mär. 2020 (CET)Beantworten
Ich verstehe Deine Position. Ja, Strategie, Kapazität, "Ernst nehmen" und Transparenz variiert von Land zu Land und ist nicht genau bekannt. Aber der erste (publizierte) Fall ist bekannt. Ebenso der Zehnte, 50., 100., 1000. Und das gibt zumindest einen Anhaltspunkt für Zeitdifferenzen. Man könnte auch einfach Grafiken visuell übereinanderlegen, dann könnte man Unterschiede beispielsweise zwischen IT, CH, DE und AT intuitiv erfassen, auch wenn die Wirkparameter noch nicht bekannt sind. Und ja: wenn man später mehr weiss, kann man alles passend ergänzen. Gruss, --Markus (Diskussion) 18:08, 27. Mär. 2020 (CET)Beantworten

Automatisierung

Hallo zusammen, werden die Zahlen von den WHO Reports manuell abgelesen oder automatisiert aus den pdfs ausgelesen? Ich arbeite nämlich gerade an einer eigenen Seite (nicht wikipedia) in der ich die Daten der WHO etwas aufbereiten will und habe dazu jetzt ein script geschrieben. Vielleicht hilft es euch ja? Und nebenbei zum Löschantrag, ich bin voll auf Eurer Seite: Behalten! --87.181.74.132 01:28, 30. Mär. 2020 (CEST)Beantworten

ich denke hier hätten mehrere Accounts an solch einem Script Interesse. Wie kann man das spreaden?--Designtheoretiker (Diskussion) 14:00, 31. Mär. 2020 (CEST)Beantworten

Qualitätssicherung

Siehe auch: Wikipedia:Löschkandidaten/26. März 2020#COVID-19-Pandemie/Statistik

Also. Wie wird aus dieser Seite eine brauchbare Info? Meine Vorschläge:

  1. Darstellung der Tabellen:
    1. Die Tabellen nicht sortierbar machen. Das erlaubt auch die horizontal Auftrennung und spart Tabellenbreite
    2. Font auf 90 %
    3. Verkleinern des Leerraums in den Tabellenzellen mittels CSS
    4. Maximal zwei Wochen nebeneinander. Älteres wird entfernt, da es ggf. in der Versionsliste auffindbar ist.
  2. Inhalt der Seite
    1. Wir verwenden mehr als eine Quelle und erstellen für jede eine Tabelle. wenn nur 14 Tage dargestellt werden, ist das nicht übermäßig viel
    2. Für jede Quelle gibt es ein Intro mit angaben zur Genauigkeit / Verzögerung
    3. Maximal ein Update pro Tag
  3. Diagramme
    1. Diagramme können einen längeren Zeitraum umfassen.
    2. Nur ein Diagramm für eine Info, also z.B. eines mit allen fünf Verläufen pro Kontinent.

ÅñŧóñŜûŝî (Ð) 18:46, 30. Mär. 2020 (CEST)Beantworten

Mein Anliegen ist es, zu vermeiden, dass durch Zuordnung von WHO-Fallzahlen zu Kalenderdaten der Eindruck erweckt wird, es seien die die aktuellen Fallzahlen des Tages. Die WHO-Angaben hinken teilweise um mehrere Tage hinterher - diese Verbindung von WHO-Zahlen mit Kalendertagen ohne Hinweis ist eine Falschinformation. Ich verweise hierzu auf meine Ausführungen gaaanz unten in der Löschdiskussion (Link siehe oben) und unterstütze Antonsusi in seinem Punkt 2.2. und partiell in Punkt 2.1. Im übrigen fehlt jetzt auf der Artikelseite ein QS-Baustein. Gruß --Iiigel (Diskussion) 19:36, 30. Mär. 2020 (CEST)Beantworten

Ganz egal welche Quellen man verwendet, die Zahlen hinken immer hinterher. Alleine weil es teilweise von Test bis Ergebnis mehrere Stunden bis Tage dauert, dazu die hohe Dunkelziffer, mangelnde Testkapazitäten usw. Das heißt es wird nicht besser, wenn neben der WHO noch andere Quellen gemischt werden, diese sind nur anders schlecht, nichts besser. Dahingegen wenn man Zahlen aus ein und derselben Quelle für alle Länder verwendet, kann man zumindest darauf hoffen, dass die Werte alle auf "ähnlichere Art" falsch sind. Man reduziert also noch eine weitere Fehlerquelle zu den ohnehin schon unzähligen Fehlerquellen. Die Limitierungen der WHO-Zahlen sind hier beschrieben, da sollte man noch etwas von hier her holen um es prominenter zu platzieren, aber ich würde hier nicht eine Sammlung sämtlicher Datenquellen aus sämtlichen Instituten dieser Welt anfangen wollen. Die Daten der WHO reichen für unseren Gebrauch völlig aus. Das Ziel sollte ja sein, so wenig Rohdaten zu sammeln wie möglich. Wenn wir es könnten würde ich selbst die WHO-Statistik löschen wollen, doch dafür gibt es keine Mehrheit. Jede weitere zusätzliche Tabelle ist nur wieder eine Einladung zu Newstickereitis. --TheRandomIP (Diskussion) 20:11, 30. Mär. 2020 (CEST)Beantworten

(BK)Also die WHO sind die offiziellen Zahlen, ja mit 1-2 Tagen Verzögerung von den nationalen offiziellen Stellen, wenn ein Staat nicht ausgestattet ist mit einer Meldestruktur am Wochenende (wie die USA beispielsweise) auch mal drei Tage. Aber letztendlich sind es die offiziellen gemeldeten bestätigten Infektionen nach einem einheitlichen Schema. Auf dieser Basis handelt die Politik, auf dieser Basis handeln die Medien. Andere Quellen sind zumeist reine Theoriefindungen, ohne nachvollziehbare Basisquellen, das gilt vor allem für JH. Es ist mir wirklich nicht erklärlich, wieso man hier Daten einfügen soll die als Basis nicht das Papier Wert sind auf dem sie geschrieben sind. Ja, schön anzuschauen, aber absolut nutzlos als Beleg. Also baut man hier zu den WHO-Daten ein paar erklärende Worte ein, macht die Tabellen halbwegs lesbar für die unterschiedlichen Geräte und gut. WP ist nicht die Bildzeitung. Zwei Wochen abschnitte jeweils und dann seit dem die Daten existieren ist vertretbar. Wenn man unbedingt die älteren Daten einklappen will mag das ok sein, aber ein löschen ist absoluter Unfug. (nicht signierter Beitrag von Maphry (Diskussion | Beiträge) 20:14, 30. Mär. 2020 (CEST))Beantworten
Grundsätzlich Zustimmung zu den obigen Punkten von Antonsusi, aber einige Einsprüche:
1. Wir zeigen auch die Daten, die älter als 2 Wochen sind. Begründung: Wikipedia ist kein Newsticker! Bei einem Newsticker mögen nur die letzten 2 Wochen relevant sein. Bei einer Enzyklopädie sind aber nicht die aktuellen Werte, sondern der Verlauf interessant. Und vom besonderen Interesse sind nicht die letzten beiden Wochen, sondern eher die ersten Wochen. (Unterschied zwischen Newsticker und Enzyklopädie.) Daher das beibehalten aller Wert.
Damit es lesbarer wird, hat Designtheoretiker dankenswerterweise die Tabellen bereits monateweise aufgeteilt.
2. Wir verwenden nur eine Quelle. Damit ist die Quellenlage eindeutig und im Sinne der Qualitätssicherung auch nachvollziehbar. Sollte es zwischen zwei Quellen größere Unterschiede geben, können wir im Fließtext darauf hinweisen.
3. Was meinst du mit "1 Update pro Tag"? Die WHO liefert nur ein Update pro Tag. Von daher ist es gar nicht möglich, mehr als ein Update pro Tag zu machen. Oder willst du sagen, dass man nach dem Update keine Korrekturen mehr durchführen darf, falls man sich vertippt hat?
4. Bei "Tabellen nicht sortierbar machen", bin ich momentan unentschlossen: Einerseits hast du Recht, dass es Tabellenbreite spart. Andererseits ist es auch ein nützliche Feature, um zu sehen, wie die Länder im Laufe der Zeit ihre Positionen ändern. Daher zu diesem Punkt momentan weder pro noch contra.
--Eulenspiegel1 (Diskussion) 20:32, 30. Mär. 2020 (CEST)Beantworten
Wenn du einen längeren Zeitraum listen willst, dann musst du die täglichen Werte durch zweitägige oder gar wöchentliche ersetzen, weil du sonst - wie zurzeit - eine nicht handhabbbare Monstertabelle bekommst. Es gibt eine Grenze der Übersichtlichkeit. Mehr als ca. 20 Spalten, evtl. auch noch 31 für einen Monat, sind nicht mehr brauchbar. Das gleiche gilt für die Aufteilung in mehrere Tabellen. ÅñŧóñŜûŝî (Ð) 20:44, 30. Mär. 2020 (CEST)Beantworten
Ich habe mir gerade die aktuellen monatsweisen Tabellen angeschaut. Ich finde sie sehr brauchbar und übersichtlich.
Ja, es gibt eine Grenze der Übersichtlichkeit. Diese ist erreicht, wenn man 2-3 Monate in einer Tabelle zeigt. Bei 1 Monat pro Tabelle ist diese Grenze jedoch noch nicht erreicht. --Eulenspiegel1 (Diskussion) 20:55, 30. Mär. 2020 (CEST)Beantworten
Zu 3. ganz genau so sehe ich das auch. Und das sollte jetzt konsequent verfolgt werden. Jeder, der absichtlich von der WHO abweichende Zahlen einfügt sollte einen schonungslosen Revert kassieren; und bei Edit-War dann wohl VM. Ich verstehe eigentlich nicht, wieso das bisher nicht so gehandhabt wurde. --TheRandomIP (Diskussion) 21:14, 30. Mär. 2020 (CEST)Beantworten

Mein Senf zu der allgemeinen "Datenkritik", z.B. Mein Anliegen ist es, zu vermeiden, dass durch Zuordnung von WHO-Fallzahlen zu Kalenderdaten der Eindruck erweckt wird, es seien die die aktuellen Fallzahlen des Tages. von Iiigel aber auch andere: Mehr als den einleitenden Absatz "Anmerkungen zu den Daten und Falldefinition der WHO" und den Verweis auf den Hauptartikel, wo der Unterschied zwischen Meldedaten und wahren Infizieren explizit erläutert wird, inkl. Abschnitt "Modellrechngen" Dunkelziffern etc.pp., kann man nicht machen. Und wenn bei Olimpia-Statistiken steht: Russland hat in Sochi X Goldmedallien gewonnen, dann verlangen wir vom Leser doch auch im Hinterkopf zu haben, was mit dem Doping passierte. Erklären ja, Aufklären unbedingt, Kontexualisieren ein Muss! Aber lasst die Daten das sein, was sie sind: Es sind die nach WHO-Regeln erhobenen und gemeldeten Daten. Nicht mehr, aber auch nicht weniger. Zu dem Unterschieden zwischen WHO, ECDC und Johns Hopkins: OWID hat die drei seriösen Datenquellen verglichen siehe https://ourworldindata.org/covid-sources-comparison --Designtheoretiker (Diskussion) 21:51, 30. Mär. 2020 (CEST)Beantworten

Ich fand die Verkleinerung der Schriftart, die Benutzer:Antonsusi vorgenommen hat, sehr gut, und wundere mich, warum das wieder rückgängig gemacht wurde. Ich kann mir nicht vorstellen, dass es gute Argumente dafür gibt, solche sinnvollen Änderungen pauschal abzulehnen... --TheRandomIP (Diskussion) 11:18, 31. Mär. 2020 (CEST)Beantworten

Gegen die Verkleinerung spricht IMHO nichts. Wenn Du meinen Revert meinst: in dem Bearbeitungskommentar steht drin warum. Seine Änderung des Hinweises hatte ich händisch behalten, eine Änderung der Schriftgröße ist bei der ganzen fehlgeleiteten Löscherei des Accounts durchgerutscht.--Designtheoretiker (Diskussion) 13:59, 31. Mär. 2020 (CEST)Beantworten

Mit dem Hinweiskasten ist das von mir beanstandete Problem beseitigt worden. Ich möchte aber noch mal kurz auf Antonsusis Punkte 2.1 und 2.2 eingehen: Ich fände es durchaus als sinnvoll, wenn man eine exemplarische Vergleichsgraphik zu den Zahlen der unterschiedlichen Quellen erstellen würde. Deutschland böte sich sich als Beispiel geradezu an: hier gibt es die Zahl aus der Summe der von den Landesgesundheitsministerien gemeldeten Fälle, die gemeldeten Fallzahlen des Robert-Koch-Instituts, die der WHO, die der Johns Hopkin University und weitere. Gruß --Iiigel (Diskussion) 13:45, 31. Mär. 2020 (CEST)Beantworten

Warum werden die Grafiken nicht mehr aktualisiert???

Die beiden Balkengrafiken am Anfang des Artikels (bestätigte Infektionen/Todesfälle) enden am 25.03., also vor 6 Tagen. Bei der Geschwindigkeit der Ausbreitung der Pandemie weltweit ergibt das völlig irreführende Zahlen: laut Grafik 333000 Infektionen, in den Medien heute Abend sind es schon über 700000; bei den Todesfällen laut Grafik 18440, laut AFP jetzt schon fast 36000. Sprich: die tatsächlichen Zahlen sind doppelt so hoch wir hier in Wikipedia angegeben. Also bitte mit aktuellen Zahlen arbeiten, sonst leistet man nur Verschwörungstheorien Vorschub. --200.73.129.210 03:00, 31. Mär. 2020 (CEST)Beantworten

It's a wiki! Wenn du der Meinung bist, dass die Zahlen ergänzt werden müssen, dann tu es einfach. Der Artikel ist auch für IPs offen. Hier ist der Link, aus denen du die Daten für die Tabelle ziehen kannst: Coronavirus disease (COVID-2019) situation reports. Ich würde mich ehrlich freuen, wenn du das machst. Ich selber habe dazu momentan leider nicht die Zeit. --Eulenspiegel1 (Diskussion) 03:18, 31. Mär. 2020 (CEST)Beantworten

Welche Quelle verwenden?

Grundsätzlich finde ich die WHO als Quelle schon sehr gut. Ich habe heute aber gemerkt, dass es sehr aufwendig ist, diese Daten auch in Wikipedia zu übertragen. Das liegt vor allem daran, dass die WHO die Daten nur als PDF zur Verfügung stellt.

Ich würde daher vorschlagen, die Daten der ECDC zu verwenden: Deren Daten liegen sowohl als Excel als auch als csv-Datei zur Verfügung: Download today’s data on the geographic distribution of COVID-19 cases worldwide.

Dadurch kann man mittels Script leicht die Daten extrahieren und in Wikipedia einfügen. Mich würde vor allem die Meinung der anderen interessieren, die regelmäßig die Daten pflegen oder vorhaben, zukünftig die Daten zu pflegen. --Eulenspiegel1 (Diskussion) 11:48, 31. Mär. 2020 (CEST)Beantworten

+1. Die angesehene Online-Publikation Our World In Data verwendet ebenfalls de European CDC Daten, Begründung hier. --Count Count (Diskussion) 11:57, 31. Mär. 2020 (CEST)Beantworten
So schwierig es auch ist, alles andere als WHO ist sehr fraglich in seiner Qualität und da wir uns hier so sehr darauf konzentriert haben bei einer Quelle zu bleiben sollte man es nun auch nicht umwerfen.--Maphry (Diskussion) 13:50, 31. Mär. 2020 (CEST)Beantworten
Gerade weil die anderen Daten als Timeline vorliegen, ist die Notwendigkeit sie hier darzustellen nicht so groß, wie bei den Daten der WHO. Aufwändig ist das schon, die PDFs händisch auszulesen, siehe aber hier #Automatisierung. Ich kann mit den Daten der ECDC auf Grund der ungewöhlichen Formatierung (alle in einer Spalte) nix werden, habe es gestern mit "normalen" Excell-Mitteln versucht. Interessant an den Daen der ECDC ist aber, dass sie immer nur einen Datenpunkt setzen, wenn das Land auch berichtet hat: in den Tabellen würden dann jede Menge Zellen "leer" bleiben, weil kein Bericht aus dem Land kam. Widerspricht sich zwar mit der kumulierten Datensammlung des ECDC, weil ja die vorher gemeldeten Daten immer noch gültig sind … *schuterzuck* Am Ende ist es mir egal, wir sollten aber auch das Faktische anerkennen: wir haben in der WP jede Menge Grafiken etc. die auf den WHO-Daten basieren. Hier ist die konsolidierte Quelle für diese Grafiken, damit Unser abgleichen können, ob die Grafiken stimmen.--Designtheoretiker (Diskussion) 13:55, 31. Mär. 2020 (CEST)Beantworten
Bitte belegen, dass alles außer der WHO fraglich in seiner Qualität ist. Ich habe gerade einen Beleg dafür angebracht, dass die ECDC-Daten von OWID bevorzugt werden. Die Fehler, die OWID in den WHO-Daten gefunden hat, sind übrigens hier unter WHO Situation Report Data Inconsistencies dokumentiert. --Count Count (Diskussion) 13:57, 31. Mär. 2020 (CEST)Beantworten
Es gibt halt einen unterschied zwischen Dtaen zusammensammeln und quasi Verpflichtungen Daten zu einem bestimmten Zeitpunkt verpflichtet abzuliefern. Letzteres gult weltweit nur für die WHO, die ECDC hat eventuell diesen Status innerhalb von Europa, aber nicht darüber hinaus. Ja, mir sind die Probleme mit den WHO Daten vom täglichen übertragen von treilen davon durchaus bekannt, aber es sinnd nun mal die offiziellen Weltweiten Daten, alles andere sind quasi Hochrechnungen (um es mal mit Wahlen gleichzusetzen). Nur weil Hochrechnungen schneller sind oder das vorläufige Endergebnis korregiert werden muss, braucht man noch lange nicht als Hauptdaten die Vorläufigen zu nutzen. ECDC ist nicht so schlimm wie JH, das mag sein, und man kann die anderen Quellen sehr gerne verlinken, aber als Enzyklopädie sind alle anderen Daten als die offiziellen ungeeignet. natürlich kann man die Unzulänglichkeiten darstellen und die Kritik daran, ändert aber nichts an der Erhebungsbasis.--Maphry (Diskussion) 14:26, 31. Mär. 2020 (CEST)Beantworten
Letztlich geht es um Datenqualität. Und da gibt es Wissenschaftler, die sich damit beschäftigen und diese bewerten (s.o.). Diesen Bewertungen der Experten sollten wir folgen. --Count Count (Diskussion) 14:29, 31. Mär. 2020 (CEST) P.S. Natürlich nur, wenn es einen entsprechenden Konsens unter den Experten gibt. Die Einschätzung von OWID ist bisher die einzige, die ich gefunden haben.Beantworten

Ich will und kann überhaupt nicht beurteilen, ob und in welchem Umfang die Kritik an den WHO-Angaben berechtigt ist, aber das implizit geäußerte Argument "die WHO hat immer Recht, weil sie die offiziellen Zahlen liefert" ist hier wohl fehl am Platze - ähnliche Parolen kennen wir aus wenig demokratischen Staaten. --Iiigel (Diskussion) 15:13, 31. Mär. 2020 (CEST)Beantworten