Wikipedia:Personendaten/Auswertung

Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 29. September 2005 um 10:59 Uhr durch JakobVoss (Diskussion | Beiträge) (kat, lit, einleitung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Auf dieser Seite werden verschiedene Auswertungen der Personendaten gesammelt. Auswertungen für Wartungszwecke stehen unter Wikipedia:Personendaten/Wartung. Unter Wikipedia:Personendaten/Datenextraktion ist beschrieben, wie die Rohdaten aus dem Datenbankdump extrahiert oder direkt heruntergeladen werden können. Beiträge zu weiteren Auswertungen sind erwünscht!

Geschlecht und Kategorien

Aus dem Dump vom 17.9.2005:

Namen TOP 100

Vornamen

siehe Wikipedia:Personendaten/Auswertung/Vornamen

Nachnamen

Müller (83), Fischer (55), Baden (51), Schneider (46), Schmidt (43), Jones (41), Smith (39), Meyer (36), Hoffmann (34), Bach (32), Weber (32), Becker (31), Richter (31), Williams (31), Wagner (29), Gonzaga (28), Fuchs (27), Taylor (26), Anderson (26), Berg (26), Jackson (26), Koch (25), Davis (25), Adams (25), Johnson (25), Berger (25), Braun (25), Lehmann (24), Wilson (24), Neumann (23), Wolf (23), Brown (21), Bauer (20), Miller (20), King (20), Huber (19), Roth (19), Moore (19), Hofmann (18), Carter (18), Lange (18), Hartmann (18), Walter (18), Schulz (18), White (18), Klein (18), Khan (17), Medici (17), Otto (17), Simon (17), Lang (16), Lee (16), Albrecht (16), Hill (16), Arnold (16), Russell (16), Visconti (16), Baumann (16), Mann (16), Martin (16), Graf (15), Evans (15), Beck (15), Lenz (15), Werner (15), Frank (15), Thomas (15), Zimmermann (15), Sforza (15), Barth (14), Kramer (14), Mayer (14), Scott (14), Douglas (14), Böhm (14), Ross (14), James (14), Hahn (14), Haas (14), Herrmann (14), Wright (14), Clark (14), Busch (13), May (13), Stein (13), Steiner (13), Krüger (13), Krause (13), Brandt (13), Peters (13), Schmitt (13), Baker (13), Heine (13), Hamilton (13), Keller (13), Young (13), Adler (13), Friedrich (13), Kühn (13), Lewis (13)

Datumsangaben

Die Datumsangaben werden bei der transformation geparst um möglichst viele Fälle erkennen zu können.

Siehe auch Wikipedia:Personendaten/Datumsangaben

Statistik der Personendaten der ersten DVD:

Art Geburtdatum Sterbedatum
Tag 26750 17294
Monat 118 167
Jahr 6486 3509
Jahrhundert 48 17
Keine Angabe 1937 14355
Unbekannt 31 23
Fehler 30 35
Summe 35404 35404

Visualisierung

Sind die Daten erst einmal in ein einheitliches Format gebracht, kann man schöne Sachen damit anstellen, zum Beispiel die Verteilung der Geburtsdaten pro Jahrzehnt (hier bisher nur die Tagesangaben):

Literatur

  • Jakob Voß: Metadata with Personendaten and beyond. In: Proceedings of the First Wikimania Conference, 2005 [1]