Zum Inhalt springen

Wikipedia Diskussion:Personendaten/Wartung/Fehlerliste

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 16. Juni 2008 um 18:59 Uhr durch USt (Diskussion | Beiträge) (+Juni). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 16 Jahren von Stefan Kühn in Abschnitt Leerzeichen
Archiv
Wie wird ein Archiv angelegt?

Wikipedia:Personendaten/Wartung/Fehlerliste#KURZBESCHREIBUNG hat einen Punkt am Ende

Die derzeit noch in der Liste stehenden Kurzbeschreibungen sind imho so auch richtig mit dem Punkt am Ende. --Pelz 23:05, 25. Mär. 2008 (CET)Beantworten

Verbesserungsvorschläge

Folgendes hab ich noch für die Erweiterung mir überlegt:

  • 1) Nutzung der Infoboxen:Person zum Suchen weitere Daten (Geburtstag etc.)
  • 2) Artikel nach Personen durchforsten die zwar eine Personenkategorie (Kategorie:Schauspieler) haben aber sonst nix personenspezifisches (dazu muss ich mal eine Liste alle Personenkategorien generieren)
  • 3) Filterung des ersten Absatzes nach * und † um weitere Personen ohne PD zu finden
  • 4) Auswertung fremdsprachiger Personendaten (en etc.), dadurch Abgleich und Fehlersuche möglich

Falls ihr noch weiter Ideen habt, egal wie spinnert, einfach mal hier mit auflisten für das gemeinsame Brainstorming! -- sk 22:00, 8. Mai 2008 (CEST)Beantworten

zu 2) Eingebaut und in der Testphase. -- sk 22:13, 15. Mai 2008 (CEST)Beantworten
  • 5) Abgleich des Datums im ersten Absatz nach * und † mit den Daten in den Personendaten.
  • 6) In dieser Version [1] war der Anfang vom GEBURTSORT "in". Dies könnte man auch erkennen lassen. Wurde das nicht sogar in der alten Version gemacht?

Andim 22:27, 8. Mai 2008 (CEST)Beantworten

zu 5) Extrem schwierig. Weil zu viele Sonderfälle. Deswegen lässt es sich ja nicht automatisiert aus dem Text rausfiltern. Aber ich kann testen ob z.B. das Geburtsdatum im Text auch nochmal auftaucht. Das ist einfach zu machen
Im allgemeinen geht das nicht. Kann man aber nicht nach "* Datum" und "† Datum" im ersten Absatz suchen, und nur die Artikel betrachten, in denen das so auftritt. Also Artikel, bei denen nach * oder † kein konkretes Datum kommt, ignorieren. Andim 11:34, 11. Mai 2008 (CEST)Beantworten
Das würde gehen. -- sk 11:48, 11. Mai 2008 (CEST)Beantworten
zu 6) Kein Problem, wird mit eingebaut. --sk 22:24, 10. Mai 2008 (CEST)Beantworten
Eingebaut. -- sk 11:56, 11. Mai 2008 (CEST)Beantworten
  • 7) Kann man bei den 'Kategorie:Geboren fehlt' auch eine Schnittmenge der beiden machen, sowas wie 'Kategorie:Geboren und Kategorie:Gestorben fehlt', dann muss es natürlich auch 'nur Kategorie:Geboren fehlt' geben. Würde die Sache vereinfachen, da man beispeilsweise keine Kategorie vergessen kann, wenn beide fehlen, oder aber auch nicht zuviel setzt, falls man die eine nicht gesehen hat. Fänd ich ganz praktisch. Machbar? Der Umherirrende 23:46, 8. Mai 2008 (CEST)Beantworten
zu 7) Hmm, ja das sollte machbar sein. Sehe ich aber als nicht so dringend an. Ich schau mal wie einfach das geht. -- sk 22:24, 10. Mai 2008 (CEST)Beantworten
Eingebaut. Aber aus technischen Gründen gibt es keine Rubrik 'nur Kategorie:Geboren fehlt'. Alle die in der Sammelrubrik auftauchen, tauchen auf in den einzelnen Rubriken auf. -- sk 11:56, 11. Mai 2008 (CEST)Beantworten
Es scheint mir so, das die Liste derzeit Seiten enthält, die Geburtsdatum und Sterbedatum haben, aber eine Kategorie fehlt. Ich fände es aber sinnvoller, wenn dort nur Seiten stehen, wobei beide Kategorieeinträge fehlen und Geburtsdatum und Sterbedatum vorhanden ist, zumindestens würde ich das "sowie" so interpretieren. Aber "aber es fehlt der Kategorieneintrag" sagt wieder das gegenteil, da wäre "aber es fehlen die Kategorieeinträge" besser. Ansonsten finde ich das gut so. Wäre das so auch machbar? Der Umherirrende 00:12, 14. Mai 2008 (CEST)Beantworten
Das war ein Bug. Mir ist der auch aufgefallen und ich hab ihn jetzt mit rausgenommen. Interessanterweise bin ich dadurch auch auf einen neuen Fehler in den Personendaten gestossen. Wenn z.B. 2x Kategorie:Geboren eingetragen ist und kein gestorben. Werde das aber nicht mit als neuen Fehler ausgeben, weil diese Artikel ja bei "Kategorie fehlt" mit auftauchen. -- sk 22:13, 15. Mai 2008 (CEST)Beantworten
zu 8) Ja, ist kein Problem. Werde das für alle anderen Felder gleich mitprüfen. -- sk 22:24, 10. Mai 2008 (CEST)Beantworten
Eingebaut. -- sk 11:56, 11. Mai 2008 (CEST)Beantworten
Leerzeichen vor Komma ist abgearbeitet. Wird auch nach Leerzeichen vor ;:). gesucht? Andim 16:17, 19. Mai 2008 (CEST)Beantworten
zu 9) Ja, das sollte einfach machbar sein. Ich suche nach 'Zahl. und Zahl.' und sollte so alle Tage mit "und" dazwischen bekommen. -- sk
Eingebaut. -- sk 11:56, 11. Mai 2008 (CEST)Beantworten
Könnte man das mit 'Zahl. oder Zahl.' auch noch einbauen? Da gehört ja auch das volle Datum rein.--Klapper 20:54, 13. Mai 2008 (CEST)Beantworten
Welchen Vorteil soll das bringen? Derzeit werden erst der Dump und dann Live die neusten Artikel analysiert. Spätestens beim nächsten Dump fallen die Leute aus dem Nekrolog mit auf. Derzeit finde ich den Aufwand zu groß. -- sk 21:13, 13. Mai 2008 (CEST)Beantworten
Ich habe es mir so vorgestellt: einmal werden die verschiedene Nekrologs-Artikel automatisch durchgegangen. (erster Artikel öffnen; überprüfen ob zB Kategorie:Gestorben 2005 drinn ist; Todesdatum in der PD mit Nekrolog vergleichen; Geburtsdatum nach dem Alter im Nekrolog überprüfen) Das wäre ähnlich wie dein Vorschlag #1. Vorteil wäre, dass im Nekrolog meistens Quellen angegeben sind. Es kann ja sein, dass das Todesdatum um einen Tag korrigiert wurde und die Änderung im Artikel vergessen worden ist. Ob das möglich ist oder zu aufwändig wär, musst natürlich du sagen. --Klapper 23:48, 16. Mai 2008 (CEST)Beantworten
Gute Idee, ich suche gleich noch nach "war", "wird" etc. -- sk 09:45, 17. Mai 2008 (CEST)Beantworten
Eingebaut. Den Fehler gab es aber nur in 3 Artikeln Bernd Dittert, Bob Latchford, Fazang. Aber für die Zukunft wird das jetzt automatisch mit entdeckt. -- sk 09:44, 25. Mai 2008 (CEST)Beantworten
  • 12) Wird nach dem schon gesucht: Jemand hat zwei unterschiedliche Geboren/Gestorben Kategorien (also zb. Gestorben 2001 und Gestorben 2005). Mehrere Personen brauchen ja keine PDs/Personen-Kats und bei Unklarheiten sollte keine Kat drinn sein. --Klapper 22:53, 17. Mai 2008 (CEST)Beantworten
Nein danach wird noch nicht gesucht, aber ich hab letztens auch einen Fall gesehen, wo 2x die Kategorie:Geboren auftaucht. -- sk 17:59, 18. Mai 2008 (CEST)Beantworten
Unbekannt hab ich bisher noch nicht mit abgefragt, weil ja noch so viel zu machen gewesen ist. Ich werde es mal einschalten. -- sk 18:01, 18. Mai 2008 (CEST)Beantworten
Eingebaut! -- sk 20:28, 25. Mai 2008 (CEST)Beantworten
zu 14) Das lässt sich einbauen. Kommt beim nächsten Software-Update mit rein. -- sk 20:43, 22. Mai 2008 (CEST)Beantworten
Eingebaut! -- sk 20:28, 25. Mai 2008 (CEST)Beantworten
  • 15) Wenn bei einem Feld (wohl am besten Geburtsort bzw. Sterbeort) auf eine BKL verweist wird, könnte man prüfen, ob innerhalb des Artikels der gleiche Ausdruck mit einer Klammer verlinkt ist.--Klapper 23:53, 21. Mai 2008 (CEST)Beantworten
zu 15) Hab beim zweiten Mal durchlesen verstanden was du meinst. Also "Ort" da steht und im Text gibt es "Ort (Bundesland)" dann sollte das ermittelt werden. --sk 20:43, 22. Mai 2008 (CEST)Beantworten
Genau, so hatte ich das gemeint. --Klapper 00:05, 23. Mai 2008 (CEST)Beantworten
Naja, nicht nur mit der Klammer - es sollte halt keine BKL vorkommen, die nicht auch im Text vorkommt (also eigentlich gaaar keine, aber in der ersten Stufe lässt sich das am leichtesten prüfen). Im Prinzip sollte überhaupt kein Link dort vorkommen, der nicht auch im Text vorkommt... wobei manche "USA" verlinken bei sowas wie "Stadt, Bundesstaat, USA", was evtl. ja im Text nicht vorkommt, also am besten erstmal BKL checken. Da lässt sich sicher auch noch mehr machen: z.B. "BKL, Bundesland/Staat/IrgendwelcherText"... damit könnten gleich noch so manche Begriffsklärungen auch im Text gefixt werden. --APPER\☺☹ 02:31, 23. Mai 2008 (CEST)Beantworten
So, ich hab mal ein Script laufen lassen, dass nach Begriffsklärungen in den Feldern Geburtsort bzw. Sterbeort sucht... gefunden wurden dabei über 4000 solcher Fälle gefunden. Ich habe mal die ersten 500 unter Wikipedia:Personendaten/Wartung/Fehlerliste/BKL eingestellt. --APPER\☺☹ 02:49, 25. Mai 2008 (CEST)Beantworten
Sehr gut! Vielen Dank APPER, ich hätte so auf die Schnelle nicht so fix realisieren können. Kannst du mir vielleicht deine Herangehensweise erläutern, damit ich diese Fehler hier mit integrieren kann. -- sk 09:41, 25. Mai 2008 (CEST)Beantworten
Hab dir ne Mail mit Codeausschnitten und Erläuterung geschickt. --APPER\☺☹ 16:09, 25. Mai 2008 (CEST)Beantworten
Danke, ist angekommen. Leider glaube ich, dass ich das nicht umsetzen kann. Bei dem Live-Scan würde das heißen zu den derzeit 10000 Artikel müsste ich nochmal die Anzahl der Links und deren Redirects abfragen. Bei z.B. nur 5 Links pro Artikel wären das 50000 Artikel die ich jeden Abend scannen müsste. Hier müsste man mit einer Liste arbeiten. Na mal sehen vielleicht fällt mir noch was in den nächsten Tagen ein. -- sk 16:33, 25. Mai 2008 (CEST)Beantworten
Der Scan über sämtliche Artikel lief gestern ca. 10 Minuten oder so. Also bei 4000 fehlerhaften Artikeln geht das in wenigen Sekunden... naja... vielleicht ner Minute. --APPER\☺☹ 16:36, 25. Mai 2008 (CEST)Beantworten
Hi Apper! Vielen Dank für das Erstellen der Liste! Könntest du dein Helferlein auf dieser Liste ausschalten? Es geht bei mir einige Zeit, bis die Seite geladen ist.--Klapper 17:27, 25. Mai 2008 (CEST)Beantworten
Sollte kein Problem sein. Ich schau mal was sich machen lässt. -- sk 22:21, 27. Mai 2008 (CEST)Beantworten
zu 17) Man sollte vielleicht in allen Feldern auf Leerzeichen vor Komma, Punkt, Semikolon, Doppelpunkt, schließende Klammer suchen. Andim 13:19, 27. Mai 2008 (CEST)Beantworten
Kann ich mit abfragen. Kommt beim nächsten Software-Update. -- sk 22:21, 27. Mai 2008 (CEST)Beantworten
  • 18) Evtl. sollte man mal in der Kurzbeschreibung nach "Professor" suchen. Wie oft ich schon "Professor für Chemie" oder so gesehen hab. Das bedeutende ist, dass die Person Chemiker ist, der Titel ist im Normalfall vollkommen uninteressant. Also "deutscher Chemiker" statt "Professor für Chemie an der TU Dresden" oder sowas... --APPER\☺☹ 03:41, 28. Mai 2008 (CEST)Beantworten
zu 18) Sehr gute Idee. Stört mich auch schon seit längerem. Hab da schon was ausgeknobelt. Werde ich demnächst einbauen. -- sk 19:11, 28. Mai 2008 (CEST)Beantworten
Eingebaut.--sk 17:08, 30. Mai 2008 (CEST)Beantworten
  • 19) Ich habe gesehen, das der Alternativnamen manchmal mit einem Semikolen beginnt oder endet. Ich denke mal dies entsteht, wenn man einen Namen dort entfernt hat, aber dann das Semikolen vergessen hat. Manchmal waren auch noch Leerzeichen vor oder nach dem Semikolen. Meiner Meinung nach, könnte man sie problemlos entfernen. Der Umherirrende 11:38, 29. Mai 2008 (CEST)Beantworten
zu 19)Wird eingebaut. -- sk 22:24, 29. Mai 2008 (CEST)Beantworten
zu 20) :-) Hab ich gestern schon eingebaut. Wird in naher Zukunft mit angezeigt. -- sk 22:24, 29. Mai 2008 (CEST)Beantworten
Eingebaut.--sk 17:08, 30. Mai 2008 (CEST)Beantworten
Nachtrag: Ich denke eine html-syntax kann gut über eine spitze klammer <> gesucht werden, die wikisyntax über ein Paar Apostroph '', so bekommt man ja kursiv und fett und kursivfett. Dann sollte man auch nicht alzu viele falschpositive bekommen. Der Umherirrende 11:30, 1. Jun. 2008 (CEST)Beantworten
Die sollten alle in Wikipedia:Personendaten/Wartung/Fehlerliste#ALTERNATIVNAMEN_mit_Slash auftauchen, weil ja ein HTML-Tag auch mit einem Slash im Endtag vorkommen muss. -- sk 17:14, 1. Jun. 2008 (CEST)Beantworten
Dann aber auch nur für das eine Feld, ich weiß ja nicht, was die Leute so alles einbauen, ich bin immer wieder überrascht, was man alles so sieht. Daher hatte ich es angedacht. Der Umherirrende 22:30, 1. Jun. 2008 (CEST)Beantworten
Ich überprüfe das nochmal in der Datenbank, ob sich da der Aufwand lohnt. -- sk 20:55, 2. Jun. 2008 (CEST)Beantworten
  • 22) doppelte Parameter/Reihenfolge/Überflüssige Parameter: Ich hatte irgendwann mal gesehen, das der Paramter ALTERNATIVNAME doppelt im Quelltext stand, dies wird auch von MediaWiki nicht richtig erkannt und dadurch gehen informationen verloren, daher wäre eine rubrik dafür gut (und andere Parameter auch). Desweiteren sollte ja auch die Reihenfolge der Parameter stimmen, damit man nicht ausversehen die Informationen an falscher Stelle platziert. Auch sollten nicht benötigte Parameter erkannt und anschließend entfernt werden (ballast). Der Umherirrende 21:44, 11. Jun. 2008 (CEST)Beantworten

# 1.3 GEBURTSDATUM oder STERBEDATUM mehr Tage im Monat als erlaubt

Für das Rätsel Georg Neuhofer sind haben sich drei Mitarbeiter interessiert und beim Stadtarchiv Augsburg angefragt. Mal sehen, was dabei herauskommt. Näheres auf der Disk des Artikels.

Vielen Dank sk für deine Arbeit und deinen Einsatz. --Sebastian Mehlmacher 13:44, 20. Mai 2008 (CEST)Beantworten

Leerzeichen

Ich hab jetzt mal vom Skript nicht mehr das erste und letzte Leerzeichen wegschneiden lassen. Dadurch erhöht sich zwar die Fehlerzahl, aber vielleicht möchte der eine oder andere ja die Fehler abarbeiten. Dadurch werden jetzt auch z.B. "3. Februar " mit zwei Leerzeichen am Ende als inkorrekt in der Rubrik "mehrere Leerzeichen" angezeigt. Was meint ihr dazu? -- sk 20:59, 1. Jun. 2008 (CEST)Beantworten

Ich finde diese Änderung gut. Andim 22:00, 1. Jun. 2008 (CEST)Beantworten
An sich ist das ja nicht schlecht, aber vielleicht sollte man die Fehler mit nur Leerzeichen in einem Feld erstmal außen vorlassen, da so sehr viele "Fehler" gelistet werden. Vielleicht zum Ende hin, wenn weniger ist, da ein entfernen, nur von Leerzeichen sicherlich nicht gerne gesehen wird. Du hast so nämlich nicht nur die Rubrik "mehrere Leerzeichen" mit mehr Einträgen versehen, sondern sehr viele andere auch. Ich halte doppelte Leerzeichen (vorerst) für wichtiger. Der Umherirrende 22:24, 1. Jun. 2008 (CEST)Beantworten
Ok, ich hab das Skript entsprechend angepasst, dass es die einfachen Leerzeichen bei einigen Rubriken ignoriert. -- sk 20:53, 2. Jun. 2008 (CEST)Beantworten

Eine Bitte an alle Abarbeiter der Fehlerliste

Bitte löscht Eure erledigten Einträge unbedingt aus den Listen. Natürlich wird man nicht jeden erledigten einzelnen Edit aus der Liste rausholen, würde ja auch die Versionsgeschichte unnötig aufblähen. Um unnötigen Aufwand zu vermeiden, schlage ich vor, dass wir in der entsprechenden Liste einen Bearbeitungsvermerk anbringen und diesen nach Ende der Bearbeitung auch wieder löschen. --Pelz 22:18, 1. Jun. 2008 (CEST)Beantworten

Ich halte es auch für sinnvoll den gesamten Abschnitt samt Überschrift und erklärung zu entfernen (Strg+A, Entf), den dann taucht die Überschrift erst garnicht im TOC auf und so ist es übersichtlicher. Es kommt ja beim nächsten Aktualisieren alles wieder. Für die vollen Listen (100 Einträge) ist ein Bearbeitungshinweis, wie es Vorlage:Inuse liefert, hilfreich, aber ich halte es nicht für verpflichtend, den wenn ich den besagten Fehler nicht mehr finde, schaue ich in die Versionsgeschichte, wenn dann kurz vorher ein Edit war, lasse ich die Rubrik in Ruhe. Der Umherirrende 22:28, 1. Jun. 2008 (CEST)Beantworten
Ich muss leider hier nochmal was sagen. Gerade habe ich mich geärgert als ich mir eine kleine Liste vornehmen wollte und feststellte, dass diese heute Nachmittag offenbar abgearbeitet worden ist. Dazu bedurfte es aber schon einiger Kontrollklicks die allesamt unnötig wären, wenn die Bearbeiter hier ihre abgearbeiteten Artikel löschen und vor dem Beginn der Abarbeitung den Abschnitt, wie auch immer, als in Bearbeitung kennzeichnen. Bitte SK ändere doch entsprechend den Erklärungstext. Danke. Gruss an alle Mitstreiter die sich hier einbringen. --Pelz 22:27, 9. Jun. 2008 (CEST)Beantworten

Pokerturnier ...

... will Personendaten (Zumindest steht es immer unter "Personendaten fehlen"). Und ich weiß nicht warum, es hat keine Kat Mann oder Frau oder Geboren oder Gestorben und auch keine Vorlageneinbindung. --Ephraim33 18:11, 2. Jun. 2008 (CEST)Beantworten

Das hab ich mich auch gefragt. Und heute hab ich endlich die Ursache entdeckt. Unter Pokerturnier#Preise steht ein Kommentar "Achtung: Vorlage:Infobox Pokerprofi linkt auf diese Überschrift! Ändere sie nur, wenn Du genau weist, was Du tust!" wodurch ich die Infobox Pokerprofi in dem Artikel finde und es als Person deklariert wird. Die frage sollte der Kommentar angepasst werden oder mein Skript? Ich persönlich finde diesen Kommentar seltsam. -- sk 20:45, 2. Jun. 2008 (CEST)Beantworten
Ich finde den Kommentar schon passend. Evtl. solltest du Kommentare vor der Auswertung löschen. Wie hast du eigentlich die Liste der "Personenkategorien" erstellt? Soweit ich das sehe, hast du nicht sämtliche Personenkategorien genommen, zumal das ja kompliziert ist, da unterhalb der Kategorie:Person auch Personenlisten sind. Aber auf jeden Fall hab ich letztens vier Personen der Kategorie "Radsportler (Spanien)" mit der Kat:Mann und Personendaten versehen, die da schon fast ein Jahr schlummerten. --APPER\☺☹ 00:36, 3. Jun. 2008 (CEST)Beantworten
Die Personenkategorie ist Handarbeit. War mal eine Fleißaufgabe, aber hat sich gelohnt. Ich muss jetzt nur noch mein Skript wieder anpassen, damit ich die auch nutzen kann. -- sk 20:26, 3. Jun. 2008 (CEST)Beantworten

Neuer Dump

Hallo Stefan, unter [6] gibt es einen neuen dump, der wieder als Basis für die Auswertung dienen kann. Andim 07:57, 8. Jun. 2008 (CEST)Beantworten

Sehr schön, den werde ich gleich mal einpflegen. -- sk 09:43, 8. Jun. 2008 (CEST)Beantworten
Eingebaut! -- sk 21:27, 8. Jun. 2008 (CEST)Beantworten

Leerzeichen

Um Edits wie diesen hier zu vermeiden, sollte vielleicht ein bisschen am Script gebastelt werden, so ein „\s*“ im RegExp ist ja nicht allzu aufwändig. Kann jedenfalls nicht angehen, dass sich hunderte Beobachtungslisten nach einem Script richten müssen, das MediaWiki-Syntax nicht sauber parst. Gruß, Code·is·poetry 17:41, 9. Jun. 2008 (CEST)Beantworten

Ich habe erst alle Artikel aufgelistet die mehr zwei oder mehr Leerzeichen hintereinander enthielten. Dabei hab ich ein führendes oder ein nachgestelltes Leerzeichen bei den Daten generell ignoriert. Ich wurde daraufhin aber auf Einträge wie "Text " mit zwei Leerzeichen hingewiesen, die wegen dem Ignorieren eines Leerzeichens nicht in der Liste enthalten waren. Deshalb habe ich dann auch diese Ignorierung der Leerzeichen herausgenommen, wodurch jetzt alle mit angezeigt werden. Ich werde da mal noch was machen. -- sk 21:47, 9. Jun. 2008 (CEST)Beantworten
Ich hab gerade nochmal nachgeschaut. Es werden nur die 1400 Artikel angezeigt, in denen sich in einem Datenfeld 2 oder mehr Leerzeichen hintereinander befinden. Ich denke das ist ok so. Ein Leerzeichen am Anfang oder am Ende wird ignoriert. -- sk 21:51, 9. Jun. 2008 (CEST)Beantworten
Ich halte es für wenig sinnvoll, sowas als Fehler zu deklarieren. Die Leerzeichen müssen nicht sein, sind meiner Meinung nach aber zu verkraften und entsprechen der Definition (die zwar nirgends explizit ist, aber implizit ist klar, dass auf jedes Datenfeld ein Trim angewendet werden muss). Vor allem stehen diese größtenteils unter "hohe Priorität". Also einfach ein Trim anwenden, das macht sowieso jeder, der es dann auswertet. Grüße --APPER\☺☹ 22:04, 9. Jun. 2008 (CEST)Beantworten
Unter "hoher Priorität" steht nur "GEBURTSDATUM oder STERBEDATUM mit falschem Ende". Da sind aber nur noch 45 Einträge abzuarbeiten. Bei eventuellen Änderungen bitte ich, dieses noch abzuwarten. Andim 22:11, 9. Jun. 2008 (CEST)Beantworten

Vielleicht verstehe ich ja irgendwas falsch, aber IMHO reden wir hier über eine Syntax, die vollständig ok nach MediaWiki-Maßstäben ist. Und 1400 Artikel sind definitiv nicht „ok so“, weil das geschätzte 5000 Diff-Angugucken auf den verschiedensten Beobachtungslisten bedeuten. Für – nochmal deutlich: nix. Code·is·poetry 23:06, 9. Jun. 2008 (CEST)Beantworten

Für nix ist so auch nicht richtig. Die Personendaten sind für die automatische Auswertung gedacht. Das Beispiel: Chalid Scheich Mohammed "[[1. März]] [[1964]] oder [[14. April]] [[1965]] mag zwar für die Mediawiki-Software und Menschen ok sein, aber für den Programmierer einer Auswertung ist es eine weitere Fehlerquelle. Ich kann aber die Artikel wo wirklich nur am Anfang oder am Ende die Leerzeichen auftauchen entsprechend herausnehmen, wenn das die Mehrheit möchte. -- sk 06:50, 10. Jun. 2008 (CEST)Beantworten
Ich glaube der Grund für diesen Abschnitt war, das ein Leerzeichen zwischen Pipe und Parameter war und somit der NAME nicht richtig erkannt wurde. Siehe auch hier. Die Problematik der doppelten Leerzeichen im Text kann aber auch überdacht werden. Ich hatte mich dafür ausgesprochen, da so etwas immer vorkommt und ich es bei Textverabeitungsprogrammenm nicht richtig interpretiert wird, und ich nicht gedacht das es so häufig ist, wobei aber auch mal vorkommt, das am Ende jeder Zeile drei oder mehr Leerzeichen einfach so stehen, was sehr unsauber aussieht und meiner Meinung nach entfernt werden sollte, eine getrennete Liste wäre da vielleicht auch sinnvoll. Der Umherirrende 08:58, 10. Jun. 2008 (CEST)Beantworten
Mehrere Leerzeichen IM text sollten korrigiert werden, ja. Aber am Anfang oder am Ende oder gar vor der Pipe sollten egal sein. Ersteres sollte der entsprechende reguläre Ausdruck (da könnten wir auch mal einen einheitlichen Ausdruck für alle Auswerter irgendwo diskutieren) machen, letzteres wird einfach mit einem Trim auf die ausgelesenen Parameter erledigt (oder auch mit einem noch ausgeklügelteren regulären Ausdruck für die ganzen Personendaten... --APPER\☺☹ 14:32, 10. Jun. 2008 (CEST)Beantworten

Ich hab den Fehler völlig missverstanden. Die oben genannte Änderung ist völlig korrekt. Dort wurde aus "| NAME=" das Leerzeichen entfernt. Das gehört zum Fehler "Datenfeld fehlerhaft", der für mich der wichtigste Fehler ist (deswegen Hohe Priorität). Durch die korrekte Einhaltung der Schreibweise der Vorlage, wie sie auch auf WP:PD aufgezeigt wird, haben wir eine wesentliche Erleichterung der Auswertung erreicht. Über 200000 Artikel werden genau so geschrieben. - Das mit den anderen Leerzeichen können wir noch klären. -- sk 22:40, 10. Jun. 2008 (CEST)Beantworten

Die Schreibweise ist aber in Wikisyntax korrekt. Wenn Skripte das nicht auswerten können, gehören die korrigiert. Solche Edits sehen einige als Sperrgrund an. --Complex 23:59, 10. Jun. 2008 (CEST)Beantworten
Wie gesagt, bei über 200000 Artikel wird die Vorlage so geschrieben. Beim letzten Durchlauf des Skriptes wurde dieser Fehler bei drei Artikel angemeldet. Ich denke hier kann man von Gewohnheitsrecht sprechen. -- sk 08:16, 11. Jun. 2008 (CEST)Beantworten
Nein, warum auch? Skripte so zu schreiben und ggf. anzupassen, dass sie auf jede gültige Eingabe korrekt reagieren sollte zur Selbstverständlichkeit gehören. --Complex 08:46, 11. Jun. 2008 (CEST)Beantworten
Bitte schau dir nochmal die Seite WP:PD genau an. Dort wird die Vorlage so festgelegt.
{{Personendaten
|NAME=
|ALTERNATIVNAMEN=
|KURZBESCHREIBUNG=
|GEBURTSDATUM=
|GEBURTSORT=
|STERBEDATUM=
|STERBEORT=
}}

Wenn jetzt bei 200000 Artikeln das so gemacht wird dann ist es wirklich nicht hilfreich wenn dann jemand so was macht

{{   Personendaten|  NAME  = Mustermann,   Schulz
|ALTERNATIVNAMEN=
               |KURZbeschREIBUNG=
|GEBURTSDATUM=
| Geburtsort= Dresden
|STERBEDATUM=
|   STERBEORT  =  München
}}

Klar ist das auswertbar für die Mediawiki-Software, aber wollen wir das wirklich so? Nein, wir wollen eine standardisierte Form, die jeder mit möglichst wenig Aufwand auslesen kann. Genau deshalb versuchen wir solche kleinen Abweichungen wie bei Rihanna zu entfernen. -- sk

Und genau diese Trivialedits sind sinnlos ressourcenfressend. Rate mal, warum Bots "minimale Änderungen und kleine Schönheitskorrekturen (z. B. überflüssige Leerzeichen entfernen) nur zusammen mit größeren, wirklich gravierenden Eingriffen vornehmen" sollen und erklär mir, warum das inhaltliche Argument dahinter nicht für Personendaten gelten sollte. --Complex 09:10, 12. Jun. 2008 (CEST)Beantworten
Ein Bot ändert täglich hunderte von Seiten. Da macht so eine Regel sinn. Aber wenn wir hier täglich 3-5 Seiten haben in denen der Fehler eventuell auftritt, dann sehe ich da kein Problem, wenn das ein Benutzer ändert. -- sk 20:48, 13. Jun. 2008 (CEST)Beantworten
Das ändert nichts daran, dass die Bearbeitungen für den Artikel total unnötig sind. Durch nicht durch das Bottag geschützte Edits macht es die Sache nur noch schlimmer. --Complex 23:39, 14. Jun. 2008 (CEST)Beantworten
Nun mach mal bitten einen Punkt. Die Bearbeitungen sind sinnvoll. Und sie werden von Benutzern durchgeführt, also ist da auch kein Bottag nötig. Und, das ist meiner Meinung nach entscheidend: Es werden nur extrem wenige solcher Einträge durchgeführt. So wenig, dass wir uns hier jegliche Diskussion sparen können und die Kräfte statt in dieser Diskussion woanders sinnvoll walten lassen können. -- sk 10:25, 15. Jun. 2008 (CEST)Beantworten

Kategorie Mann/Frau fehlt

Was ist denn mit der Kategorie Kind in diesem Zusammenhang siehe hier? Ersetzt diese Kat die Kat Mann/Frau. Wenn ja, bitte die Auswertungen vielleicht ändern. Danke. --Pelz 22:43, 9. Jun. 2008 (CEST)Beantworten

Nein. Ein Kind ist entweder männlich oder weiblich und wird entsprechend einsortiert. --08-15 22:52, 9. Jun. 2008 (CEST)Beantworten

Hohes Alter

Bei dem Fehler "GEBURTSDATUM und STERBEDATUM ergeben zu hohes Alter" werden ja mittlerweile 5 Artikel angezeigt. Was wollen wir mit solchen Artikeln machen. Soll ich die in mein Skript aufnehmen, so das sie dort nie mehr erscheinen oder soll ich die da weiter bis in alle Ewigkeit stehen lassen? Die Obergrenze von 122 Jahren würde ich aber gerne so bestehen lassen, da man dadurch schnell Fehler entdecken kann. Meinungen? -- sk 08:19, 11. Jun. 2008 (CEST)Beantworten

Ich würde bevorzugen, diese als Ausnahmen ins Skript aufzunehmen. Vielleicht kann man auch die Höchstgrenze von 122 auf z.B. 115 senken, dadurch entstehen aber mehr Ausnahmen. Andim 08:27, 11. Jun. 2008 (CEST)Beantworten
Ok, ich werde das mal einbauen. -- sk 21:58, 11. Jun. 2008 (CEST)Beantworten
Ist eingebaut und Alter auf 115 gesenkt. -- sk 22:18, 13. Jun. 2008 (CEST)Beantworten

ALTERNATIVNAMEN identisch mit Titel

Was ist bei jemandem wie Amauri zu tun? Soll NAME und ALTERNATIVNAMEN vertauscht werden oder soll ALTERNATIVNAMEN gelöscht werden? Gruß, Code·is·poetry 10:24, 11. Jun. 2008 (CEST)Beantworten

Name und Alternativnamen sollten vertauscht werden. Im Feld NAME sollte der Name wie im Lemma auftauchen, also der bekannte Name. --APPER\☺☹ 14:27, 11. Jun. 2008 (CEST)Beantworten

Kurzbeschreibung mit Professor / Kurzbeschreibung mit "aus Land XY"

Das ist so lächerlicher Kleinkram, dass er nicht mal im Artikeltext automatisch behoben werden sollte, erst recht nicht in einer Box, die 95% der Leute nie zu Gesicht kriegen werden. Code·is·poetry 10:27, 11. Jun. 2008 (CEST)Beantworten

Das siehst du so. Einige Benutzer und ich sehen das aber anders. Die Punkte, die mein Skript auswirft, sind auch eindeutig als "Verbesserungsvorschläge" und nicht als zwingend notwendig zu sehen. Aber gerade die "Professoren" sollten dringend geändert werden. Oder findest du etwa Albert Oeckl - "deutscher Professor" aussagekräftig? Genauso Albin Moroder - "Bildschnitzer aus Österreich"! Ist zwar nicht falsch, aber wir haben uns hier auf die Form "österreichischer Bildschnitzer" verständigt und dann sollten wir das auch so durchziehen. -- sk 22:03, 11. Jun. 2008 (CEST)Beantworten

Mehrfach angegebener Parameter

Was passiert eigentlich, wenn ein Parameter mehrhach angegeben ist, "gewinnt" dann die letzte Wertzweisung bei der Auswertung? Wird so etwas von dem Skript erkannt? USt 22:18, 11. Jun. 2008 (CEST) --Beantworten

Beispiel:

{{Personendaten
|NAME=Yoshitomo
|ALTERNATIVNAMEN=Zimmer, Carl
|ALTERNATIVNAMEN=Zimmer, Karl
|ALTERNATIVNAMEN=Hussan Bey
|ALTERNATIVNAMEN=Perez, Lorenzo
|ALTERNATIVNAMEN=Room, Charles
|KURZBESCHREIBUNG=deutscher Komponist, Chorleiter und Dirigent Karl/Carl Zimmer'
|GEBURTSDATUM=
|GEBURTSORT=Guben
|STERBEDATUM=
|STERBEORT=Berlin
}}
Hmm... also es sollte auf jeden Fall als Fehler erkannt werdne, ich vermute nur, dass mein regulärer Ausdruck das sogar schlucken würde. Ich hoffe jedoch, dass Stefan sowas erkennt ;). --APPER\☺☹ 01:42, 12. Jun. 2008 (CEST)Beantworten
Also mir ist vor einigen Wochen mal so ein Fall untergekommen. Er war dann auch in einer Fehlerrubrik als Fehler angemeldet worden, aber ich weiß nicht mehr genau welcher Artikel es war und in welcher Fehlerrubrik er zu finden war. Wer einen solchen Fehler entdeckt bitte mal hier melden, ansonsten werde ich auch mal versuchen das Skript dahin gehend anzupassen. -- sk 08:08, 12. Jun. 2008 (CEST)Beantworten
Im Dump vom 7. Juni trat dies nur bei ALTERNATIVNAMEN auf, und zwar in genau folgenden Fällen:
Otto von Habsburg
Jakob Albrecht
Andreas Birnbacher
Isa Haller                  - (hier fehlte das '|' vor dem 2. 'ALTERNATIVNAMEN') korrigiert von Pelz 
Friedrich von Suckow
Wolfgang G. Haas            - eine leere Alternative
Jim Taylor
Friedrich von Röth
Alfred Heurteaux
Hans Witten von Köln
Maurycy Allerhand
José Antonio Benton
Leyla Gencer                - eine leere Alternative
Claude-Adrien Nonnotte      - korrigiert von Frank C. Müller
Yoshitomo                   - s.o., korrigiert von USt
Antoine Sabatier de Castres
Außer in den als 'korrigiert' beschriebenen Fällen ist der Fehler noch drin. (Ich ließ ihn drin, um eventuelle Tests zu ermöglichen. Es 'gewinnt' übrigens die letzte Zuweisung.) --Griot 21:34, 12. Jun. 2008 (CEST)Beantworten
Ich hab es in das Skript eingebaut. Kann aber gerade den Dump nicht scannen, weil es ein Problem auf dem Toolserver gibt. -- sk 22:17, 13. Jun. 2008 (CEST)Beantworten