Wikipedia Diskussion:Personendaten/Wartung/Fehlerliste

Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 15. November 2010 um 21:35 Uhr durch Pelz (Diskussion | Beiträge) (Erstmals seit langer Zeit wieder unter 10.000 Fehler: re). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Archiv
Wie wird ein Archiv angelegt?

Geburts- und Sterbedatum

Hallo, ein Vorschlag, um die vielen Datumsfehler und die Diskrepanzen mit den Kategorien zu vereinheitlichen:

Regulärer Ausdruck

Man müsste das zulässige Datumsformat durch einen regulären Ausdruck beschreiben. Mein Vorschlag in Backus-Naur-Form:

<Zahl>::=1|2| u.s.w.
<Monatszahl>::=1|2|...|31
<Monat>::=Januar|Februar|...|Dezember
<Jahr>::=<Zahl>|<Zahl> v. Chr.
<Jahrhundert>::=<Zahl>. Jahrhundert|<Zahl>. Jahrhundert v. Chr.
<Tag>::=<Monatszahl>.
<TagMonat>::=<Tag> <Monat>|<Monat> 
<Datum>::=<TagMonat> <Jahr>|<Jahr>|<Jahrhundert>|<TagMonat> <Jahrhundert>
<Datum2>::=<Datum>|vor <Datum>|nach <Datum>|um <Datum>|zwischen <Datum> und <Datum>|<TagMonat> vor <Jahr>|<TagMonat> nach <Jahr>|<TagMonat> um <Jahr>|<TagMonat> zwischen <Jahr> und <Jahr>
<Datum3>::=<Datum2>|<Datum2> oder <Datum2>
<Geburtsdatum>::=<Datum3>|getauft <Datum3>|unsicher: <Datum3>|unsicher: getauft <Datum3>
<Sterbedatum>::=<Datum3>|begraben <Datum3>|unsicher: <Datum3>|unsicher: begraben <Datum3>

Man muss vorher aber die Verlinkungsklammern entfernen. Natürlich könnte man diese Klammern auch noch in den regulären Ausdruck aufnehmen. Fälle, wie 31. April müssten danach ausgeschlossen werden, kann aber auch noch mit in den regulären Ausdruck aufgenommen werden. 29. Februar in einem Nichtschaltjahr kann praktisch nur danach geprüft werden.

Ein weiteres Problem sind die Jahresangaben wie "333/332 v. Chr." oder "um 360/370". Man kann diese leicht mit

<Jahr>::=<Zahl>|<Zahl> v. Chr.|<Jahr>/<Jahr>|<Jahr>/<Jahr> v. Chr.

zulassen. Damit erlaubt man zuviel, also müsste nachher noch extra geprüft werden.

Wenn man die zweite Version für <Jahr> verwendet, reichen folgende Fehler aus, wenn man vorher die Verlinkungsklammern entfernt:

  • Datum trifft nicht auf den regulären Ausdruck zu.
  • Datum enthält 30. Februar, 31. Februar, 31. April, 31. Juni, 31. September, 31. November. Dabei genügt es, nach diesen Strings zu suchen.
  • Datum enthält 29. Februar und Nicht-Schaltjahr. Dabei muss man für alle maximalen Teilstrings der Form "29. Februar Zahl", denen kein Punkt folgt, untersuchen, ob Zahl durch 4, aber nicht durch 100, oder durch 400 teilbar ist, falls Zahl größer als 1583 ist. Falls Zahl kleiner als 1583 ist, reicht es, auf die Teilbarkeit durch 4 zu achten. Damit erlaubt man sowas wie 29. Februar 19. Jahrhundert, was in Ordnung ist.
  • Datum liegt in der Zukunft. Man sucht nach maximalen Zahlen, denen kein "." oder " v" folgt, diese dürfen nicht größer als 2010 sein. Man sucht nach maximalen Zahlen, denen ". Jahrhundert" folgt, aber nicht ". Jahrhundert v", diese dürfen nicht größer als 21 sein.
  • Datum enthält "/". Wahrscheinlich muss man Heuristiken, wie bisher, verwenden, um die erlaubten Fälle zu finden.

Zuordnung Datum-Zeitintervall

Die Grundidee: Man ordnet dem GEBURTSDATUM und dem STERBEDATUM ein Intervall zu. D.h. GEBURTSDATUM=[g1,g2] und STERBEDATUM=[s1,s2]. Ebenso ordnet man den Geboren und Gestorben-Kategorien ein Intervall zu. D.h. Geboren=[kg1,kg2] und Gestorben=[ks1,ks2]. Mit G1:=min(max(g1,kg1),s2), G2:=min(g2,kg2,s2), S1:=max(s1,ks1,g1) und S2:=max(min(s2,ks2),g1) erhält man genauere Intervalle [G1,G2] und [S1,S2] für das Geburts- bzw. Sterbedatum.

Folgende Fehler müssten überprüft werden:

  • s2<g1: Tod vor Geburt laut Personendaten
  • ks2<kg1: Tod vor Geburt laut Kategorien
  • S2<G1: Tod vor Geburt laut Personendaten+Kategorien
  • Schnitt von [g1,g2] und [kg1,kg2] ist leer: Widerspruch zwischen GEBURTSDATUM und Geboren-Kategorie
  • Schnitt von [s1,s2] und [sg1,sg2] ist leer: Widerspruch zwischen STERBEDATUM und Gestorben-Kategorie

Wie erhält man so eine Zuordnung? Wenn man den regulären Ausdruck von oben verwendet, ist sichergestellt, dass die Datumsangaben aus elementaren Ausdrücken aufgebaut sind. Die Grundidee ist folgende: Man ordnet jeder elementaren Angabe ein Intervall auf Tagesbasis zu:

  • 5. Mai 2010 = [5. Mai 2010, 5. Mai 2010]
  • Mai 2010 = [1. Mai 2010, 31. Mai 2010]
  • Juni 2010 = [1. Juni 2010, 30. Juni 2010]
  • Februar 2010 = [1. Februar 2010, 28. Februar 2010]
  • Februar 2008 = [1. Februar 2008, 29. Februar 2008]
  • 2010 = [1. Januar 2010, 31. Dezember 2010]
  • 20. Jahrhundert = [1. Januar 1901, 31. Dezember 2000]
  • 5. Mai 20. Jahrhundert = Mai 20. Jahrhundert = 20. Jahrhundert = [1. Januar 1901, 31. Dezember 2000]
  • keine Angabe = [-unendlich, unendlich]

Problematisch ist "um" und "unsicher:". Ein Vorschlag:

  • um [a,b] = [a-10 Jahre, b+10 Jahre]

Dies ist großzügig, da aber PD und Kategorie verwendet wird, wahrscheinlich akzeptabel. So wird aus STERBEDATUM=um 5. Mai 2010 und Kategorie:Gestorben 2010 das Intervall [1. Januar 2010, 31. Dezember 2010]. Vielleicht sollte man das Intervall auch in Abhängigkeit von [a,b] wählen. Bei "begraben" und "getauft" kann man jeweils ein Jahr abziehen bzw. dazu addieren. Bei "unsicher:" ist die Situation komplizierter. Im Zweifelsfalle [-unendlich, unendlich]

Dann kann man weitermachen

  • vor [a,b] = [-unendlich,b]
  • nach [a,b] = [a,unendlich]
  • zwischen [a,b] und [c,d] = [a,d]
  • [a,b] oder [c,d] = zwischen [a,b] und [c,d] = [a,d]

Für die Kategorien ist es einfacher:

  • Geboren 2010 = [1. Januar 2010, 31. Dezember 2010]
  • Geboren im 20. Jahrhundert = [1. Januar 1901, 31. Dezember 2000]
  • Geboren im 19. oder 20. Jahrhundert = [1. Januar 1801, 31. Dezember 2000]
  • Geboren im 2. Jahrtausend = [1. Januar 1001, 31. Dezember 2000]
  • Geboren unbekannt = [-unendlich, unendlich]
  • keine Kategorie = [-unendlich, unendlich]

Mit Daten lässt es sich schlecht rechnen. Also sollte man eine Zahlencodierung wählen. Mein Vorschlag: Tag Monat Jahr wird für positive Jahre zu Jahr*10000+Monat*100+Tag, wobei Monat eben 1,2,...,12 ist. Für Jahre v. Chr. also negative Jahre bietet sich Jahr*10000+(10000-Monat*100-Tag) an. Also:

  • 5. Mai 2010 = 20100505
  • 3. Dezember 1876 = 18761203
  • 1. Januar 1 = 10101
  • 31. Dezember 1. v. Chr. = -18769
  • 30. Dezember 1. v. Chr. = -18770
  • 2. Januar 1 v. Chr. = -19898
  • 1. Januar 1 v. Chr. = -19899

Damit ist die Codierung streng monoton bezüglich der Zeit. Ein weiterer Vorteil ist, dass man z.B. leicht erkennen kann, dass bei [a,b] a und b in einem Jahr liegen, nämlich wenn sich a und b nur an den letzten 4 Stellen unterscheiden. Wenn sie sich nur an den letzten 2 Stellen unterscheiden, so liegen a und b sogar im gleichen Monat.

Ich weiß, dass ist sicherlich nicht ganz einfach zu programmieren, aber bietet meiner Meinung nach große Vorteile. Man könnte diese Codierung z.B. auch in APPERs Datenbank verwenden. Andim 15:45, 23. Mai 2010 (CEST)Beantworten

Also die Idee mit den Intervallen ist sicherlich sehr effizient, aber dazu müsste ich die komplette Anwendung umschreiben. Bisher sind wir mit dem Weg sehr gut gefahren, dass wir uns einzelne Probleme raus picken und dann dafür eine Fehlermeldung speziell generieren. Ich glaube die Mehrzahl der Probleme decken wir schon sehr gut ab. Nur durch die Einführung neuer Kategorien wie "Geboren 9. oder 10. Jahrhundert", muss ich noch einige Dinge neu einbauen. -- sk 15:43, 25. Mai 2010 (CEST)Beantworten
Ein noch ganz unbefriedigendes Python-Programm, welches einen Teil der in diesem und dem vorhergehenden Abschnitt vorgeschlagenen Aufgaben erfüllt, habe ich unter meine Benutzerseite gestellt. (Dort im Vorspann auch kurze Bemerkungen zu Mängeln des Programms.) Es ist arbeitsfähig, angewandt auf die Personenartikel im Dump vom 26. März beanstandet es 231 GEBURTS/STERBEDATUMs-Zeilen. Darunter viele, die Stefan meldet (es fehlen mehrzeilige Angaben und mehrere gleichartige Angaben in einem PD-Block, vor allem aber aus dem Kontext abgeleitete Widersprüche), aber auch ein paar weitere (der wohl häufigste Fall: [[5. Mai 555]]). Eine Weiterentwicklung ist geplant, wird aber aus Zeitmangel etwas dauern. Sie soll dann auch die Kategorien und den Abgleich mit ihnen sowie zwischen Geburts- und Sterbedaten umfassen.
Etwas unglücklich ist hier die Parallelarbeit, teilweise bedingt durch die verschiedenen verwendeten Programmiersprachen. Sicher gibt es aber Möglichkeiten, anderssprachige Programme/Funktionen einzubinden? (Die Möglichkeiten regulärer Ausdrücke scheinen mir für eine gründliche Prüfung jedenfalls nicht ausreichend zu sein.) --Griot 17:54, 25. Mai 2010 (CEST)Beantworten
Ich hab von Python keinen Plan, aber man sieht an dem Programm sehr schön, wie viel Programmierarbeit da reingesteckt werden muss, um sowas umzusetzen. Ich bin dankbar über jeden Hinweis auf unentdeckte Fehler. Ich versuche die auch zeitnahe einzubauen. Ich denke wir haben schon fast alle drin. - Vielleicht sollten wir sowas wie ein Testfeld in Form mehrere Testunterseite bauen, die alle möglichen Fehler auflistet und schauen was die Software davon findet. Sowas wie Pseudpersonenartikel ("Max Mustermann-a", "Max Mustermann-b" mit allen möglichen Fehlern. Dadurch würden wir den Artikelnamensraum nicht verschmutzen und würden aber sehen was uns noch fehlt. -- sk 10:42, 26. Mai 2010 (CEST)Beantworten
Eine genaue Festlegung des Formats mittels BNF finde ich sehr gut, ich dachte, ich hätte sowas auch schonmal vorgeschlagen, aber nur Vorschläge von Griot gefunden. Im Grunde sollte so etwas irgendwann mal auf einer Unterseite von Hilfe:Personendaten vermerkt werden.
Eine Erweiterung der Personensuche, dass diese Intervalle aufnimmt, habe ich auch schon mehrfach überlegt, ist aber jedes Mal aus Zeitgründen gescheitert. --APPER\☺☹ 03:47, 27. Mai 2010 (CEST)Beantworten
Stefans Vorschlag eines Testfelds halte ich für sehr gut. Und den Wunsch nach einer BNF-definierten Syntax für berechtigt. Das erfordert aber noch die Klärung alter vertagter Fragen... Leider bin ich für ein bis zwei Monate stark eingebunden, so dass mir nennenswerte Mitarbeit nicht möglich ist. So eilig ist's aber vielleicht auch nicht? – Bei der Gelegenheit: Fortschritte bei der Bearbeitung der Fehler "Diskrepanz zwischen NAME-Feld und Lemma" würden mich sehr freuen, den Grund beschrieb ich kurz in dieser Diskussion (alles Wesentliche steht im zweiten Beitrag). Das sind wohl Stefans Fehlerkategorien 252, 28, 202, 259. --Griot 00:22, 28. Mai 2010 (CEST)Beantworten
Ich hab vorher noch nie von der Backus-Naur-Form gehört. Gefällt mir aber sehr gut. Ich schau mal wie man das in Perl einbauen kann bzw. umsetzen kann. -- sk 10:03, 28. Mai 2010 (CEST)Beantworten
Du kannst natürlich aus meiner BNF-Formulierung einen regulären Ausdruck erhalten, indem Du die Bezeichner rekursiv ersetzt. Andim 16:52, 29. Mai 2010 (CEST)Beantworten

Umsetzung BNF

Ich hab mal mit Perl etwas rumgespielt und habe versucht die oben angesprochenen BNF einzubauen. Mit den Daten aus einem der letzten Dumps bekomme ich noch knapp 200 falsche Datumsangaben. Das ist schon mal sehr gut bei über 130000 PD sind dass nur 0,15%. Vieles sind echte Tippfehler, aber es gibt auch zahlreiche Angaben wie "183/182 v. Chr.". Wenn wir jetzt so eine strikte Überprüfung einführen müssen wir auch diese ordentlich händeln oder durch was besseres ersetzten. Ich weiß das wird ein Aufschrei bei den Historikern geben, aber wir müssen das mal klären. Anbei die offenen Problemfälle. -- sk 10:22, 24. Aug. 2010 (CEST)Beantworten

* 	" 18. Juni 1993,  "
* 	" 195x"
* 	" 2.November 1977"
* 	"<!--24. September 1660 oder -->16. Juli 1662 oder 16. September 1662 oder 24. September 1662"
* 	"01. April 1919"
* 	"01. April 1950"
* 	"02. Januar 1845"
* 	"02. März 1882"
* 	"02. November 1649"
* 	"04. Oktober 1966"
* 	"06. Mai 1966"
* 	"06.10.1988"
* 	"07. September 1846"
* 	"09. März 1927"
* 	"1. Dezember 1779 (Taufdatum)"
* 	"1. Jahrhundert n. Chr."
* 	"1. Jahrtausend"
* 	"1. Oktober 1790c"
* 	"1. oder 2. Jahrhundert"
* 	"1.Oktober 1959"
* 	"1.September 1824"
* 	"10. Juni  1850"
* 	"10. März] 1880"
* 	"10. Okotber 1905"
* 	"10. oder 11. Juni 1051"
* 	"11. April  1840"
* 	"11. Mai  1926"
* 	"11.August 1984"
* 	"11.Februar 1988"
* 	"113. Juli 886"
* 	"1158/1160"
* 	"12. Oktober  1767"
* 	"12. Oktober1860"
* 	"12.Januar 1987"
* 	"12.Juni 1958"
* 	"13. Mai  1990"
* 	"13. oder 15. Dezember 1644"
* 	"13. oder 16. August 1920"
* 	"13.September 1969"
* 	"14.Februar 1991"
* 	"1470/80"
* 	"15. Jänner 1953"
* 	"15. Mai  1981"
* 	"15.(?) September 1941"
* 	"1587/1589"
* 	"16.August 1932"
* 	"16.Dezember 1708"
* 	"16.November 1979"
* 	"1637/1638"
* 	"1687/88"
* 	"17 . Mai 1963"
* 	"17. Dezember 1979]"
* 	"17. Jänner 1784"
* 	"17. Jänner 1874"
* 	"17. Jänner 1943"
* 	"17.08.1964"
* 	"17.Mai 1953"
* 	"17.September 1985"
* 	"18. Jänner 1880"
* 	"18. oktober 1880"
* 	"18.Dezember 1984"
* 	"183/182 v. Chr."
* 	"19. Juni  1919"
* 	"19. Juni 1919 (nach KCL 1930: 1921)"
* 	"19. oder 20. Jahrhundert"
* 	"19.9.1740"
* 	"2. Jahrhundert n. Chr."
* 	"2. oder 1. Jahrhundert v. Chr."
* 	"20. Jänner 1936  "
* 	"20. März 1760 (Taufdatum)"
* 	"20. Novemberr 1978"
* 	"20. oder 25. März 1907"
* 	"20.Juli 1982"
* 	"20.September 1972"
* 	"21. August 1550 (Taufe)"
* 	"21. Jänner 1884"
* 	"21. Jänner 1983"
* 	"21.März 1745"
* 	"22. Jänner 1904"
* 	"22. Jänner 1959"
* 	"22. März  2010"
* 	"22. März (?) 2010"
* 	"22.August 1952"
* 	"22.Februar 1765"
* 	"22.Juni 1981"
* 	"22.Juni 1982"
* 	"22.November 1823"
* 	"22.Oktober 1978"
* 	"24. Juli"
* 	"24. Mai  1805"
* 	"24. Mai 196ß"
* 	"24.3.1891"
* 	"24.April 1964"
* 	"24.Dezember 1969 "
* 	"25. Jänner 1927"
* 	"25. September  1521"
* 	"25.Oktober 1939"
* 	"252/251 v. Chr."
* 	"26. Februar"
* 	"26. Jänner 1803"
* 	"26.September 1989"
* 	"27. Jänner 1944"
* 	"27. Juni1963"
* 	"27. September"
* 	"27.November 1790"
* 	"27.September 1991"
* 	"28. Septe,mber 1959"
* 	"28.03.1956"
* 	"28.6.1839"
* 	"29. Jänner 1994"
* 	"29. Mai  1870"
* 	"29. Mai  1977"
* 	"29.August 1962"
* 	"29.Januar 1988"
* 	"29: März 1754 "
* 	"3. Juni  1938"
* 	"30. Jänner 2009"
* 	"30.April 1806"
* 	"311/310 v. Chr."
* 	"314/313 v. Chr."
* 	"327/326 v. Chr."
* 	"332/331 v. Chr."
* 	"348/347 v. Chr."
* 	"352/351 v. Chr."
* 	"353/352 v. Chr."
* 	"359/358 v. Chr."
* 	"374/373 v. Chr."
* 	"377/376 v. Chr."
* 	"396/395 v. Chr."
* 	"4. Dezember"
* 	"4. Jänner 1924"
* 	"428/427 v. Chr."
* 	"5.Fenruar 1976"
* 	"5.März 2010"
* 	"6 Februar 1958"
* 	"6. November"
* 	"6.Mai 1987"
* 	"6/5 v. Chr."
* 	"631/627 v. Chr."
* 	"69/68 v. Chr."
* 	"7. Juli  1977"
* 	"7.Februar 1888"
* 	"7.Februar 1982"
* 	"7.März 2010"
* 	"8.  September 1914"
* 	"8. August 1978, "
* 	"8. oder 9. Jahrhundert"
* 	"9. Jänner 1891"
* 	"9. März1965"
* 	"9.Mai 1694"
* 	"? (nach 1938, wird noch geklärt)"
* 	"Jahreswende 1740/1741 "
* 	"Juni 1943 (vermisst)"
* 	"Padua, Italien"
* 	"ca. 1942"
* 	"ca. 1949"
* 	"im 13. Jahrhundert"
* 	"im 19. oder 20. Jahrhundert"
* 	"im 20. Jahrhundert"
* 	"im 9. Jahrhundert"
* 	"nach 120/119 v. Chr."
* 	"nach 317/316 v. Chr."
* 	"nach 325/324 v. Chr."
* 	"nach dem 5. August 1942"
* 	"um 1030–1040"
* 	"um 1035–1040"
* 	"um 1095–1100"
* 	"um 1129–1135"
* 	"um 1209/1215"
* 	"um 1254–1258"
* 	"um 1290–1295"
* 	"um 1355–1360"
* 	"um 1360–1364"
* 	"um 1468/69"
* 	"um 1490–1500"
* 	"um 1509–1530"
* 	"um 1514–1535"
* 	"um 1539–1535 v. Chr. oder um 1522 v. Chr."
* 	"um 1774/1777?"
* 	"um 213/212 v. Chr."
* 	"um 25/24 v. Chr."
* 	"um 30–32"
* 	"um 375–370 v. Chr."
* 	"um 410–407 v. Chr."
* 	"um 435/429 v. Chr."
* 	"um 787–782 v. Chr."
* 	"um 800–796 v. Chr."
* 	"um 801–798 v. Chr."
* 	"um 837–835 v. Chr."
* 	"um 85–90"
* 	"um 852–849 v. Chr."
* 	"um 874–869 v. Chr."
* 	"um 885–876 v. Chr."
* 	"um 886–877 v. Chr."
* 	"unbekannt"
* 	"unsicher : vor 630"
* 	"wohl 1640"
Wenn ich es richtig sehe, dann sind davon ca.100 reine Tippfehler die im Wesentlichen unproblematisch sein dürften. Natürlich könnte eine Änderung von "Jänner" auf "Januar" bei unseren österreichischen Freunden auf Kritik stoßen. Bie den Angaben wie "um 1509-1430" kann man sicher auf "16. Jahrhundert" ändern. Dann wird noch ein gewisser Bodensatz übrigbleiben, zu den mir jedenfalls dann nichts mehr einfällt. Gruß --Pelz 20:27, 24. Aug. 2010 (CEST)Beantworten
Wenn man "x. Jahrtausend" und "y. Jahrtausend v. Chr." noch erlaubt, bleiben als kritische Fälle doch nur sowas wie "320/319 v. Chr." und "um 85-90" übrig. Letzteres kann man mit zwischen auflösen. Andim 22:01, 24. Aug. 2010 (CEST)Beantworten
Dieses Auflösen mit "zwischen" wurde uns beim letzten Mal schwer angekreidet. Vielleicht sollten wir das bei Jahreszahlen vor 400 noch mit aufnehmen. -- sk 22:39, 24. Aug. 2010 (CEST)Beantworten
Die Klärung einiger offener Punkte ist sicher nötig. Da sie aber bereits mehrere Jahre verschoben wurde und kein aktuell dringender Grund zu sehen ist, muss sie vielleicht nicht in kürzester Zeit erfolgen. Ich bitte um ein paar Wochen Aufschub, um mich an der Diskussion beteiligen zu können. (Zur Zeit bin ich leider ohne eigenen Internetanschluss.) Eine vollständige BNF-Darstellung, die allerdings etwas mehr Freiheiten gewährt, als die gültigen PD-Vorschriften, ist übrigens verstreut in den Kommentarzeilen meines oben bereits genannten Programms enthalten. --Griot 23:08, 30. Aug. 2010 (CEST)Beantworten

Alte/neue Fehlermeldung

Heute hatte ich ein paar Mal die schon längst "totgeglaubte" Fehlermeldung: DBI connect('u_sk_pd_p:host=sql','sk',...) failed: User 'sk' has exceeded the 'max_user_connections' resource (current value: 15) at ./pd.cgi line 28 Gruss --Pelz 22:24, 9. Jun. 2010 (CEST)Beantworten

Ist mir auch aufgefallen. Bitte am besten immer hier melden. Ich bin am überlegen, ob ich wie beim Checkwiki-Interface die Übersichtsseiten als statische HTML-Seiten erstelle und alle 15 Minuten diese aktualisiere. -- sk 21:27, 10. Jun. 2010 (CEST)Beantworten
Bei Deiner Überlegung kann ich Dir in Ermangelung von speziellen Kenntnissen natürlich nicht helfen. Heute(gestern) ist es mir 1x wieder aufgefallen. Gruss --Pelz 00:43, 11. Jun. 2010 (CEST)Beantworten
Heute (gestern) auch schon wieder x-mal. Gruss --Pelz 00:05, 15. Jun. 2010 (CEST)Beantworten
Und gerade schon wieder. --Pelz 13:50, 16. Jun. 2010 (CEST)Beantworten
Jetzt auch. --Pelz 07:32, 18. Jun. 2010 (CEST)Beantworten
So wie es aussieht werde ich mich da mal doch noch mal eine besseres System überlegen müssen. -- sk 21:08, 18. Jun. 2010 (CEST)Beantworten
Ja Stefan, das wäre schön. Gerade bin ich mal wieder an der Abarbeitung gehindert. Ist schon frustierend an so einem technischen "Mist" zu scheitern. Gruss --Pelz 15:32, 19. Jun. 2010 (CEST)Beantworten
Leider passiert das immer noch --Pelz 22:56, 28. Jun. 2010 (CEST)Beantworten
...und immer wieder kommt das Fehlerlein --Pelz 22:16, 12. Jul. 2010 (CEST)Beantworten
hoffentlich kann SK das bald richten. Mein linker Zeigefinger (der sog. "F5"-Finger) tut schon gewaltig weh. --Pelz 23:39, 17. Aug. 2010 (CEST)Beantworten
Leider ist der Fehler immer noch aktuell --Pelz 23:29, 30. Aug. 2010 (CEST)Beantworten
..auch heute schon wieder. --Pelz 20:41, 6. Sep. 2010 (CEST)Beantworten
Lese erst jetzt, dass hier diese "Fehlermeldung" gepostet werden sollte. Damit denn auch einmal jemand anderes als Benutzer:Pelz hier postet, melde auch ich diesen Fehler. Heute, gestern, eigentlich schon so lange wie ich hier mithelfe :-) Wäre schön, wenn hier Abhilfe geschaffen werden könnte...--Silke Ewering 21:37, 6. Sep. 2010 (CEST)Beantworten
... auch eben wieder. Und das dann bei einer sowieso langsamen Reisecompi. Gruss --Pelz 17:19, 19. Sep. 2010 (CEST)Beantworten
nächste Meldung --Pelz 14:19, 26. Sep. 2010 (CEST)Beantworten
Ich dachte schon, gestern/heute liefe mal alles glatt. Leider nicht. --Pelz 00:40, 1. Okt. 2010 (CEST)Beantworten
Gelegentlich bin auch ich davon betroffen. Andim 19:58, 3. Okt. 2010 (CEST)Beantworten
Schön, dass nicht nur ich das feststelle. Gestern auch schon wieder. --Pelz 00:44, 6. Okt. 2010 (CEST)Beantworten
Da ich leide derzeit mit meinem Rechner zwangsoffline bin nach Umzug und noch andere Sachen an der Backe habe, muss ich euch um Geduld bitten. Derzeit läuft das Tool live. Das heißt jeder Mausklick löst ein select-statment in der datenbank aus. Teilweise brachen die Abfragen wegen "group by" oder "order by"-Klauseln etwas länger in der DB. Wenn nun mehr leute es gleichzeitig nutzen, kommt immer die Regel "Maximal 15 Nutzer" ins Spiel. Das heißt wenn 10 nutzer mit der CheckWikipedia-Tool arbeiten, dann bleiben noch 5 für das PD-Tool. Eine Erhöhung der Nutzerzahl wollen die Admins des Toolservers nicht. Ich kann das PD-Tool so umstricken wie das Check-Wikipedia-Tool. Dadurch werden nur alle 15 Minuten die Daten aktualisiert, aber dafür sind die Abfragen auf die DB deutlich schneller, weshalb dann nicht mehr so oft die Fehlermeldung bekommt. -- sk 10:48, 7. Okt. 2010 (CEST)Beantworten

Text ohne Geburts- oder Sterbedatum

Fett- und Kursivschrift

Wenn man sich die Rubrik anschaut, sieht man das das Semikolon vor dem Sternchen innerhalb einer Fettschreibung oder Kursivschrift steht (beispielsweise bei Charles Chaplin). Ich bin mir unsicher ob das Semikolon auch fett/kursiv sein soll oder nicht. Ich habe auch mal gelesen, das ein Satzzeichen nach einem formatierten Wort in der gleichen Formatierung sein sollte, weiß aber nicht mehr wo. Wie seht ihr das? Der Umherirrende 20:40, 21. Jun. 2010 (CEST)Beantworten

Danke für die Frage. Sehe ich auch als Problem. Meiner Meinung nach müsste das nicht fett/kursiv sein, aber ich kenne da keine offizielle Regel. -- sk 10:37, 23. Jun. 2010 (CEST)Beantworten

getauft/begraben

Ein getauft (oder begraben) in den Personendaten sollte man ausschließen oder nach den entsprechenem Text suchen (Peter von Winter) --Der Umherirrende 16:37, 2. Jul. 2010 (CEST)Beantworten

nbsp als Leerzeichenersatz

Im Artikel Abraham B. Jehoshua wird ;&nbsp;* genutzt. Dieses und die weiteren Zeichen sollten als Leerzeichen betrachtet werden. Der Umherirrende 12:01, 3. Jul. 2010 (CEST)Beantworten

Wenn man solch einen Artikel gerade bearbeitet, kann man dieses Zeichen gleich mit entsorgen, da es überflüssig und an dieser Stelle unüblich ist. Dann taucht es in der Ergebnisliste der Suche automatisch nicht mehr auf. --RonaldH 18:26, 25. Jul. 2010 (CEST)Beantworten
Ja, dann würde ich das auch machen, aber bei den meisten Artikel ist sonst nichts zu machen, daher plädiere ich dafür, das "anzuerkennnen". Wikitext ist sehr tolerant (bzw. der Parser). Der Umherirrende 21:46, 28. Jul. 2010 (CEST)Beantworten
In vielen Fällen wird das nbsp genutzt, um die Textrichtung zu erhalten, da Rechts-nach-Links-Text die Eigenheit hat, alles durcheinander aussehen zu lassen. Durch nbsp steht aber Text mit einer eigenen Textrichtung hinter dem Text mit der anderen Textrichtung und die Browser können das besser im Editor darstellen. Ob ein LTR/RTL-Marker besser ist, weiß ich nicht. Es ist aber meistens möglich das nbsp zwischen den Sternchen und Datum zu verschieben, dort scheint es dem Skript hier weniger zu stören, hat aber noch die gleiche Wirkung. Der Umherirrende 20:07, 22. Aug. 2010 (CEST)Beantworten

Übermäßige Leerzeichen =

Im Artikel Xu Beihong sind zwei Leerzeichen zwischen dem Semikolon und dem Sternchen. Ich denke, das sollte als "richtig" erkannt werden, da die Anzeige ja richtig ist. Der Umherirrende 11:34, 25. Jul. 2010 (CEST)Beantworten

Selbe Meinung wie zum Fall drüber. Nur weil die Anzeige passt, ist der Code noch lange nicht "richtig". Auch hier spricht nichts gegen eine Bereinigung en passant. --RonaldH 18:26, 25. Jul. 2010 (CEST)Beantworten
Stellt sich die Frage, um was es geht. Ich würde eher sagen, das es dem Leser einheitlicher vorkommt. Aber das ist auch wieder Geschmackssache. Der Umherirrende 21:46, 28. Jul. 2010 (CEST)Beantworten

Alternative Zeichen für Gestorben

Im Artikel William Ponsonby wird ein X verwendet. Laut Genealogische Zeichen handelt es sich um "gekreuzte Schwerter", da der Betroffende gefallen ist. Hat jemand eine Idee? Auch ein Kreuz setzen oder so lassen? Der Umherirrende 17:19, 25. Jul. 2010 (CEST)Beantworten

auf der genannten Seite steht aber auch dass es sich bei dem X um ein Ersatzzeichen handelt. Habe nun mal das korrekte Zeichen eingefügt, in der Hoffnung, dass das nun auch für jeden sichtbar ist. Imho sollte das künfigt verwendet werden. --Graphikus 18:05, 25. Jul. 2010 (CEST)Beantworten
Ich halte gar nichts von diesem Sonderzeichen. Da gibt es doch nur wieder Streit, wann jemand als "gefallen" gilt und wann nicht. Sympatisanten bestimmter Organisationen werden "ihre Kämpfer" als "gefallen" bezeichnen, obwohl diese Organisationen nach westeuropäischem Rechtsverständis kriminell sind. Lassen wir es besser beim mehrheitlich anerkannten †. --Pelz 13:46, 27. Jul. 2010 (CEST)Beantworten
Der Einwand hat Sinn, ich weiß garnicht ob es für das Symbol eine anerkannte Definition außerhalb der Wikipedia gibt. So brauch auch nichts am Skript angepasst werden. Der Umherirrende 21:46, 28. Jul. 2010 (CEST)Beantworten

HTML-Kommentar

Im Artikel Tsenshab Serkong Rinpoche befindet sich ein Kommentar zwischen Klammer und Stern. Der Umherirrende 21:13, 30. Jul. 2010 (CEST)Beantworten

griechische Wörter vor dem Datum

Auf meiner Diskussionsseite wurde mir geschrieben, das ein Semikolon nach einem griechischem Wort falsch ist, da das Semikolon im griechischen ein Fragezeichen entspricht und somit dort schlecht platziert ist. Ich kenne mich da überhaupt nicht aus und wollte es nur notieren. Der Umherirrende 20:33, 13. Aug. 2010 (CEST)Beantworten

Es handelt sich um die Vorlagen mit dem Präfix ELS --Der Umherirrende 20:03, 22. Aug. 2010 (CEST)Beantworten

Javascript

Ich habe in der letzten Woche ein Skript geschrieben, das die Bearbeitung und vor allem die Erstellung von Personendaten erleichtert und das inzwischen so gut funktioniert, dass es auch von anderen benutzt werden kann. Wer also Lust hat, kann in seine vector.js (bzw. monobook.js) die Zeile

importScript('Benutzer:Schnark/js/personendaten.js'); //[[Benutzer:Schnark/js/personendaten.js]]

schreiben. Etwas mehr steht unter Benutzer:Schnark/js/personendaten. Kurzgefasst: Es gibt eine Bearbeiten-Maske für die Felder der Personendaten, SORTIERUNG und die Kategorien Geboren, Gestorben, Mann/Frau. Sind bereits PD vorhanden, ruft man diese Maske durch einen Klick auf Bearbeiten in der PD-Box auf, fehlen sie trotz eindeutiger Kategorien, so wird die Maske automatisch angezeigt und mit den Daten aus der Einleitung belegt. Durch einen Klick auf Übernehmen kommt man in den Bearbeiten-Modus, wo die entsprechenden Änderungen bereits vorgenommen sind. Vorsicht sollte man vor allem bei Alternativnamen und den Zeilenumbrüchen, die eingefügt werden walten lassen. Fehler können mir auf meiner Diskussionsseite gemeldet werden.

Und da ich gerade schon dabei bin: Ebenfalls ein nützliches Skript beim Bearbeiten von Personendaten ist WikisyntaxTextMod von PerfektesChaos, das unter anderem die Personendaten in die Standardform bringt, fehlende ALTERNATIVNAMEN-Zeilen etc. hinzufügt, Geburts- und Sterbedatum entlinkt und vieles mehr. --Schnark 11:14, 15. Okt. 2010 (CEST)Beantworten

Ganz, ganz lieben Dank für dieses Helferlein. Es funktioniert total einfach und ist eine echte Arbeitserleichterung. Es hat zwar etwas gedauert, bis "Frau" das Skript an die richtige Stelle bekommen hat, aber nun habe ich wieder ein Stückchen hinzugelernt. Danke!--Silke Ewering 11:10, 16. Okt. 2010 (CEST)Beantworten
Und um die Schnütchen etwas wässriger zu machen, hier der PD-bezogene Teil von WikisyntaxTextMod. Grüße --PerfektesChaos 21:27, 7. Nov. 2010 (CET)Beantworten

Vorschlag: Alternativname fehlt

In der Kopfzeile ist ein anderer Name angegeben als im Lemma, jedoch im Feld |ALTERNATIVNAMEN= kein Eintrag. --Graphikus 13:06, 19. Okt. 2010 (CEST)Beantworten

ID 248

Der Artikel Stefan Tomas taucht fälschlich in der o.a. ID auf. Solch ein Konstellation ist mir schon ein paar Mal aufgefallen. Da scheint mir ein Abfragefehler vorzuliegen. Gruß --Pelz 22:07, 26. Okt. 2010 (CEST)Beantworten

ID 199 (Kurzbeschreibung mit falschem Artikel für eine Frau)

[1] und [2] wurden nicht erkannt. Wenn ich den Quellcode korrekt lese, wird im Prinzip der Fehler ausgegeben, falls im ersten Wort "isch", aber nicht "ische" enthalten ist. Man sollte überprüfen, ob "ischer" enthalten ist. Andim 15:58, 30. Okt. 2010 (CEST)Beantworten

ID 88

Hier taucht imho Charles Rabemananjara falsch auf. Gruß --Pelz 23:27, 1. Nov. 2010 (CET)Beantworten

Das gleiche bei Willy Spühler. Das Problem ist vermutlich, dass in den PD und im Text "A-[[B]]" steht, aber nach "A-B" gesucht wird. Andim 23:44, 1. Nov. 2010 (CET)Beantworten
 Ok, erledigt. Ich hab mir das angeschaut, da denke ich muss ich nix im Skript ändern. -- sk 10:38, 14. Nov. 2010 (CET)Beantworten

ID 7 - Kategorien fehlen

Seit Tagen taucht dort auf, obwohl die Löschung bereits am 13. Oktober erfolgte. --Schnark 11:13, 4. Nov. 2010 (CET)Beantworten

ID 170

Die Artikel:

sollten imho aus der Fehlerliste rausgenommen werden. M.E. sind die richtig. Gruß --Pelz 00:22, 5. Nov. 2010 (CET)Beantworten

 Ok, eingebaut ins Skript. Kommen demnächst nicht mehr. -- sk 10:34, 14. Nov. 2010 (CET)Beantworten
Danke Stefan. Es gab noch einige weitere Änderungswünsche und Problemdiskussionen, die mittlerweile im Archiv 2010 gelandet sind. Kannst Du abschätzen, wann diese eingebaut werden könnten? Keine Hektik, ist ja trotz weniger als 10000 Fehlern noch genug zu tun. Gruß --HS13 17:23, 15. Nov. 2010 (CET)Beantworten

Erstmals seit langer Zeit wieder unter 10.000 Fehler

--Ephraim33 11:21, 9. Nov. 2010 (CET)Beantworten

Das können wir sicher ganz schnell ändern: Alle Artikel mit Personenkats einbauen, die kein Defsort bzw. Sortierung haben.... --Pelz 20:35, 15. Nov. 2010 (CET)Beantworten

Neues Problem auf der Startseite

Unter [3] gibt es seit heute eine weitere Zeile mit Namen "913". Andim 13:47, 15. Nov. 2010 (CET)Beantworten

Das liegt an der neuen ID266 "Geburtsdatum leer". Ähnliche Probleme gab es früher auch schon. Ist sicher nur etwas im Skript verrutscht. HS13 17:13, 15. Nov. 2010 (CET)Beantworten