Zum Inhalt springen

Benutzer:SirJective/Datenbank-Abfragen

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 25. Januar 2005 um 12:03 Uhr durch Srbauer (Diskussion | Beiträge) (Syntaxprüfung Personendaten). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Hier koennt ihr mir Anfragen fuer Abfragen hinterlassen, wenn ihr mich nicht im Wikipedia:Chat trefft.

Eine allgemeinere Seite ist Wikipedia:Datenbank-Abfragen, die ich ebenfalls beobachte und dortige Anfragen zu erfuellen suche.

Eine Liste der meisten in der WP stehenden Datenbank-Abfragen ist hier: Benutzer:SirJective/Seiten mit Datenbank-Abfragen.

Was ich kann und nicht kann

Ich kann selbst Abfragen ausfuehren, die nur folgende Daten erfordern:

  • die Artikel in der neuesten Revision,
  • die Verlinkungsinformation (Links auf vorhandene oder fehlende Artikel),
  • Kategorie-Einordnung der Artikel,
  • die Angaben, wann welches Bild von wem hochgeladen wurde.

Nicht bearbeiten kann ich Abfragen, die eine der folgenden Daten erfordern:

  • aeltere Artikelversionen (weil die Datenbanktabelle einfach zu gross ist um sie regelmaessig runterzuladen),
  • Benutzerdaten (Einstellungen, Emails etc.), und Beobachtungslisten (sind Verschlusssache).

Wenn ihr eine Abfrage wollt, die diese Daten verwendet, wendet euch an meta:Requests for queries, aber denkt daran, dass persoenliche Daten normalerweise nicht rausgegeben werden.

Welche Informationen ich von euch brauche

Die meisten Anfragen sind von der Art "gib mir eine Liste aller Artikel, die XXX enthalten". Da brauche ich neben dem genauen Suchwort (oder den Suchwoertern) noch die Angaben:

  • nur Artikel, oder auch andere Namensraeume (wenn ja welche),
  • ob Redirects, BKS oder andere Seiten ausgeschlossen werden sollen (oder in der Ausgabe markiert werden sollen),
  • welche Daten des Artikels (Titel, letzter Bearbeiter, letzte Bearbeitungszeit, etc.),
  • Sortierreihenfolge (Titel, Zeit, etc.).

Immer brauche ich die Angabe

  • auf welcher Seite das Ergebnis gespeichert werden soll (z.B. eine Benutzer-Unterseite).

Bei komplexeren Anfragen schreibt auf, was euch wichtig ist, ich werde ggf. nachfragen.

Erledigte Anfragen

Ich schreibe meistens die verwendete SQL-Abfrage mit auf die Ergebnisseite oder die zugehoerige Diskussionsseite: Fuer mich als Sicherungskopie und fuer andere die wie ich lernen wollen, wie man die Abfrage realisieren kann.

Artikel mit id="toc"

Alle Artikel, Vorlagen mit 'id="toc"' -> Benutzer:Paddy/Idtoc und Benutzer:Paddy/Idtoc-Vorlage. --SirJective 14:57, 10. Nov 2004 (CET)

Verwaiste Bilder

Liste der verwaisten Bilder, von Benutzer:Darkone erbeten.

Kann ne Weile dauern, da die imagelinks-Tabelle nicht zum Download angeboten wird und die Durchsuchung der Artikelquelltexte ein Programm erfordern würde. --SirJective 17:08, 13. Nov 2004 (CET)

S.a. Wikipedia:Ich_brauche_Hilfe#.22Verwaiste_Bilder.22_Liste (21:42, 16. Nov 2004)
Da laut APPER die Spezialseite Spezial:Unusedimages stets aktuell ist, hat sich die Sache für mich erledigt. --SirJective 21:50, 16. Nov 2004 (CET)

Flugzeuge der Lufthansa

Hallo SirJective, ich hab mir im Chat sagen lassen, du hättest nen WP Dump.
Ich möchte alle Artikel zu Maschinen der Lufthansa (Beispiel) in einen zentralen Artikel Flugzeuge der Lufthansa einlagern. Dazu müsste ich jedoch jeden Artikel zu LH-Flugzeugen finden. Könntest du mir vielleicht ne SQL-Abfrage machen? Danke, Leon ¿! 16:08, 17. Nov 2004 (CET)

Nachtrag: die Infos:

  • Suchbegriff: am besten "Flugzeug der Lufthansa", vielleicht auch abgewandelt wenn du eine bessere idee hast.
  • nur Artikelnamensraum
  • redirects und bks markieren
  • Daten: am besten alles, was du rankriegst
  • Sortierreihenfolge: Titel, alphabetisch, austeigend (A...Z)
  • Speicherort: Auf meiner Diskussionsseite, unter der von mir für dich Überschrift "SQL-Abfrage Flugzeuge der Lufthansa von SirJective"

Danke für deine Mühe. Gruß, Leon ¿! 16:32, 17. Nov 2004 (CET)

Ich kümmere mich darum. --SirJective 16:56, 17. Nov 2004 (CET)
Danke, Sir! --Leon ¿! 18:57, 17. Nov 2004 (CET)

valign="center"

Diese HTML-Eigenschaft ist eigenmtlich völliger Humbug (bewirkt einfach gar nichts, weil es das nicht gibt!). Trotzdem ist das ganze wohl mal in irgendeiner Vorlage gelandet und wuchert seitdem. Bitte mal eine Liste, wo überall! (zwecks Entsorgung) TheK(?!) 21:07, 21. Nov 2004 (CET) Und irgendwo bei mir ablegen ;-) --Paddy 21:12, 21. Nov 2004 (CET)

goto Benutzer:Paddy/valigncenter :) --SirJective 14:11, 22. Nov 2004 (CET)
Du bist ja immer echt fix ;-) Vielen herzlichen Dank wieder einmal. --Paddy 16:47, 22. Nov 2004 (CET)

subst:TOC

Ich würde gerne wissen wo überall:

__NOTOC__
----
<div style="text-align:center;">
[[#A|A]] [[#B|B]] [[#C|C]] [[#D|D]] [[#E|E]] [[#F|F]] [[#G|G]] [[#H|H]] [[#I|I]] 
[[#J|J]] [[#K|K]] [[#L|L]] [[#M|M]] [[#N|N]] [[#O|O]] [[#P|P]] [[#Q|Q]] [[#R|R]] 
[[#S|S]] [[#T|T]] [[#U|U]] [[#V|V]] [[#W|W]] [[#X|X]] [[#Y|Y]] [[#Z|Z]]
</div>
----

In als Text ersetzt wurde also mittels {{subst:TOC}}. Vielleicht lässt sich das finden und ändern. Vielen Dank. mfg --Paddy 18:12, 18. Nov 2004 (CET)

Bitte schön: Benutzer:Paddy/subst_TOC. --SirJective 20:00, 18. Nov 2004 (CET)
Das kann doch nicht alles gewesen sein? Ich kenne noch einige so. Hmm. liegt es vielelicht an der Vielfalt: Vorlage_Diskussion:TOC#Meinungsbild? --Paddy 18:51, 20. Nov 2004 (CET)
  1. Idtoc
  2. Idtoc-Vorlage
  3. BR

Bitte beim übernächsten oder drittnächsten dump aktualisieren ;-) --Paddy 19:19, 20. Nov 2004 (CET)

Seiten im Vorlagen-Namensraum

Hallo, ich habe gesehen, dass Du für die Seite Wikipedia:Seiten_im_Vorlagen-Namensraum eine schöne SQL-Abfrage zusammengebastelt hast. Mir ist jedoch aufgefallen, dass einige Vorlagen dort nicht auftauchen. Daher die Frage, ob das daran liegt, dass die Seite nicht aktuell ist oder ob dafür an den Abfragen noch etwas geändert werden muss.

Konkret aufgefallen ist mir das bei der Vorlage:Navigationsleiste Verbandsgemeinden im Westerwaldkreis. Diese taucht zwar auf, es gibt aber noch untergeordnete Navigationsleisten, die z.B. hier verlinkt sind und in der großen Liste nicht auftauchen.

Es wäre nett, wenn Du Dir das mal angucken würdest. Danke!

Hallo, die Voll-Aktualisierung ist schon eine Weile her, alles nach dem September wurde manuell eingetragen. Die genannten Vorlagen sind neuren Datums und vermutlich einfach übersehen worden. Mit dem nächsten Datenbank-Dump werde ich die Liste aktualisieren. --SirJective 21:40, 24. Nov 2004 (CET)
Hallo, super und vielen Dank für Deine Hilfe!
Hallo, habe gerade gesehen, dass Du die Übersicht jetzt neu erstellt hast. Nochmals besten Dank!

Kategorien mit höchstens 2 Artikeln

Hallo, ist es möglich, eine Liste mit allen Kategorien, die höchstens 2 Artikel enthalten, zu erstellen? Da dürften einige bei sein, die nicht wirklich gebraucht werden... --Ezrimerchant 19:28, 13. Dez 2004 (CET)

Ja, das ist möglich. Mit dem nächsten Dump werd ich die Ergebnisse hochladen, wenn du mir bis dahin einige Fragen beantwortest:
  • Soll ich Unterkategorien und andere WP-Seiten (Disk., Benutzer etc.) wie Artikel mitzählen (das ist einfacher) oder nur Artikel?
  • Soll ich die Liste auftrennen in vorhandene Kategorien und nichtvorhandene Kategorien (d.h. Kategorien die zwar verlinkt, aber nicht vorhanden sind)?
  • Soll ich dir alle gefundenen Kategorien geben, oder nur die ersten 100, 200 etc.?
  • Wo soll ich die Ergebnisliste speichern?
--SirJective 22:26, 13. Dez 2004 (CET)
Siehe auch Benutzer:Ezrimerchant/Sehr kleine Kategorien und Diskussion. --SirJective 16:06, 14. Dez 2004 (CET)

jahrestage / linkspam

Benutzer:Hoch auf einem Baum lässt sich seit Dezember 2004 auf der Seite Bebilderte Jahrestage Listen der bebilderten Artikel geben, die von Datumsartikeln verlinkt sind.

Die gewünschte Beachtung von Redirects hatte ich mal, jetzt aber wieder nicht mehr: Falls der Datumsartikel über einen Redirect auf einen bebilderten Artikel verweist, sollte dieser geliefert werden.

Wir überlegen noch, die gelieferten Links in einer Kopie des Datumsartikels hervorheben zu lassen, um die Relevanz der Artikel schneller einschätzen zu können. Ein Möglichkeit dazu ist, nur die gefundenen Links im Text zu behalten, oder die Links optisch stärker hervorzuheben.

Eine von dieser Anfrage unabhängige Idee ist, die Artikel der Vorlagen "Hauptseite Jahrestage TT. Monat" halbautomatisch im Datumsartikel zuverlinken, falls der Eintrag noch fehlt. Dabei müsste der richtige Abschnitt (Geboren/Gestorben/Ereignisse) und darin die richtige Zeile gefunden werden. Die Identifikation der nicht verlinkten Artikel ist zwar relativ einfach, wünschenswert wäre aber eine Möglichkeit, den Artikel gleich richtig in den Datumsartikel einzutragen.


Linkspam der Form "http://%tiscali.%/" wurde am 24. Dez 2004 auf Benutzer:Hoch auf einem Baum/Tiscali gesammelt.

Bilder

Huhu, ich mal wieder. Auf Benutzer:Crux/Linksschreibung hätte ich demnächst gerne die 100 ältesten mit {{Bild-Lizenz-unbekannt}} (älteste zuerst, ohne Datumsangabe) und die 50 ältesten mit {{LöschantragBild}} (älteste zuerst, mit Datumsangabe). Und einen kleinen Salat. --Danke ;) Crux 16:11, 2. Jan 2005 (CET)

Reicht's, wenn ich es mit dem nächsten Dump mache, oder soll ich die Daten vom 30.12. verwenden? --SirJective 18:08, 4. Jan 2005 (CET)
Mit dem nächsten reicht es auch, wenn du beim unbekannt-Baustein die ältesten 100 ausgibst. --Gruß Crux 21:42, 4. Jan 2005 (CET)
Erledigt, und hier dein Salat:
http://www.estarcion.com/shock/food/images/duanebday02/Pages/Image1.html ;)
--SirJective 18:44, 11. Jan 2005 (CET)
Danke *mampf* =) --Crux 15:35, 13. Jan 2005 (CET)

Neue Anfragen

Schreibt hier neue Anfragen auf. Ich nutze diese Seite ebenfalls um mir Anfragewuensche aus dem Chat zu merken, die ich nicht sofort ausfuehren kann.

Wikiquote

Hallo, es geht um das Finden von langen Zitaten, die Urheberrechtlich bedenklich sind. Rechtlich besonders bedenklich sind in der Zitatsammlung Wikiquote alle Zitate, die nicht mehr als Kurzzitat gelten können. Da alle Zitate in "Anführungszeichen" stehen sollten und durch Aufzählungszeichen getrennt sind müßte es eigentlich möglich sein die bedenklich langen Zitate durch eine SQL-Abfrage zu finden oder? --Timt 00:23, 17. Dez 2004 (CET)

Hallo Timt,
das Projekt Wikiquote scheint mehrere Diskussionsseiten zu haben, wo Urheberrechtsfragen besprochen werden. Hast du dort schon eine Seite, auf der speziell die langen Zitate thematisiert werden?
Ich kann den Dump von wikiquote runterladen und versuchen, lange Zitate zu identifizieren. Ob es durch reines SQL geht, muss ich schauen (ggf. erweitere ich mein JAVA-Programm). Ich setz mich bei Gelegenheit ran. --SirJective 12:17, 17. Dez 2004 (CET)
Im Moment eilt es noch nicht, da es im Moment noch einigermassen überschaubar ist, wer was anlegt und wie gross es ist, aber in letzter Zeit nimmt die Beteiligung doch zu und dann könnte es unübersichtlich werden. Das mit der Diskussionsseite ist nee gute Idee, ich werde es wohl mal in die Richtlinien aufnehmen. --Timt 22:10, 17. Dez 2004 (CET)

Erinnerung

Ich sollte dich doch an mein Kat:Person-Abo erinnern :-) Danke, Gruß, Leon ¿! | 1,2,3 23:13, 7. Jan 2005 (CET)

I.O.: Benutzer:LeonWeber/Artikel_in_Kategorie:Person, mit jedem Dump erneuern. --SirJective 18:44, 11. Jan 2005 (CET)

math durch sup oder sub ersetzen

Hallo SirJective, im IRC riet man mir, mich mit folgender Bitte an dich zu wenden. Ich würde gerne in den mathematisch orientierten Artikeln ein wenig aufräumen und dort, wo unnötigerweise der math-Tag verwendet wurde, sub-Tags einbauen, z.B. statt Ai usw. Hierzu wäre eine vernünftige Datenbank abfrage mit entsprechenden regulären Ausdrücken hilfreich, die eine Liste der Artikel erzeugt, die man daraufhin abklopfen kann. In erster Näherung könnten das z.B. alle math-Tags sein, die nicht mehr als 3 Zeichen enthalten, da es sich dabei meist um derartige Kurzausdrücke mit Index oder Exponent handeln dürfte, die man ersetzen kann. Vielleicht fällt dir auch noch was Schlaueres ein. Kannst du mir mitteilen, ob und falls ja wann eine solche Liste machbar wäre? Die Liste kannst du z.B. unter Benutzer:Mkleine/Ablage speichern. Viele Grüße --Mkleine 00:28, 13. Jan 2005 (CET)

Gibt es für dieses Vorhaben Zustimmung seitens anderer Bearbeiter mathematischer Artikel? Bitte diskutiere dieses Vorhaben zunächst auf der Projektseite oder der Portalseite. Eine zentrale Frage, die bisher noch nicht zufriedenstellend geklärt wurde, ist, wo math-Tags nötig oder unnötig sind, und wo sie erwünscht oder unerwünscht sind.
Meine Meinung dazu ist: Will man reines HTML verwenden, dann sollte man Ai schreiben. Damit erhält man in der Ausgabe fast dasselbe Ergebnis wie mit (die Schriftart ist anscheinend eine andere). Andererseits bin ich im Hinblick auf eine zukünftige Erweiterung durch MathML oder andere Darstellungsformen, und zusätzlich zum Zwecke einer semantischen (statt einer syntaktischen) Textauszeichnung, eher dazu geneigt, die vorhandenen mathematischen Verwendungen von sup und sub durch math ersetzen zu wollen. --SirJective 11:43, 13. Jan 2005 (CET)
Ich verweise in dieser Frage zunächsteinmal auf das folgende Zitat aus Wikipedia:TeX: "Bei Fragen zum Stil bezüglich des Setzens von mathematischem Code, siehe WikiProjekt Mathematik. Insbesondere sollte dies als Teil einer Zeile oder Fließtextes vermieden werden, da die Formeln in der Zeile nicht richtig ausgerichtet werden und die Schrift zu groß ist." Diese Richtlinie gilt imho seit vielen Monaten unverändert. Ich persönlich bin nicht an politischen Diskussionen dieser Art interessiert und war davon ausgegangen, dass die genannte Richtlinie eindeutig ist. Ich wäre bereit, diese Richtlinie ggf. wie oben beschrieben umzusetzen. Sollte die Frage tatsächlich ein diskussionswürdiges Thema sein, so sollte dies von den Mathematikern gelöst werden - ich ziehe mich dann hiermit wieder zurück. --Mkleine 12:16, 13. Jan 2005 (CET)
Ja du hast recht, dort und auch auf des Projektseite wird empfohlen, für einfache Ausdrücke HTML zu verwenden und komplexere Ausdrücke abzusetzen. Ich werde die Frage nach der Akzeptanz dieser Regel an geeigneter Stelle stellen. Sobald ein klares Meinungsbild vorliegt, melde ich mich bei dir. --SirJective 12:43, 13. Jan 2005 (CET)

Personendaten

Hallo SirJective, ich weiß nicht, inwieweit Du in die DVD-Problematik und die Erfassung der Personendaten involviert bist. Ziel ist hierbei, möglichst alle Personen mit den Personendaten zu versehen - Deadline für die DVD ist hierbei Ende Februar (in ca. 6 Wochen). Im Moment dürfte es über die Kategorien noch kein Problem sein, entsprechend Artikel zu finden, aber ab einem gewissen Punkt wäre es sicherlich notwendig, eine Übersicht über die Artikel zu haben, die die Personendaten noch benötigen - hilfreich wäre es sicherlich jetzt schon. Könntest Du dazu die Hierarchie der Personenkategorien entsprechend abklappern und entsprechende Listen erstellen? -- srb 04:40, 15. Jan 2005 (CET)

Ich hab davon schonmal gelesen. ;) Ich werd gern versuchen, dir dabei behilflich zu sein.
Wenn du mir nun detailliert beschreibst, was du möchtest, kann ich dir genau das liefern. :) Ich verstehe dich jetzt so, dass du alle Artikel in Kategorie:Person und Unterkategorien haben möchtest, die die Personendaten noch nicht verwenden. Dabei sollten sicherlich bestimmte Unterkategorien ausgeschlossen werden, wie Fiktive Person, oder? Gibt es noch andere Kategorien, die ein- oder ausgeschlossen werden sollen? --SirJective 11:25, 15. Jan 2005 (CET)
Ja, so in etwa hatte ich mir das vorgestellt: alle Artikel in Kategorie:Person und Unterkategorien, in denen die Vorlage:Personendaten nicht eingebunden ist. Bekannte Ausnahmen: Kategorie:Fiktive Person und Kategorie:Personengruppe. Bei den derzeit mehr als 1000 Unterkategorien könnte vielleicht noch die eine oder andere Kat wegfallen. Beim Abarbeiten wird man vielleicht auf weitere Ausnahmen stossen und könnte dann entsprechende Anmerkungen machen (auch einzelne Artikelausnahmen, z.B. enthält die Kategorie:Astronom selbst standardmäßig nur Nicht-Personenartikel, die Artikel über Astronomen sind in den entsprechenden Unterkats - allerdings könnte gelegentlich doch mal ein Personenartikel drinstehen, wenn sich jemand mit den Unterkats nicht auskennt; vermutlich gibt es in anderen Fachbereichen ähnliche Ausnahmen), so dass diese beim nächsten Durchlauf ausgeschlossen werden - für die erste Version würde ich allerdings erst man nichts weiter ausschließen. -- srb 20:23, 15. Jan 2005 (CET)
Im Dump vom 7. Januar hab ich 1637 Kategorien gefunden, die unter Person aber nicht unter Fiktive Person oder Personengruppe liegen (nur so nebenbei: beginnt man die Zählung bei Kategorie:Person mit Stufe 1, dann liegen die tiefsten Kategorien auf Stufe 7). Eine Liste der darin vorhandenen Artikel ohne Personendaten wird demnächst geliefert. --SirJective 22:32, 15. Jan 2005 (CET)
Ich hab 32.879 Artikel in den genannten Kategorien gefunden, davon 27.406 ohne die Personendaten. Soll ich die komplett alphabetisch hochladen, oder nach Kategorien sortiert (das aber nicht hierarchisch, sondern alphabetisch)? --SirJective 14:09, 16. Jan 2005 (CET)
Schwer zu sagen, nach Kategorien sortiert wäre vielleicht das beste, da kann man auch leichter kats identifizieren, die man beim nächsten Durchlauf weglassen könnte. Bleibt noch das Problem der Menge: 27.406 Artikel auf einer Seite wäre wohl etwas viel, da wäre wohl eine Aufteilung in Seiten mit größenordnungsmäßig 1000 Artikeln sinnvoll. -- srb 15:29, 16. Jan 2005 (CET)
Eine irgendwie geartete Aufteilung der Artikel hatte ich sowieso vor. Die Liste mit 28.000 Bildtiteln, die ich für LeonWeber hochgeladen hatte, ist mit ihren 800KB doch arg groß geworden *g*
Da die meisten Artikel in mehrere Kategorien eingeordnet sind, hab ich jetzt noch das Problem, welche Zuordnung ich da wählen sollte. Wenn ich die Artikel nach der Kombination ihrer Personen-Kategorien gruppiere, dann erhalte ich 992 Artikel, die nur in "Mann" eingeordnet sind, gefolgt von 560 Artikeln "Deutscher, Mann", 500 "Person", 210 "Frau", 201 "Mann, US-Amerikaner", aber weiter unten z.B. auch 57 mal "Franzose, General, Mann, Marschall_von_Frankreich, Militärperson, Militärperson_(Frankreich)". Über dieses Nebeneinander von Ober- und Unterkategorien werde ich mich ganz bestimmt nicht aufregen! ;)
Von den 10.000 derartigen Kategorie-Kombinationen treten über 7000 nur einmal auf. Ein kleines Spiel für langweilige Stunden könnte von dieser Art sein:
Finde den Artikel, der in diese und nur diese Personenkategorien eingeordnet ist: "Mann, Politiker_(UN), Präsident_der_Europäischen_Kommission_(Europa), Staatsminister_(Luxemburg), Vorsitzender_der_Demokratischen_Partei_(Luxemburg)". *g*
Ich werd mir noch eine geeignete Aufteilung überlegen, aber wenn du willst, kann ich die 992 "reinen Männer" schonmal hochladen. --SirJective 20:23, 16. Jan 2005 (CET)
Die Kategorien Mann/Frau, Geboren/Gestorben, Nationalität (Deutscher) sehe ich eigentlich eher als "Hilfskategorien". Wenn andere Kats drin sind, ist es wohl sinnvoller, die Gruppierung danach zu machen - die eine oder andere Hilfskat könnte man höchstens dazunehmen, um einen größeren "Brocken" aufzuteilen. Wenn Du die Nur-Männer schon mal hochlädst, kann man damit ja schon mal anfangen. Zudem könnte man die neue Liste dann schon mal bei den Personendaten bekannt machen.
PS: Wenn das nebeneinander von Ober- und Unterkategorien in den Artikeln das einzige Problem wäre, wäre es ja schon schön - das ganze Gestrüpp aus den 1637 Kategorien ist ein absoluter Wildwuchs. Wenn die Personenartikel mal halbwegs vollständig in die Kats verstaut sind muss auf alle Fälle mal das Großreinemachen anfangen und alles wieder gesundgeschrumpft werden - das Problem wird nur sein, jemand zu finden, der sich mit dem Frühjahrsputz beschäftigt ;-) -- srb 20:42, 16. Jan 2005 (CET)
Hier ist erstmal eine Liste von 1900 Männern, Frauen, deutschen Männern und deutschen Frauen: Benutzer:SirJective/Personen ohne Personendaten/Mann --SirJective 12:36, 17. Jan 2005 (CET)
Sehr nützlich, die Liste :-) Soll man die abgearbeiteten Einträge manuell austragen oder wird die Liste von dir regelmäßig aktualisiert? --Popie 17:18, 17. Jan 2005 (CET)
Am besten die Artikel mit Personendaten entfernen - dann braucht der nächste, der an der Liste arbeitet, nicht erst lange zu suchen, was noch bearbeitet werden muss. -- srb 17:26, 17. Jan 2005 (CET)
Hier mal eine kleine Auswahl, sozusagen ein weiteres Zwischenergebnis: Benutzer:SirJective/Personen ohne Personendaten/1 --SirJective 16:42, 18. Jan 2005 (CET)
Danke.
Zu Artikel, die zwar korrekt in eine "echte Person"-Kategorie eingeordnet sind, aber keine Personendaten brauchen (gibt's sowas eigentlich?): ja, die gibt's - dabei sollte es sich aber im wesentlichen um Listen handeln, evt. noch "Berufs"-Beschreibungen. -- srb  17:05, 18. Jan 2005 (CET)

unkategorisierte Personen

Wenn ich mich mal einmischen darf: Vielleich kann man ja auch alle Artikel durchgehen, die die Zeichenfolge "(* ... † ...) enthalten, was auf eine Biografie und damit eine Person hindeuten würde. Damit würden alle Personen erfasst, die nicht in der KAtegorie Person stehen. Wäre vielleicht etwas für eine zweite Liste "Biografien ohne Kategorie". Stern !? 11:29, 15. Jan 2005 (CET)

Der Vorschlag von Stern (die Suche nach nicht kategorisierten Personen bzw. nicht in Personenkats einsortierten) ist auch nicht schlecht - mir sind schon diverse Personenartikel untergekommen, die nicht in einer Personenkategorie einsortiert waren, sondern unter einer Stadt/Land/Themengebiets-Kategorie. Die Zeichenfolge "(* ... )", "(† ...)", "(* ... † ...)" am Anfang des Artikels würden zwar noch nicht alle Personenartikel abdecken, aber zumindest einen großen Teil. Für eine umfassendere Suche entsprechende regular Expressions zu finden, ist wahrscheinlich nicht so einfach (Beispiele für mögliche Formulierungen im Artikel stehen z.B. hier). Wäre auch in dieser Richtung etwas möglich? -- srb 20:23, 15. Jan 2005 (CET)
Da dies eine zwar verwandte, aber andere Aufgabe ist, hab ich sie von der obigen abgetrennt. Dies ist eine gute Idee, die sicher auch bei Gelegenheit umgesetzt werden wird. Danke schonmal für die Formatbeispiele, mit denen müsste sich was machen lassen. --SirJective 22:32, 15. Jan 2005 (CET)
Mit den drei obigen "Suchbegriffen" hab ich jetzt eine Liste von etwa 1800 Artikeln: Benutzer:SirJective/Unkategorisierte Personen. --SirJective 20:59, 16. Jan 2005 (CET)

Kurzes Brainstorming nach den ersten paar Buchstaben:

  1. Es sind eine ganze Reihe von Einträgen vorhanden, bei denen im Text eine Person mit Lebensdaten erwähnt wird - wenn die Anwendung des Suchstrings auf den ersten Teil des Artikels (evtl. erster Absatz) eingeschränkt würde, dürfte die Anzahl der false-positive deutlich zurückgehen, ohne Auswirkungen auf die echten Personenartikel.
  2. Eine weitere interessante Sache wären dann noch Listen mit den "verworfenen" Artikeln - m.W. gibt es derzeit noch keine Listen, die auch die ausschließlich in Wartungskategorien eingeordneten Artikel mit abdecken. -- srb  17:18, 18. Jan 2005 (CET)

Wenn ich die Abfrage auf den ersten Absatz beschränke (funktioniert nur, wenn keine Leerzeile davor ist), erhalte ich noch 1400 Personen. Ich lade diese Liste hoch.

Nach einem groben Vergleich sind zwar tatsächlich die meisten Nichtpersonenartikel draußen, aber leider doch auch diverse Personen - bei Stichproben war Grund jeweils ein Bild oder eine stub-Kennzeichnung in der ersten Zeile, vermutlich sind bei einigen dann auch noch iwiki-Links oben angeordnet. So bleiben doch zu viele auf der Strecke, bleiben wir doch lieber beim Scan über den kompletten Artikel - sorry für die Mehrarbeit. -- srb  20:31, 18. Jan 2005 (CET)
Kein Problem - du (und andere) musst mit der Liste arbeiten können. Die uninteressanten Artikel werden dann jetzt einmal ausgesondert, und später nicht mehr aufgelistet. --SirJective 22:07, 18. Jan 2005 (CET)

Den zweiten Satz musst du mir näher erklären :) --SirJective 19:36, 18. Jan 2005 (CET)

Wie wär's mit: unkategorisierte Artikel (incl. Artikel, die nur in Wartungskategorien wie Stub, Meyers etc. eingeordnet sind), die keine Personen sind? ;-) -- srb  20:10, 18. Jan 2005 (CET)
*g* Komplett unkategorisierte Artikel werden in irgendeiner Spezialseite gesammelt, und für Artikel in Wartungskategorien gibt's die Wartungskategorien :-) --SirJective 22:07, 18. Jan 2005 (CET)
*g* ist gut ;-)
  1. Spezial:Uncategorizedpages listet prinzipiell die unkategorisierten Artikel auf, aber durch das Limit auf 5000 Artikel geht die Liste grade mal bis G - wäre aber nicht der Hauptaspekt meines Vorschlags, da Benutzer:Bierdimpfl bereits eine vollständige Liste anbietet, die mir bereits sehr hilfreich war.
  2. "für Artikel in Wartungskategorien gibt's die Wartungskategorien" - stimmt schon, aber wie seh ich den Artikeln darin an, welche davon schon einer "regulären" Kategorie zugeordnet sind - und welche nur die Wartungskat haben? Im Moment kümmern sich nur sehr wenige um die Wartungskats, da dort ein wildes Sammelsurium aus allen Fachbereichen vorliegt. Von den meisten dieser Artikel wissen die entsprechenden Projekte/Portale wahrscheinlich nichts - erst wenn dann mal ein LA für einen Artikel gestellt wird, fängt das große Jammern an - "wie kann man denn nur".
Die Idee kann man schön mit Aschenputtel vergleichen: die Guten ins Töpfchen (Liste mit potentiellen Personenartikeln), die Schlechten ins Kröpfchen (Liste mit dem Rest) - zwei Fliegen mit einer Klappe, wobei mir eine Beschränkung auf Punkt 2 sogar noch lieber wäre, aber zusätzlichen Aufwand erfordern würde ;-) -- srb  22:52, 18. Jan 2005 (CET)
Ich kann dir eine Liste der Artikel liefern, die nur in (und in wenigstens einer) Wartungskategorien stehen. Die nötigen Abfrageprinzipien zur Beschaffung von Unterkategorien und darin stehenden Artikel hab ich ja jetzt. Die (derzeit ja etwa 1800) Personen-Kandidaten kann ich da bestimmt auch noch ausschließen. Da verbleiben dann sicher immer noch viele Artikel. Wäre das dann eine "Meta-Wartungsliste"?
Das wäre optimal, wobei Du vielleicht die Kategorie:Wikipedia:Löschkandidat ignorieren solltest, da doch einiges davon gelöscht wird - falls nicht, würde der Artikel (wenn nicht anderwärtig kategorisiert) später auf dieser Liste oder bei den unkategorisierten auftauchen. Was die Anzahl betrifft, da waren es Anfang Dezember irgendwo im Bereich 7 bis 8.000 - wieviele davon unkategorisiert waren, weiß ich allerdings nicht. Und ja, das wäre dann wohl eine Meta-Meta-Seite ;-) -- srb  19:52, 20. Jan 2005 (CET)
Meinst du wirklich, dass wir eine solche Liste brauchen können? Wenn sich Leute finden, die die Liste abarbeiten - indem sie sowohl den Wartungsgrund beheben als auch die Artikel kategoriesieren - dann lad ich gern einen Teil der Liste hoch. --SirJective 14:19, 21. Jan 2005 (CET)
Direkt zum Beheben des Wartungsgrundes werden die Listen mit ziemlicher Sicherheit nicht beitragen - wie ich schon geschrieben habe, geht es mir da vor allem um die Kategorisierungsfragen, die sind m.E. bei den Artikeln in den Wartungskats noch wichtiger als bei den gänzlich unkategorisierten Artikeln. Nimm z.B. mal die Liste Benutzer:SirJective/Kurze Artikel/Astronomie, die Du vor einiger Zeit erstellt hast als es um eine Untergliederung der Stubs ging: Die Liste ist sehr interessant, hat jedoch 2 entscheidende Mängel:
  1. enthält die Liste nur Artikel, die bereits in der Astro-Hierarchie einsortiert sind - und eben nicht diejenigen, die möglicherweise noch nicht kategorisiert sind oder ausschließlich in einer Wartungskat hängen. Dies kann nur verbessert werden, wenn man die Kategorisierung (vor allem der Artikel in Wartungskats) voranbringt.
  2. setzt sich die Liste zum großen Teil aus bekannten Problemkats zusammen, die uns ein nahezu gesprächsresistenter IP-User mit Mini-Stubs zuknallt.
Der 2. Punkt ließe sich problemlos durch das Ausklammern der 4 bis 5 Problemkats angehen - für den ersten Punkt braucht man allerdings einen vernünftigen Überblick, und dahin zielt mein Vorschlag. -- srb  14:49, 21. Jan 2005 (CET)
Bei geeigneten Löschanträgen sollte dann vllt. auf die Listen und Kategorien hingewiesen werden, in denen der Löschkandidat steht - irgendwie müssen sie doch davon erfahren! --SirJective 23:43, 18. Jan 2005 (CET)
*g* Das versteh ich jetzt nicht: die Kats stehen in den Artikeln, und die Liste soll eigentlich nur zum kategorisieren dienen. -- srb  19:52, 20. Jan 2005 (CET)
Ich sprach nicht über die Liste der nur in Wartungskategorien eingeordneten ArtikelTM, sondern meinte folgendes:
Es gibt einen Haufen Artikel, die zwar in irgendeiner Wartungsliste, aber in keiner Wartungskategorie stehen (kurze, verwaiste, mit Interwiki-Problemen etc.). Möglicherweise ist es hilfreich, auf die Wartungslisten hinzuweisen, in denen ein Löschkandidat steht. --SirJective 14:19, 21. Jan 2005 (CET)
Bei den LAs selbst würde es m.E. nicht viel bringen - aber die entsprechenden Projekte/Portale im Kontext der LAs immer wieder mal auf diese Listen hinzuweisen, wäre sicherlich keine schlechte Idee. -- srb  14:49, 21. Jan 2005 (CET)

Beim Abarbeiten der Liste ist mir aufgefallen, dass in diversen Artikeln zwar bereits PD drin waren, aber noch keine Kategorien - es wäre deshalb sinnvoll, beim nächsten Dump eine zusätzliche Prüfung auf das Vorhandensein der PD-Vorlage durchzuführen. Gruß -- srb  10:55, 25. Jan 2005 (CET)

Schauspieler und Filmtitel ohne Vorlage

Hallo Christian,
zusammen mit Benutzer:BLueFiSH.as hatte ich mich gestern der Vorlage:IMDb Titel und der Vorlage:IMDb Name angenommen, mit deren Hilfe die Links zur Internet Movie Database vereinheitlich werden können. Könntest Du uns zur Weiterführung unserer Arbeit folgende Listen bereitstellen:

Ziel dieser Abfragen ist es, alle Artikel zu ermitteln, die bisher nicht auf die IMDb verweisen oder einen Link haben, ohne die standartisierte Vorlage. Bei Rückfragen gib einfach Bescheid. Herzlichen Dank -- Wohltäter 19:13, 20. Jan 2005 (CET)

Das lässt sich einrichten. Im Dump vom 7. Januar finde ich
  • 993 Filmtitel in der Kategorie, keiner davon hat die Vorlage,
  • 2635 Einträge in den genannten Schauspieler-Kategorien und Unterkategorien, davon 475 mit und 2160 ohne die Vorlage.
Damit eure bisherige Arbeit sichtbar wird, müsstet ihr bis zum nächsten Dump warten (der eigentlich schon überfällig ist). Auf welcher Seite soll ich euch die Listen (nach Vornamen sortiert) speichern? --SirJective 14:11, 21. Jan 2005 (CET)

Uuuh ... das klingt nach Arbeit. Aber OK. Uns würde auch schon der Stand 7. Januar reichen. Kurzer Hinweis noch: bis letzte Wocher gab es noch die reichlich unscharfe Kategorie: Vorlage:Imdb. Alle Artikel, die diese Vorlage nutzten sind aber schon auf die neuen Vorlagen umgestellt. Leg's einfach unter Benutzer:Triebtäter/IMDb ab. Herzlichen Dank für Deine Unterstützung. -- Wohltäter 18:31, 22. Jan 2005 (CET)

Syntaxprüfung Personendaten

Mir sind mittlerweile mehrere Syntaxprobleme bei den PD aufgefallen, z.T. sind mir die Fehler auch selbst unterlaufen (ich hoffe, ich habe sie alle gemerkt):

  1. Bei der Vorlage müssen alle Feldnamen vorhanden sein, sonst kommt es zu einem unschönen Einfügen des Feldnamens in doppelten geschweiften Klammern
  2. Es darf kein Ungleichgewicht bei eckigen Klammern vorhanden sein, sonst kommt die ganze Vorlage aus dem Takt (passiert leicht beim Copy&Paste)

Könntest Du dazu einen Check durchführen? (zu Punkt 2: ist im Prinzip ein Teil Deiner Liste über Klammerungleichgewichte, aber eine getrennte Liste wäre wg. des Termindrucks m.E. sinnvoll). -- srb  11:03, 25. Jan 2005 (CET)