Benutzer:SirJective/Datenbank-Abfragen

Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 15. Januar 2005 um 23:32 Uhr durch SirJective (Diskussion | Beiträge) (Personendaten). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Hier koennt ihr mir Anfragen fuer Abfragen hinterlassen, wenn ihr mich nicht im Wikipedia:Chat trefft.

Eine allgemeinere Seite ist Wikipedia:Datenbank-Abfragen, die ich ebenfalls beobachte und dortige Anfragen zu erfuellen suche.

Eine Liste der meisten in der WP stehenden Datenbank-Abfragen ist hier: Benutzer:SirJective/Seiten mit Datenbank-Abfragen.

Was ich kann und nicht kann

Ich kann selbst Abfragen ausfuehren, die nur folgende Daten erfordern:

  • die Artikel in der neuesten Revision,
  • die Verlinkungsinformation (Links auf vorhandene oder fehlende Artikel),
  • Kategorie-Einordnung der Artikel,
  • die Angaben, wann welches Bild von wem hochgeladen wurde.

Nicht bearbeiten kann ich Abfragen, die eine der folgenden Daten erfordern:

  • aeltere Artikelversionen (weil die Datenbanktabelle einfach zu gross ist um sie regelmaessig runterzuladen),
  • Benutzerdaten (Einstellungen, Emails etc.), und Beobachtungslisten (sind Verschlusssache).

Wenn ihr eine Abfrage wollt, die diese Daten verwendet, wendet euch an meta:Requests for queries, aber denkt daran, dass persoenliche Daten normalerweise nicht rausgegeben werden.

Welche Informationen ich von euch brauche

Die meisten Anfragen sind von der Art "gib mir eine Liste aller Artikel, die XXX enthalten". Da brauche ich neben dem genauen Suchwort (oder den Suchwoertern) noch die Angaben:

  • nur Artikel, oder auch andere Namensraeume (wenn ja welche),
  • ob Redirects, BKS oder andere Seiten ausgeschlossen werden sollen (oder in der Ausgabe markiert werden sollen),
  • welche Daten des Artikels (Titel, letzter Bearbeiter, letzte Bearbeitungszeit, etc.),
  • Sortierreihenfolge (Titel, Zeit, etc.).

Immer brauche ich die Angabe

  • auf welcher Seite das Ergebnis gespeichert werden soll (z.B. eine Benutzer-Unterseite).

Bei komplexeren Anfragen schreibt auf, was euch wichtig ist, ich werde ggf. nachfragen.

Erledigte Anfragen

Ich schreibe meistens die verwendete SQL-Abfrage mit auf die Ergebnisseite oder die zugehoerige Diskussionsseite: Fuer mich als Sicherungskopie und fuer andere die wie ich lernen wollen, wie man die Abfrage realisieren kann.

Artikel mit id="toc"

Alle Artikel, Vorlagen mit 'id="toc"' -> Benutzer:Paddy/Idtoc und Benutzer:Paddy/Idtoc-Vorlage. --SirJective 14:57, 10. Nov 2004 (CET)

Verwaiste Bilder

Liste der verwaisten Bilder, von Benutzer:Darkone erbeten.

Kann ne Weile dauern, da die imagelinks-Tabelle nicht zum Download angeboten wird und die Durchsuchung der Artikelquelltexte ein Programm erfordern würde. --SirJective 17:08, 13. Nov 2004 (CET)

S.a. Wikipedia:Ich_brauche_Hilfe#.22Verwaiste_Bilder.22_Liste (21:42, 16. Nov 2004)
Da laut APPER die Spezialseite Spezial:Unusedimages stets aktuell ist, hat sich die Sache für mich erledigt. --SirJective 21:50, 16. Nov 2004 (CET)

Flugzeuge der Lufthansa

Hallo SirJective, ich hab mir im Chat sagen lassen, du hättest nen WP Dump.
Ich möchte alle Artikel zu Maschinen der Lufthansa (Beispiel) in einen zentralen Artikel Flugzeuge der Lufthansa einlagern. Dazu müsste ich jedoch jeden Artikel zu LH-Flugzeugen finden. Könntest du mir vielleicht ne SQL-Abfrage machen? Danke, Leon ¿! 16:08, 17. Nov 2004 (CET)

Nachtrag: die Infos:

  • Suchbegriff: am besten "Flugzeug der Lufthansa", vielleicht auch abgewandelt wenn du eine bessere idee hast.
  • nur Artikelnamensraum
  • redirects und bks markieren
  • Daten: am besten alles, was du rankriegst
  • Sortierreihenfolge: Titel, alphabetisch, austeigend (A...Z)
  • Speicherort: Auf meiner Diskussionsseite, unter der von mir für dich Überschrift "SQL-Abfrage Flugzeuge der Lufthansa von SirJective"

Danke für deine Mühe. Gruß, Leon ¿! 16:32, 17. Nov 2004 (CET)

Ich kümmere mich darum. --SirJective 16:56, 17. Nov 2004 (CET)
Danke, Sir! --Leon ¿! 18:57, 17. Nov 2004 (CET)

valign="center"

Diese HTML-Eigenschaft ist eigenmtlich völliger Humbug (bewirkt einfach gar nichts, weil es das nicht gibt!). Trotzdem ist das ganze wohl mal in irgendeiner Vorlage gelandet und wuchert seitdem. Bitte mal eine Liste, wo überall! (zwecks Entsorgung) TheK(?!) 21:07, 21. Nov 2004 (CET) Und irgendwo bei mir ablegen ;-) --Paddy 21:12, 21. Nov 2004 (CET)

goto Benutzer:Paddy/valigncenter :) --SirJective 14:11, 22. Nov 2004 (CET)
Du bist ja immer echt fix ;-) Vielen herzlichen Dank wieder einmal. --Paddy 16:47, 22. Nov 2004 (CET)

subst:TOC

Ich würde gerne wissen wo überall:

__NOTOC__
----
<div style="text-align:center;">
[[#A|A]] [[#B|B]] [[#C|C]] [[#D|D]] [[#E|E]] [[#F|F]] [[#G|G]] [[#H|H]] [[#I|I]] 
[[#J|J]] [[#K|K]] [[#L|L]] [[#M|M]] [[#N|N]] [[#O|O]] [[#P|P]] [[#Q|Q]] [[#R|R]] 
[[#S|S]] [[#T|T]] [[#U|U]] [[#V|V]] [[#W|W]] [[#X|X]] [[#Y|Y]] [[#Z|Z]]
</div>
----

In als Text ersetzt wurde also mittels {{subst:TOC}}. Vielleicht lässt sich das finden und ändern. Vielen Dank. mfg --Paddy 18:12, 18. Nov 2004 (CET)

Bitte schön: Benutzer:Paddy/subst_TOC. --SirJective 20:00, 18. Nov 2004 (CET)
Das kann doch nicht alles gewesen sein? Ich kenne noch einige so. Hmm. liegt es vielelicht an der Vielfalt: Vorlage_Diskussion:TOC#Meinungsbild? --Paddy 18:51, 20. Nov 2004 (CET)
  1. Idtoc
  2. Idtoc-Vorlage
  3. BR

Bitte beim übernächsten oder drittnächsten dump aktualisieren ;-) --Paddy 19:19, 20. Nov 2004 (CET)

Seiten im Vorlagen-Namensraum

Hallo, ich habe gesehen, dass Du für die Seite Wikipedia:Seiten_im_Vorlagen-Namensraum eine schöne SQL-Abfrage zusammengebastelt hast. Mir ist jedoch aufgefallen, dass einige Vorlagen dort nicht auftauchen. Daher die Frage, ob das daran liegt, dass die Seite nicht aktuell ist oder ob dafür an den Abfragen noch etwas geändert werden muss.

Konkret aufgefallen ist mir das bei der Vorlage:Navigationsleiste Verbandsgemeinden im Westerwaldkreis. Diese taucht zwar auf, es gibt aber noch untergeordnete Navigationsleisten, die z.B. hier verlinkt sind und in der großen Liste nicht auftauchen.

Es wäre nett, wenn Du Dir das mal angucken würdest. Danke!

Hallo, die Voll-Aktualisierung ist schon eine Weile her, alles nach dem September wurde manuell eingetragen. Die genannten Vorlagen sind neuren Datums und vermutlich einfach übersehen worden. Mit dem nächsten Datenbank-Dump werde ich die Liste aktualisieren. --SirJective 21:40, 24. Nov 2004 (CET)
Hallo, super und vielen Dank für Deine Hilfe!
Hallo, habe gerade gesehen, dass Du die Übersicht jetzt neu erstellt hast. Nochmals besten Dank!

Kategorien mit höchstens 2 Artikeln

Hallo, ist es möglich, eine Liste mit allen Kategorien, die höchstens 2 Artikel enthalten, zu erstellen? Da dürften einige bei sein, die nicht wirklich gebraucht werden... --Ezrimerchant 19:28, 13. Dez 2004 (CET)

Ja, das ist möglich. Mit dem nächsten Dump werd ich die Ergebnisse hochladen, wenn du mir bis dahin einige Fragen beantwortest:
  • Soll ich Unterkategorien und andere WP-Seiten (Disk., Benutzer etc.) wie Artikel mitzählen (das ist einfacher) oder nur Artikel?
  • Soll ich die Liste auftrennen in vorhandene Kategorien und nichtvorhandene Kategorien (d.h. Kategorien die zwar verlinkt, aber nicht vorhanden sind)?
  • Soll ich dir alle gefundenen Kategorien geben, oder nur die ersten 100, 200 etc.?
  • Wo soll ich die Ergebnisliste speichern?
--SirJective 22:26, 13. Dez 2004 (CET)
Siehe auch Benutzer:Ezrimerchant/Sehr kleine Kategorien und Diskussion. --SirJective 16:06, 14. Dez 2004 (CET)

jahrestage / linkspam

hallo, da wir uns in letzter zeit nicht im chat gesehen haben, auf diesem wege: könntest du mir mal wieder ein paar von diesen machen:

ich hatte die ganze zeit vor, etwas zu basteln, mit dem man diese seiten in etwas eleganter benutzbares umwandeln kann, bin allerdings noch nicht dazu gekommen (sowieso würde ich gerne mal einen bot für einige wiederkehrende sachen bei den ausgewählten sachen schreiben, das nur nebenbei) - die listen sind aber auch so schon nützlich. eine kleine sache vielleicht: kann man die abfrage so erweitern, dass auch redirects berücksichtigt werden?

verbindlichsten dank, wie immer! grüße, Hoch auf einem Baum 15:26, 22. Dez 2004 (CET)

So, ich hoffe, ich hab bei den Jahrestagen nichts durcheinander gebracht. Quelle ist der Dump vom 9. Dezember. Wenn du da nichts findest, kann ich gern mit dem nächsten Dump neue Listen machen (die Abfrage dauert nur wenige Sekunden).
Die Darstellung der interessanten Links im Textkörper des Datumsartikels wäre eine hilfreiche Sache, nicht wahr? Das sollte doch mit ein bisschen Textersetzung vollautomatisch möglich sein: Erst die interessanten Links irgendwie kaschieren, z.B. indem man die öffnenden und schließenden Klammern durch irgendwelche Hilfszeichenketten ersetzt, danach alle verbleibenden eckigen Klammern entfernen oder anderweitig ersetzen, und schließlich die Hilfszeichenketten wieder in eckige Klammern umwandeln.
Was meinst du mit "Redirects berücksichtigen"? Meinst du, dass ein bebilderter Artikel auch gefunden werden sollte, wenn der Datumsartikel über einen Redirect auf ihn verweist? Das ließe sich wohl einrichten.
--SirJective 16:24, 22. Dez 2004 (CET)
danke! ich denke mal, diese zwei, drei wochen machen nicht so viel aus. aber vielleicht könntest du danach immer ein oder zwei wochen auf einen schlag machen, wenn du einen neuen dump bekommst.
wie sich das machen ließe mittels textersetzung, ist mir prinzipiell schon klar; ich muss mich nur endlich mal hinsetzen und das mit python oä realisieren... (ein ambitionierteres projekt wäre es übrigens, semi-automatisch die 4 oder 5 "ausgewählten" (und gut verifizierten) einträge für jeden tag zurück in den entsprechenden tagesartikel zu übertragen, falls dort nicht schon vorhanden - also feststellen, ob der artikel dort schon verlinkt ist, eventuell schon die richtige rubrik finden (geboren/gestorben/ereignisse) und per jahreszahl die richtige zeile vorschlagen... naja später mal.)
redirect: ja, genau das meinte ich.
grüße, Hoch auf einem Baum 16:57, 22. Dez 2004 (CET)
"feststellen, ob der artikel dort schon verlinkt ist" - Momentan suche ich nur nach Artikeln, die vom Datumsartikel verlinkt sind (und deshalb wäre es auch so einfach, nur diese im Text des Datumsartikels anzuzeigen). Es wäre eine (sicher nützliche) Modifikation, nach Artikeln zu suchen, die ihrerseits auf den Datumsartikel verlinken. Eine Überprüfung der richtigen Einordnung ist natürlich in beiden Fällen ratsam.
Hab die Abfrage um eine Stufe Redirects erweitert (mehr sollte nicht nötig sein, da die ja eh korrigiert werden sollten), und gleich den Rasputin zum 30. Dezember eingetragen.
Idee zu den Seiten mit den Listen: Lege doch eine Unterseite Bebilderte Jahrestage an, wo dann die einzelnen Tagesseiten als Unterseiten "Bebilderte Jahrestage/2. Januar" etc. verlinkt sind. So behältst du den Überblick über die Seiten, und kannst mir anzeigen, welche Tage du mit dem nächsten Dump gerne hättest. :)
--SirJective 20:53, 22. Dez 2004 (CET)
nach Artikeln zu suchen, die ihrerseits auf den Datumsartikel verlinken - sorry, ich habe mich unklar ausgedrückt: ich meinte (ganz unanbhängig von den bildern) so etwas wie zb den eintrag für Marinus van der Lubbe von Vorlage:Hauptseite Jahrestage 23. Dezember nach 23. Dezember zu kopieren, weil er dort noch fehlt. das war aber nur geplauder über zukunftsvisionen, kein auftrag an dich - es ist zwar sicher nicht schwierig, artikel herauszusuchen, die nur unter "Hauptseite Jahrestage", nicht aber unter dem gewöhnlichen tagesartikel verlinkt sind, aber ich stelle mir eben so etwas vor, das gleich die den ganzen eintrag (die zeile samt jahreszahl) an die (geraten) richtige stelle in 23. Dezember kopiert bzw zu kopieren vorschlägt.
Unterseite: ja, auf die idee war ich auch schon gekommen. setzt du die einfach auf deine beobachtungsliste?
grüße, Hoch auf einem Baum 05:29, 23. Dez 2004 (CET)
Ja, ich beobachte die Seite. Beim nächsten gewünschten Eintrag legst du einfach dort Links auf die Seiten an, die erstellt werden sollen. --SirJective 18:32, 24. Dez 2004 (CET)

weil ich dich gerade schon behellige, noch eine sache: in den letzten tagen gab es wiederholten linkspam (unter wechselnden ips) für mindestens zwei seiten bei tiscali, beispiele: [1] (http://home.tiscali.dk/wahrschein/), [2] (http://members.tiscali.fi/smilies100/).

da es so scheint, dass vielleicht doch nicht alle diese edits entdeckt wurden (einer blieb zb 3 tage stehen), wäre es vielleicht sinnvoll, in ein paar tagen einen aktuellen dump nach diesen urls zu durchsuchen (die volltextsuche erfasst urls offenbar nicht).

verbindlichsten dank, wie immer! grüße, Hoch auf einem Baum 15:26, 22. Dez 2004 (CET)

Von diesem Linkproblem hab ich gelesen. Ich suche gern im nächsten Dump nach den genannten Zeichenketten. Gibt's außer denen noch andere? --SirJective 16:24, 22. Dez 2004 (CET)
mir sind nur diese beiden links aufgefallen. vielleicht lohnt es sich aber, nach allen tiscali.xx (mit beliebiger länderdomain) zu suchen? ich weiß übrigens nicht, ob schon jemand die dinger auf die blacklist gesetzt hat. aber auch in dem fall ist es meines wissens sinnvoll, sie zu suchen und zu entfernen, weil sonst der nächste benutzer, der den gespammten artikel bearbeitet, eine fehlermeldung bekommt.
grüße, Hoch auf einem Baum 16:57, 22. Dez 2004 (CET)
OK, ich werde nach "http://%tiscali.%/" (oder so ähnlich) suchen. --SirJective 20:53, 22. Dez 2004 (CET)
Ergebnis: Benutzer:Hoch auf einem Baum/Tiscali. --SirJective 18:32, 24. Dez 2004 (CET)


Bilder

Huhu, ich mal wieder. Auf Benutzer:Crux/Linksschreibung hätte ich demnächst gerne die 100 ältesten mit {{Bild-Lizenz-unbekannt}} (älteste zuerst, ohne Datumsangabe) und die 50 ältesten mit {{LöschantragBild}} (älteste zuerst, mit Datumsangabe). Und einen kleinen Salat. --Danke ;) Crux 16:11, 2. Jan 2005 (CET)

Reicht's, wenn ich es mit dem nächsten Dump mache, oder soll ich die Daten vom 30.12. verwenden? --SirJective 18:08, 4. Jan 2005 (CET)
Mit dem nächsten reicht es auch, wenn du beim unbekannt-Baustein die ältesten 100 ausgibst. --Gruß Crux 21:42, 4. Jan 2005 (CET)
Erledigt, und hier dein Salat:
http://www.estarcion.com/shock/food/images/duanebday02/Pages/Image1.html ;)
--SirJective 18:44, 11. Jan 2005 (CET)
Danke *mampf* =) --Crux 15:35, 13. Jan 2005 (CET)

Neue Anfragen

Schreibt hier neue Anfragen auf. Ich nutze diese Seite ebenfalls um mir Anfragewuensche aus dem Chat zu merken, die ich nicht sofort ausfuehren kann.

Wikiquote

Hallo, es geht um das Finden von langen Zitaten, die Urheberrechtlich bedenklich sind. Rechtlich besonders bedenklich sind in der Zitatsammlung Wikiquote alle Zitate, die nicht mehr als Kurzzitat gelten können. Da alle Zitate in "Anführungszeichen" stehen sollten und durch Aufzählungszeichen getrennt sind müßte es eigentlich möglich sein die bedenklich langen Zitate durch eine SQL-Abfrage zu finden oder? --Timt 00:23, 17. Dez 2004 (CET)

Hallo Timt,
das Projekt Wikiquote scheint mehrere Diskussionsseiten zu haben, wo Urheberrechtsfragen besprochen werden. Hast du dort schon eine Seite, auf der speziell die langen Zitate thematisiert werden?
Ich kann den Dump von wikiquote runterladen und versuchen, lange Zitate zu identifizieren. Ob es durch reines SQL geht, muss ich schauen (ggf. erweitere ich mein JAVA-Programm). Ich setz mich bei Gelegenheit ran. --SirJective 12:17, 17. Dez 2004 (CET)
Im Moment eilt es noch nicht, da es im Moment noch einigermassen überschaubar ist, wer was anlegt und wie gross es ist, aber in letzter Zeit nimmt die Beteiligung doch zu und dann könnte es unübersichtlich werden. Das mit der Diskussionsseite ist nee gute Idee, ich werde es wohl mal in die Richtlinien aufnehmen. --Timt 22:10, 17. Dez 2004 (CET)

Erinnerung

Ich sollte dich doch an mein Kat:Person-Abo erinnern :-) Danke, Gruß, Leon ¿! | 1,2,3 23:13, 7. Jan 2005 (CET)

I.O.: Benutzer:LeonWeber/Artikel_in_Kategorie:Person, mit jedem Dump erneuern. --SirJective 18:44, 11. Jan 2005 (CET)

math durch sup oder sub ersetzen

Hallo SirJective, im IRC riet man mir, mich mit folgender Bitte an dich zu wenden. Ich würde gerne in den mathematisch orientierten Artikeln ein wenig aufräumen und dort, wo unnötigerweise der math-Tag verwendet wurde, sub-Tags einbauen, z.B. statt   Ai usw. Hierzu wäre eine vernünftige Datenbank abfrage mit entsprechenden regulären Ausdrücken hilfreich, die eine Liste der Artikel erzeugt, die man daraufhin abklopfen kann. In erster Näherung könnten das z.B. alle math-Tags sein, die nicht mehr als 3 Zeichen enthalten, da es sich dabei meist um derartige Kurzausdrücke mit Index oder Exponent handeln dürfte, die man ersetzen kann. Vielleicht fällt dir auch noch was Schlaueres ein. Kannst du mir mitteilen, ob und falls ja wann eine solche Liste machbar wäre? Die Liste kannst du z.B. unter Benutzer:Mkleine/Ablage speichern. Viele Grüße --Mkleine 00:28, 13. Jan 2005 (CET)

Gibt es für dieses Vorhaben Zustimmung seitens anderer Bearbeiter mathematischer Artikel? Bitte diskutiere dieses Vorhaben zunächst auf der Projektseite oder der Portalseite. Eine zentrale Frage, die bisher noch nicht zufriedenstellend geklärt wurde, ist, wo math-Tags nötig oder unnötig sind, und wo sie erwünscht oder unerwünscht sind.
Meine Meinung dazu ist: Will man reines HTML verwenden, dann sollte man Ai schreiben. Damit erhält man in der Ausgabe fast dasselbe Ergebnis wie mit   (die Schriftart ist anscheinend eine andere). Andererseits bin ich im Hinblick auf eine zukünftige Erweiterung durch MathML oder andere Darstellungsformen, und zusätzlich zum Zwecke einer semantischen (statt einer syntaktischen) Textauszeichnung, eher dazu geneigt, die vorhandenen mathematischen Verwendungen von sup und sub durch math ersetzen zu wollen. --SirJective 11:43, 13. Jan 2005 (CET)
Ich verweise in dieser Frage zunächsteinmal auf das folgende Zitat aus Wikipedia:TeX: "Bei Fragen zum Stil bezüglich des Setzens von mathematischem Code, siehe WikiProjekt Mathematik. Insbesondere sollte dies als Teil einer Zeile oder Fließtextes vermieden werden, da die Formeln in der Zeile nicht richtig ausgerichtet werden und die Schrift zu groß ist." Diese Richtlinie gilt imho seit vielen Monaten unverändert. Ich persönlich bin nicht an politischen Diskussionen dieser Art interessiert und war davon ausgegangen, dass die genannte Richtlinie eindeutig ist. Ich wäre bereit, diese Richtlinie ggf. wie oben beschrieben umzusetzen. Sollte die Frage tatsächlich ein diskussionswürdiges Thema sein, so sollte dies von den Mathematikern gelöst werden - ich ziehe mich dann hiermit wieder zurück. --Mkleine 12:16, 13. Jan 2005 (CET)
Ja du hast recht, dort und auch auf des Projektseite wird empfohlen, für einfache Ausdrücke HTML zu verwenden und komplexere Ausdrücke abzusetzen. Ich werde die Frage nach der Akzeptanz dieser Regel an geeigneter Stelle stellen. Sobald ein klares Meinungsbild vorliegt, melde ich mich bei dir. --SirJective 12:43, 13. Jan 2005 (CET)

Personendaten

Hallo SirJective, ich weiß nicht, inwieweit Du in die DVD-Problematik und die Erfassung der Personendaten involviert bist. Ziel ist hierbei, möglichst alle Personen mit den Personendaten zu versehen - Deadline für die DVD ist hierbei Ende Februar (in ca. 6 Wochen). Im Moment dürfte es über die Kategorien noch kein Problem sein, entsprechend Artikel zu finden, aber ab einem gewissen Punkt wäre es sicherlich notwendig, eine Übersicht über die Artikel zu haben, die die Personendaten noch benötigen - hilfreich wäre es sicherlich jetzt schon. Könntest Du dazu die Hierarchie der Personenkategorien entsprechend abklappern und entsprechende Listen erstellen? -- srb 04:40, 15. Jan 2005 (CET)

Ich hab davon schonmal gelesen. ;) Ich werd gern versuchen, dir dabei behilflich zu sein.
Wenn du mir nun detailliert beschreibst, was du möchtest, kann ich dir genau das liefern. :) Ich verstehe dich jetzt so, dass du alle Artikel in Kategorie:Person und Unterkategorien haben möchtest, die die Personendaten noch nicht verwenden. Dabei sollten sicherlich bestimmte Unterkategorien ausgeschlossen werden, wie Fiktive Person, oder? Gibt es noch andere Kategorien, die ein- oder ausgeschlossen werden sollen? --SirJective 11:25, 15. Jan 2005 (CET)
Ja, so in etwa hatte ich mir das vorgestellt: alle Artikel in Kategorie:Person und Unterkategorien, in denen die Vorlage:Personendaten nicht eingebunden ist. Bekannte Ausnahmen: Kategorie:Fiktive Person und Kategorie:Personengruppe. Bei den derzeit mehr als 1000 Unterkategorien könnte vielleicht noch die eine oder andere Kat wegfallen. Beim Abarbeiten wird man vielleicht auf weitere Ausnahmen stossen und könnte dann entsprechende Anmerkungen machen (auch einzelne Artikelausnahmen, z.B. enthält die Kategorie:Astronom selbst standardmäßig nur Nicht-Personenartikel, die Artikel über Astronomen sind in den entsprechenden Unterkats - allerdings könnte gelegentlich doch mal ein Personenartikel drinstehen, wenn sich jemand mit den Unterkats nicht auskennt; vermutlich gibt es in anderen Fachbereichen ähnliche Ausnahmen), so dass diese beim nächsten Durchlauf ausgeschlossen werden - für die erste Version würde ich allerdings erst man nichts weiter ausschließen. -- srb 20:23, 15. Jan 2005 (CET)
Im Dump vom 7. Januar hab ich 1637 Kategorien gefunden, die unter Person aber nicht unter Fiktive Person oder Personengruppe liegen (nur so nebenbei: beginnt man die Zählung bei Kategorie:Person mit Stufe 1, dann liegen die tiefsten Kategorien auf Stufe 7). Eine Liste der darin vorhandenen Artikel ohne Personendaten wird demnächst geliefert. --SirJective 22:32, 15. Jan 2005 (CET)

unkategorisierte Personen

Wenn ich mich mal einmischen darf: Vielleich kann man ja auch alle Artikel durchgehen, die die Zeichenfolge "(* ... † ...) enthalten, was auf eine Biografie und damit eine Person hindeuten würde. Damit würden alle Personen erfasst, die nicht in der KAtegorie Person stehen. Wäre vielleicht etwas für eine zweite Liste "Biografien ohne Kategorie". Stern !? 11:29, 15. Jan 2005 (CET)

Der Vorschlag von Stern (die Suche nach nicht kategorisierten Personen bzw. nicht in Personenkats einsortierten) ist auch nicht schlecht - mir sind schon diverse Personenartikel untergekommen, die nicht in einer Personenkategorie einsortiert waren, sondern unter einer Stadt/Land/Themengebiets-Kategorie. Die Zeichenfolge "(* ... )", "(† ...)", "(* ... † ...)" am Anfang des Artikels würden zwar noch nicht alle Personenartikel abdecken, aber zumindest einen großen Teil. Für eine umfassendere Suche entsprechende regular Expressions zu finden, ist wahrscheinlich nicht so einfach (Beispiele für mögliche Formulierungen im Artikel stehen z.B. hier). Wäre auch in dieser Richtung etwas möglich? -- srb 20:23, 15. Jan 2005 (CET)
Da dies eine zwar verwandte, aber andere Aufgabe ist, hab ich sie von der obigen abgetrennt. Dies ist eine gute Idee, die sicher auch bei Gelegenheit umgesetzt werden wird. Danke schonmal für die Formatbeispiele, mit denen müsste sich was machen lassen. --SirJective 22:32, 15. Jan 2005 (CET)