Wikipedia:Datenbank-Abfragen

Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 6. September 2003 um 14:17 Uhr durch Fristu (Diskussion | Beiträge) (korrekte Abfrage?). Sie kann sich erheblich von der aktuellen Version unterscheiden.


Bitte nutzt diese Abfragen nur wenn unbedingt erforderlich. Eigene Abfragen bitte nur benutzen, wenn ihr ganz genau wisst was ihr tut!

Einige sinnvolle Abfragen für die Sysops:

Inhalt

Workarounds für momentan deaktivierte Seiten

Gewünschte Seiten abfragen:
SELECT bl_to, COUNT(DISTINCT bl_from) as nlinks FROM brokenlinks GROUP BY bl_to HAVING nlinks > 1 ORDER BY nlinks DESC

Verbesserung

Text finden, z.B. Rechtschreibfehler:
SELECT cur_title FROM cur WHERE cur_namespace=0 AND cur_is_redirect=0 AND cur_text LIKE '%Text%'
Links auf nicht vorhandene Seiten finden (Gewünschte Seiten), die nur genau einmal vorkommen. Dahinter verbergen sich viele Tippfehler oder Alternativschreibweisen, die korrigiert werden sollten - vielleicht existiert der verlinkte Artikel bereits. Der Bereich muss angepasst werden, hier von 'B' bis 'C'.
SELECT cur_title,bl_to, COUNT(DISTINCT bl_from) as nlinks FROM brokenlinks,cur where cur_namespace=0 and bl_to > 'B' and bl_to < 'C' and bl_from=cur_id GROUP BY bl_to HAVING nlinks = 1 ORDER BY bl_to LIMIT 500


Stubs finden: Kürzer als 50 Zeichen und enthält den Text "Siehe":
SELECT cur_title FROM cur WHERE cur_is_redirect=0 AND cur_namespace=0 AND LENGTH(cur_text)<50 AND cur_text LIKE '%Siehe%'
50 Seiten, bei denen nichts fett geschrieben ist (auch nicht der Begriff selbst):
SELECT cur_title FROM cur WHERE cur_namespace=0 AND cur_is_redirect=0 AND cur_text NOT LIKE "%'''%" AND cur_text NOT LIKE "%<b>%" LIMIT 50
Artikel die die Grenze von 1500 bytes (wer will kann auch 3000 nehmen) nur knapp verfehlen:
SELECT cur_title,LENGTH(cur_text) FROM cur WHERE cur_namespace=0 AND LENGTH(cur_text) > 1400 AND LENGTH(cur_text) < 1500 GROUP BY LENGTH(cur_text) LIMIT 20
Artikel in denen auf eine Benutzer-Seite verlinkt wird.
SELECT cur_title FROM cur WHERE cur_namespace = 0 AND cur_text LIKE '% [[Benutzer:%'LIMIT 10
Bilder ohne Beschreibung (siehe diesen dump)
SELECT cur_title,LENGTH(cur_text),cur_text FROM cur WHERE cur_namespace=6 ORDER BY length(cur_text) ASC LIMIT 100
Artikel in denen eine Bildbeschreibung fehlt (siehe diesen dump)
SELECT cur_title FROM cur WHERE cur_text REGEXP "\[\[[bB]ild\:[^|.*]\]\]" AND cur_text LIKE '%[[Bild:%' LIMIT 100
scheint falsche Positiva zu liefern?!

Hilfe gegen Vandalismus

Artikel mit mindestens 9 Konsonanten oder 7 Vokalen hintereinander oder mit Wörtern mit mindestens 40 Buchstaben
SELECT cur_title,cur_text from cur where cur_is_redirect=0 and cur_namespace=0 and cur_text rlike '[B-DF-HJ-NP-TV-XZb-df-hj-np-tv-xz]{9,}|[AEIOUYaeiouy]{7,}|[A-Za-z]{40,}'
Kurze Artikel (weniger als 100 Zeichen, keine Jahreszahlen) der letzten 5 Tage
SELECT cur_title,cur_text from cur where cur_is_redirect=0 and cur_namespace=0 and length(cur_text)<100 and cur_timestamp > (NOW() - INTERVAL 5 DAY)+0

Sonstiges

Interlinks einer bestimmten Sprache (Sprachkürzel kommt dreimal vor!)
SELECT cur_title,CONCAT('<a href=http://sv.wikipedia.org/wiki/',REPLACE(@l:=SUBSTRING(cur_text,5+@p:=INSTR(cur_text, ''''sv:''''),LOCATE('',cur_text, @p)-5-@p),' ','_'),'>',@l,'</a>') AS Interlink FROM cur WHERE cur_is_redirect=0 AND cur_namespace=0 AND cur_text LIKE '%[[sv:%' LIMIT 20

die 20 neuesten User
SELECT user_name, COUNT(*) FROM user, cur WHERE user_id=cur_user GROUP BY user_id ORDER BY user_id DESC LIMIT 20
die geschützten Seiten
SELECT cur_title,cur_restrictions,cur_namespace from cur where cur_restrictions !=''


Statistik

Anzahl der Seiten mit mindestens 1500 Bytes ermitteln:
SELECT COUNT(*) FROM cur WHERE LENGTH(cur_text)>1500 AND cur_namespace=0
Die 100 aktivsten Wikipedianer (aktueller Artikelstand) ermitteln (nur morgens laufen lassen):
SELECT cur_user_text, COUNT(*) AS count FROM cur WHERE cur_user != 0 GROUP BY cur_user ORDER BY count DESC LIMIT 100

Hilfe

Namespace-Codes:

0 normaler Artikel
1 Diskussionsseite eines Artikels
2 Benutzer
3 Benutzer-Diskussion
4 Wikipedia:
5 Wikipedia-Diskussion
6 Bild
7 Bild-Diskussion

Eine Beschreibung der Datenbanken findet man hier


Administratoren Handbuch Ich brauche Hilfe