Zum Inhalt springen

Benutzer:Centic/Datenbank

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 11. Juni 2005 um 09:19 Uhr durch Centic (Diskussion | Beiträge) (Weiteres). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Ich habe jetzt auch eine lokale Datenbank installiert, meine Datenbank ist vom 6. April 2005.

Viele andere Seiten mit Abfragen sind hier gelistet: Benutzer:SirJective/Seiten_mit_Datenbank-Abfragen

Bitte gewünschte Anfragen auf dieser Seite stellen.

Viele "Brokenlinks"

Artikel, die besonders viele "Brokenlinks" aufweisen, ausgenommen Artikel, die in einer Kategorie "Liste..." aufscheinen. Das Ergebnis zeigt einerseits Artikel, die in eine der Listen-Kategorien aufgenommen werden sollten und andererseits, welche normalen Artikel sehr viele Links auf nicht-vorhandene Artikel enthalten. Diese Artikel sind potentielle Artikel für ein Review, um herauszufinden, warum soviele fehlende Links enthalten sind.

SELECT concat('*[[',cur_title,']]','<br>'), COUNT(*)
FROM brokenlinks, cur
WHERE cur_namespace = 0
AND cur_id = bl_from
AND cur_text NOT LIKE '%[[Kategorie:Liste%'
AND cur_text NOT LIKE '%[[Kategorie:Teilliste%'
GROUP BY bl_from
ORDER BY 2 DESC
LIMIT 100

Kandidaten für den WikiReader Digest

Das folgende SQL-Select ermittelt Kandidaten für den WikiReader Digest nach den vorgeschlagenen Kriterien.

$ARTIKEL wird durch ein kleines Script auf die Artikel aus der Liste unter Wikipedia:WikiReader Digest/Artikelliste gesetzt und dadurch Artikel, die bereits in Readern vorgekommen sind, von der Auswahl ausgenommen. Außerdem wird die Artikelliste auf Redirekts überprüft und diese Artikel auch ausgeschlossen. Weiters werden Jahrestage und einige Artikel zu Jahren ausgenommen, weitere solche Kriterien können jederzeit aufgenommen werden.


select concat('*[[',cur_title,']]')
from cur
where cur_is_redirect = 0
     AND cur_namespace = 0
     AND LENGTH(cur_text) > 1500
     AND cur_title not in ( $ARTIKEL )
     AND (
          (cur_text LIKE '%[[Bild:%') OR
          (cur_text LIKE '%[[Image:%')
     )
     AND (
          (cur_text LIKE '%Literatur%') OR
          (cur_text LIKE '%Weblinks%')
     )
     AND (cur_text NOT LIKE '%[[Kategorie:Jahrestag%')
     AND (cur_text NOT LIKE '%[[Kategorie:Jahr (20. Jh.)%')
     AND (cur_text NOT LIKE '%[[Kategorie:Ort in%')
     AND (cur_text NOT LIKE '%[[Kategorie:Ortsteil von%')
     LIMIT 500;"

Die Abfrage aus dem Dump vom 16. Mai 2005 zeigt derzeit die unten gezeigte Liste der ersten 500 Einträge (Mein System ist auf Zeichensatz ISO-8859-1 gestellt und kann daher die arabischen Zeichen nicht darstellen, daher evtl. rote Links). Derzeit findet die Abfrage 19236 mögliche Artikel, die ersten 500 sind hier gelistet, die komplete Liste gibt es auf Anfrage.

Kommentare und Vorschläge dazu bitte auf der Diskussionsseite machen.

Von Von

Artikel, die "von von" enthalten (Stand: Dump vom 16. Mai, ausgenommen einige Artikel, die korrekterweise "von von" enthalten und Artikel, die 'davon von' oder 'hiervon von' enthalten):

SELECT concat('*[[',cur_title,']]','<br>'),concat(
		SUBSTRING(cur_text,INSTR(cur_text,'von von')-30,90),
		'<br>'
		)
FROM cur
WHERE cur_namespace=0
AND cur_is_redirect=0
AND cur_text like '%von von%'
AND cur_title not in ('Adjusted-Winner-Methode', 'Alexander von Falkenhausen', 'Alkippe', 'Andrew-Schnabelwal','Pinchas Lavon')
AND cur_text not like '%davon von%'
AND cur_text not like '%hiervon von%';

Meistbesuchte Seiten

Die dreißig meistbesuchten Seiten laut Dump vom 6. April 2005.

ACHTUNG: Diese Daten werden in der Tabelle cur anscheinend nicht mehr upgedated!!

select cur_title, cur_counter from cur order by cur_counter desc limit 30;

Dump vom 6. April 2005:

+--------------------------------------+-------------+
| cur_title                            | cur_counter |
+--------------------------------------+-------------+
| Hauptseite                           |      392364 |
| GNU-Lizenz_fÃŒr_freie_Dokumentation  |       35958 |
| Mathematik                           |       17017 |
| Adolf_Hitler                         |       16538 |
| Afrika                               |       14634 |
| Deutschland_(BegriffsklÀrung)       |       14176 |
| Irak                                 |       12312 |
| Willkommen                           |       11380 |
| Handbuch                             |       11187 |
| Internationale_Telefonvorwahl        |       10906 |
| Beobachtete_Fehler                   |       10731 |
| Suche                                |       10717 |
| Alphabet                             |       10494 |
| EuromÃŒnzen                          |       10212 |
| Zweiter_Weltkrieg                    |       10206 |
| Atomwaffe                            |       10172 |
| September_2003                       |       10127 |
| Artikel,_die_Aufmerksamkeit_brauchen |        9668 |
| Griechisches_Alphabet                |        9386 |
| Ãber_Wikipedia                       |        9377 |
| Historische_Jahrestage               |        9280 |
| Computer                             |        8727 |
| Schweden                             |        8713 |
| Telefonvorwahl                       |        8096 |
| EnzyklopÀdie                        |        8045 |
| Erster_Weltkrieg                     |        7900 |
| Alexander_der_GroÃe                  |        7722 |
| Erste_Schritte                       |        7526 |
| Quintenzirkel                        |        7254 |
| Wiki                                 |        7176 |
+--------------------------------------+-------------+
30 rows in set (6 min 30.27 sec)

Weiteres