Wikipedia:WikiProjekt Georeferenzierung/Hauptseite/Wikipedia-World
NEWS: At the moment (2015-11-30) we have (Source): 4,15 million entries as input:
- en 1145421
- de 772004
- sv 372494
- fr 293196
- nl 232555
- ru 226063
- pl 149819
- ja 106954
- ca 94353
- es 91030
- it 86936
- sr 65041
- cs 53493
- zh 52971
- uk 50251
- da 48126
- no 40229
- fa 39004
- eu 25054
- lt 24879
With interwikilinks we get an output for 273 languages.
Database-Dumps (2015-11)
- toollabs:wp-world/dumps/new_red0.gz Wikipedia-World as PostGIS-dumps
- Database structure (PostGIS)
All people with WMFLAbs-account can read and use the database u_kolossos on osmdb database server. (Helppage Connecting to OSM) This page in English: Wikipedia:WikiProjekt Georeferenzierung/Wikipedia-World/en
Dank der freien Verfügbarkeit der gesammelten Daten und dank der unzähligen Helfer bei der Verortung der Artikel war es möglich, die Positionsbeschreibung von Orten über Längen- und Breitengrad in den verbreitetsten Sprachen als Karten nutzbar zu machen. Damit lassen sich auch gut die internationalen Aspekte in der Wikipedia zeigen.
Diese Seite soll anschließend in alle betreffenden Sprachen übersetzt werden um einen möglich leichten Einstieg zu liefern und das Projekt möglichst bekannt zu machen. Dafür suchen wir auch Leute die neben der Tätigkeit in der deutschsprachigen Wikipedia auch noch in anderssprachigen Wikipedias aktiv sind, um das Projekt dort bekannt zu machen.
Projektbeschreibung auf Deutsch
Dieses ist eine internationale Koordinierungsseite für die mehrsprachige Nutzung und Auswertung der im Projekt Georeferenzierung, en:Wikipedia:WikiProject Geographical coordinates und anderem gesammelten Koordinaten. Wir suchen noch in den Sprachen pl,ja,it,zh,sv... nach Kategorien in der sämtliche verwendete Geotags stehen (siehe Interwikilinks in der Kategorie:Vorlage_mit_Koordinate), um weitere Sprachen aufnehmen zu können.
Später sollen möglichst viele Sprachvarianten ausgewertet und in einer gemeinsamen Datenbank zusammengeführt werden. Dafür ist auch eine Abstimmung über die zu verwendenden Georeferenz-Vorlagen nötig.
Im Moment gibt es folgende Anwendungen die alle auf einer zentralen Datenbank auf dem Toolserver basieren, dabei sind die beiden letzen Anwendungen auch über den geohack aufrufbar:
Suchmaschine
http://tools.wikimedia.de/~kolossos/wp-world/place-search.php?la=de
einfache Kartenansicht
Mit Hilfe von einfachem HTML+CSS gibt es eine einfache Karte ohne Hintergrund in den folgenden Sprachen:
Englisch, Deutsch, Spanisch, Französisch, Italienisch, Japanisch, Niederländisch, Polnisch, Portugiesisch, Russisch, Schwedisch.
Google-Earth-Wikipedia-Einblendung
Dabei befinden sich die Daten in einer Datenbank und werden nach dem Blickfeld des Nutzers und der Artikellänge gefiltert und über Google Earth gelegt. Der Datenbankzugriff erfolgt jeweils nach einem einsekündigem Stillstand des Betrachter-Standpunktes.
Ein Klick auf eines der Symbole und ein darauf folgendes Klicken auf den Wikipedia-Link ermöglicht das bequeme Lesen der Wikipedia-Artikel.
Folgende Sprachen stehen zur Auswahl:
Englisch, Deutsch, Spanisch, Französisch, Italienisch, Japanisch, Niederländisch, Polnisch, Portugiesisch, Russisch, Schwedisch.
Geotag-Generierung
Ein weiterer Anwendungsfall für die Interwikilinks ist das automatische Generieren von Geotags aus den Informationen von anderssprachigen Wikipedias. So wurde als erstes Beispiel die englischen Geokoordinaten genutzt um für die deutschsp. Artikel welche noch ohne Koordinaten waren die Liste: Wikipedia:WikiProjekt_Georeferenzierung/Artikel_ohne_Koordinate/da_in_engl_WP mit Georeferenz-Vorlagen zu erzeugen. Die darin befindlichen Koordinaten wurden schon zu einem Großteil per Hand eingepflegt. Auch eine Automatisierung der Einpflegung über einen Bot scheint in Zukunft denkbar. Dieser Schritt sollte allerdings mit der letzte sein, um möglichst wenige Fehler auf diese Weise zu duplizieren.
Weltkarte der Wikipoints-Dichteverteilung
Die obige Abbildung kann in Echtzeit aus der Datenbank generiert werden. Dazu gibt es 3 Variable, welche mit der URL übergeben werden können:
- Variable "so" für "source" begrenzt die Anzeige auf Artikel aus einer bestimmten WP-Sprachquelle. Dabei werden nur die Koordinaten berücksichtigt welche nicht schon aus einer anderen Sprache eingelesen wurden.
- Die Variable "la" nutzen, was dann alle verfügbaren Koordinaten für eine Sprache angibt.
- Die Variable "fa" gibt den Vergrößerungsfaktor an, dieser sollte 0.5, 1, 2, 4 oder 8 betragen. Bei Faktor =1 entspricht ein Pixel = 1 Grad. Mit steigendem Faktor wächst auch die Rechenzeit.
Beispiel: http://tools.wikimedia.de/~kolossos/wp-world/imageworld-art.php?so=pt&fa=2 gibt die Beträge aus der portugiesischen WP wieder.
To-Do-Liste
Die Google Earth Anbindung mit Styles, Datenbankabfrage beschleunigenerledigt- Statische KML`s erzeugen
- CSV-Service ausbauen
- Internationalisierung
- alle Geotags-Vorlagen einer Sprache in einer Kategorie sammeln, welche dann über Interwikilinks mit Kategorie:Vorlage_mit_Koordinate verbunden wird
- Übersetzen der Type-Special-Liste (Werden zur Datenveredelung mit Hilfe der Kategorien benötigt)
- Übersetzen der Kontinent-Listen, ISO-3166-1-Kodierliste für Länder, ISO 3166-2 für Regionen
- Übersetzen der KML-Ordner-Namen
- Datenbankerweiterung auf mehr als 11 Sprachen. Welche?
- Error-Liste Abarbeitungsoberfläche in Anlehnung an den Interwikilink-checker
- Liste wo mehrere Artikel genau auf einer Koordinate liegen.
- Maybe-Vorschlagsliste abzüglich der Artikel welche über eine andere Sprache eine Koordinate bekommen könnte.
en:Template:Mapit-US-cityscale mit extraierenerledigt- letzter Schritt: Geotag-Generierung
Ansprechpartner
- Benutzer:Stefan Kühn: Datenextraktion aus den Dumps
- Benutzer:Kolossos: Einspielen der Daten in die Datenbank, Anwendungsprogrammierung