Benutzer:Kolossos/Sitemap

Projekt: Sitemap der Wikipedia in 3D

Aufgrund der großen Artikelanzahl in der Wikipedia empfiehlt sich ein 3D-Blick auf die Dinge.

in der aktuellen deutschen cur-Tabelle (April 20005) befinden sich 521000 Artikel (incl.Benutzer und Bildern...) bei linearer Anordnung ergibt sich so eine ungeheure Länge der Darstellung
bei flächiger Betrachtung der Dinge ergibt sich über die Wurzelfunktion ein Qudrat mit 722 Atikel auf jeder Kantenlänge
bei räumlicher Betrachtung der Dinge ergibt sich über die 3.Wurzel ein Würfel mit überschaubaren 80 Atikel auf jeder Kantenlänge

Dank PHP, VRML, dem Wikipediadatenbankdownload und der rasanten Hardwareentwicklung war es mir möglich dieses halbwegs Web-tauglich umzusetzen. VRML ist dabei ein relativ alter freier Internetstandart für 3D.

Preview

Mit einer flotten Internetverbindung, einem zeitgemäßen Rechner (1Ghz und viel RAM) und einem kostenlosen VRML-Plugin kann man schon mal einen Blick daraufwerfen:

hier (opt. Text als Textur nur ASCII-Zeichen) oder wenn es nicht laufen sollte dann
hier (mit einfachem VRML-Text)

Die Artikel werden über LODs Stück für Stück geladen. Unter den Artikeln befindet sich übrigens ein L-förmiger Link zu den Wikipediaartikeln.

Das Projekt befindet sich dabei noch in einer pre-beta-Phase.

Screenshots

ToDo

Die Artikel sind noch vollkommen ungeordnet. Dafür ist eine zusätzliche Tabelle geplant in der zu jedem Artikel und jeder "Sichtweise" (s. unten) Koordinaten gespeichert werden.
Die Links zwischen den Artikeln und den Kategorien sollen noch eingezeichnet werden.
Es steht erst mal nur die Wikipedia auf Plattdeutsch[1] mit 3000 Artikeln in Netz.

Diese ist in 16 LODs geteilt. Die Deutsche Wikipedia läuft nur bei mir lokal im Intranet und ist in 1000 LODs geteilt. (Die Cur-Tabelle umfaßt dann mit 2 Spalten (ID und title) und Gzipt 7MB). Leider läuft dabei beim Clienten schnell die Windows-Speicherauslagerungsdatei auf über 1 GB an wenn man lange Zeit durch die Welt läuft oder fliegt.

Ein vorgeschaltetes PHP-Skript soll Einstellmöglichkeiten bieten (LODRange, Startpunkt, Sichtweisen...).
Inteligentere ineinander geschachtelte LODs.

mögliche Sichtweisen

Die Positionierung der Artikel im Raum erfolgt in vorgeschalteten Skripten in größeren Abständen Auch die Optik

nach Kategorien

Ausgehend von der als Stamm kann sich die Wikipedia nach unten verästeln. siehe Wissensbäume

nach Portalen

nach Listen

nach zeitlicher Ordnung

In der cur Tabelle ist die Entstehungszeit des Artikels gespeichert dieses ließe sich als Koordinate interpretieren.

"Biomorph"

Es auch möglich die Verbindungen als sich zusammenziehende Federn zu simulieren und die Artikel stoßen sich bis zu einem gewissen Abstand zwecks besserer Lesbarkeit ab. Eng veknüpfte Themenbereiche sollten sich somit automatisch zusammenfinden.

Synchronoptisch

siehe Peters Synchronoptische Weltgeschichte Personen und Erreignisse werden in eine Zeitskala eingezeichnet.

Hilfe erwünscht

Nutzung der Namespace-Tabelle für Prefixe (z. B.:Bild:... , Benutzer:...)
Internationalisierung
Links als Linie einzeichnen (alles möglichst optimiert um den Rechner zu schonen). Wenn das ein zu großes Chaos wird dann nur die Links zu den Kategorien oder andere Optik.
eine Art Ladebalken der anzeigt wie groß ein Artikel ist.
hilfreich wäre ein freier Webserver mit MySQL um die Wikipedia in der Testphase nicht weiter zu belasten. Er muß garnicht alzu schnell sein, zu Hause bei einem Clienten tat es ein 600 MHz -Rechner mit einer reduzierten cur-Tabelle locker. Die Post geht erst beim Clienten ab. Etwas Traffic entsteht natürlich schon.
Feedback!

PHP-Code

Die drei nötigen Datein kann ich auf Wunsch hier mit einstellen.

Erfahrungsberichte

bitte Betriebssystem, Plugin, Hardware und Internetzugang mit angeben:

Archiv

(alt und cronologisch) Vielleicht währe es auch spannend, Wikipedia mit einem semantic Web mit Wissensgraph zu ergänzen. Ein vereinfachtes Konzept würde sich dann nur auf die Links beziehen und diesen dann freiwillig Meta-Informationen mitgeben: Ein Link könnte somit z.B. folgende Informationen tragen:

Link auf untergeordneten Begriff oder Gegenstand (Auto->Lenkrad)
Link auf übergeordneten Begriff oder Gegenstand (Biologie->Naturwissenschaften)
Link auf eine kausale Folge (2.Weltkrieg->Teilung von Deutschland)
Link auf eine kausale Ursache (Amtsantritt von Papst den 7.->Ableben von Papst den 6.)
Link ohne Meta-Information bedeutet dann "siehe auch"

Mir (als nicht Informatiker) ist es mittler Weile gelungen in VRML (einer HTML ähnlichen 3D-Beschreibungssprache mit Java-script Unterstützung) aus einer Tabelle für die Objekte und einer Tabelle für die Verbindungen die gezeigten räumlichen und veränderbaren Hierrachiebäume automatisch zu generieren (Screenshot [2]). Diese Tabellen sind meines Wissens nach in der Wikipedia-Datenbank auch abgelegt. Es sollte also für Informatiker möglich sein Web-fähige und Datenbank basierte Wissensgraphen zu erzeugen. Im 2D-Fall sollte auch DHTML ausreichend sein. Der Benutzer sollte die Artikel per Drag-and-Drop verschieben können und per Doppelklick sollte sich die vollständige Seite öffnen.

Ein Beispiel im Bereich der Mathematik was die Verbindung von allen Begriffen unter einander grafisch darstellt findet sich hier: thesaurus.maths.org wenn man dort ins Suchfeld z.B. Sinus eingibt, dann rechts "Graph anzeigen" klickt gekommt man eine schöne Anzeige. (Leider ist dafür Java notwendig das sollte noch geändert werden, dafür scheint die Software aber auch frei verfügbar zu sein). Man kann dann noch einstellen wieviele Links man vom aktuellen Link verfolgen will, von einem zum anderen springen und per Doppelklick erhält man die detailierte Seite.

Ein Beispiel aus der Linguistik ohne aufwendiges Plugin ist hier.[3]

Bei den über 200000 Wikipediaartikel würde schnell ein ziemliches tolles "Wollknäul" aus Begriffen und Verbindungen entstehen. Aus den o.g. Hierarchien könnte man dann ordentliche Wissensbäume entstehen zulassen. Und so vieleicht eine bessere Übersichtlichkeit über die Artikelflut bekommen. Aufgrund der Datenflut bietet sich vielleicht wirklich 3D an. Dann ist es auch möglich die Verbindungen als sich zusammenziehende Federn zu simulieren und die Artikel stoßen sich bis zu einem gewissen Abstand zwecks besserer Lesbarkeit ab. Eng veknüpfte Themenbereiche sollten sich somit automatisch zusammenfinden.

Ggf. könnte man auch erstmal ein von den wikipedia-Servern getrennt laufendes Projekt aufbauen um die Server nicht noch mehr zubelasten. Wer hat da weitere Ideen?

Interessant ist dabei auch Wikipedia:Kategorien/Meinungsbild zu den jetzigen und zukünftigen Ordnungsvarianten. Und auch was die Leute bei OpenCyg [4] machen (ich verstehe es nur nicht).Kolossos 22:53, 1. Apr 2005 (CEST)

Ich bin jetzt (dank phpmyadmin) einen Schritt weiter und habe die ca. 3000 Seitentitel der Wikipedia auf Plattdeutsch als Blöcke in einer VRML-Datei drin. Der Screenshot heißt nicht ohne Grund wikiwahn.jpg. An den ca 18000 Links zwischen den Artikel hängt sich das Vrml leider vollkommen auf.Kolossos 19:09, 11. Apr 2005 (CEST)