Zum Inhalt springen

Parallele Koordinaten

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 29. September 2011 um 22:09 Uhr durch Sigbert (Diskussion | Beiträge) (Weblinks: Literatur verschoben). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Dieser Importartikel ist fälschlicherweise im Artikelnamensraum. Bitte verschiebe die Seite oder entferne diesen Baustein.
Dieser Artikel (Parallele Koordinaten) ist im Entstehen begriffen und noch nicht Bestandteil der freien Enzyklopädie Wikipedia.
Wenn du dies liest:
  • Der Text kann teilweise in einer Fremdsprache verfasst, unvollständig sein oder noch ungeprüfte Aussagen enthalten.
  • Wenn du Fragen zum Thema hast, nimm am besten Kontakt mit den Autoren auf.
Wenn du diesen Artikel überarbeitest:
  • Bitte denke daran, die Angaben im Artikel durch geeignete Quellen zu belegen und zu prüfen, ob er auch anderweitig den Richtlinien der Wikipedia entspricht (siehe Wikipedia:Artikel).
  • Nach erfolgter Übersetzung kannst du diese Vorlage entfernen und den Artikel in den Artikelnamensraum verschieben. Die entstehende Weiterleitung kannst du schnelllöschen lassen.
  • Importe inaktiver Accounts, die länger als drei Monate völlig unbearbeitet sind, werden gelöscht.
Parallele Koordinaten Plot der Käferdaten mit GGobi.

Parallele Koordinaten (auch: ||-Koordinaten oder PCP, engl.: Parallel coordinate plot) sind eine Methode zur Visualisierung von hochdimensionalen Strukturen und multivariater Daten. In der rechten Grafik zeigen die senkrechten Linien die Achsen des Koordinatensystem. Anders als im Streudiagramm, in dem zwei Koordinatenachsen rechtwinklig zueinander angeordnet sind, sind sie hier parallel und in gleichem Abstand angeordnet. Jede Linie von links nach rechts entspricht dabei einem Datenpunkt und wird durch einen Polygonzug mit Ecken auf den parallelen Achsen dargestellt. Die Position der Ecke auf der i-te Achse entspricht der i-te Koordinate des Punktes.

Geschichte

Parallele Koordinaten wurden erstmals von Maurice d'Ocagne 1885 beschrieben.[1] Unabhängig davon entwickelte Alfred Inselberg sie 1959 erneut.[2] Ab 1977 wurden sie systematisch von ihm weiter entwickelt und popularisiert. Sie wurden genutzt in Algorithmen zur Vermeidung von Zusammenstößen im Flugverkehr (1987), Data Mining, Bildanalyseverfahren, Optimierung, Prozesskontrolle sowie Einbruchserkennung bei Computern. Die Grundlage des Erfolgs der parallelen Koordinaten in den meisten Anwendungen war der Artikel von Wegman: Hyperdimensional Data Analysis Using Parallel Coordinates.[3]

Generalisierte parallele Koordinaten wurde Moustafa and Wegman vorgeschlagen.[4][5] Hierbei wird das kartesische Koordinatensystem mittels Basisfunktionen in einen Parameterraum, und dieser dann auf parallele Koordinaten, abgebildet. Dadurch lässt sich eine Verbindung herstellen zwischen Generalisierte parallele Koordinaten, der Grand Tour und den Andrews Kurven.

Vor- und Nachteile

Die parallelen Koordinaten haben verschiedene Vor- und Nachteile:

  • Eine Erhöhung der Dimension bedeutet lediglich das Hinzufügen von weiteren (senkrechten) Achsen.
  • Da parallele Koordinaten einen höherdimensionalen Raum auf einen zweidimensionalen Raum abbilden, tritt ein Informationsverlust ein. Dieser kann mit Hilfe der Parseval-Identität gemessen werden.
  • Mit Übung sind bestimmte zweidimensionale (und auch höherdimensionale) Strukturen in parallelen Koordinaten leicht zu erkennen. Die Grafik unten zeigt verschiedene zweidimensionale Strukturen (perfekt positiv und negativ korrelierte Datenpunkte, Cluster, Kreis und normalverteilte Daten) einmal im Streudiagramm (oben) und in parallelen Koordinaten. Es sind Muster in parallelen Koordinaten bekannt für (Hyper-) Ebenen, Kurven, mehrere glatte (hyper-) Flächen, Ähnlichkeiten, Konvexität und auch nicht-orientierbare Flächen.[6] Die (zweidimensionale) Punkt-Linie Dualität ist eine Hinweis darauf, dass die mathematischen Grundlagen aus der projektiven Geometrie stammen.
Verschiedene zweidimensionale Strukturen im Streudiagramm (oben) und in Parallelen Koordinaten (unten).
Verschiedene zweidimensionale Strukturen im Streudiagramm (oben) und in Parallelen Koordinaten (unten).

Zur Visualisierung von hochdimensionalen Daten in der Statistik müssen drei wichtige Aspekte beachtet werden:

die Anordnung der Achsen,
Die Anordnung der Achsen ist entscheidend für die Suche nach Strukturen in den Daten. In einer typischen Datenanalyse werden meist vielen Anordnungen ausprobiert. Es wurden Anordnungsheuristiken entwickelt, die Einblicke in interessante Strukturen erlauben.[7]
die Rotation der Achsen (Daten)
Da die i-te Koordinate durch die Ecke auf der i-ten Achse bestimmt wird, kann eine Rotation der Achsen (=Rotation der Daten) ein anderes Bild ergeben. Die beiden linken Grafiken können als Rotation der Achsen (oder Daten) um 90 Grad aufgefasst werden. Trotz gleicher Struktur ergeben sich unterschiedliche Strukturen in den parallelen Koordinaten.[5]
und die Skalierung der Achsen.
Die parallelen Koordinaten sind im wesentlichen eine Aneinanderreihungen von Linien zwischen Paaren von Koordinatenachsen.[5] Daher sollten die Variablen auf einen ähnlichen Maßstab skaliert sein. Verschiedene Skalierungen können ebenfalls interessante Einsichten in die Daten geben,

Einzelnachweise

  1. d'Ocagne, Maurice: Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles. Paris: Gauthier-Villars, 1885.
  2. Alfred Inselberg: The Plane with Parallel Coordinates. In: Visual Computer. 1. Jahrgang, Nr. 4, 1985, S. 69–91, doi:10.1007/BF01898350.
  3. Edward J. Wegman: Hyperdimensional Data Analysis Using Parallel Coordinates. In: Journal of the American Statistical Association. Band 85, Nr. 411, September 1990, S. 664–675.
  4. R. Moustafa, E. Wegman: On Some Generalization to Parallel Coordinate Plot. In: Seeing a million, A Data Visualization Workshop, Rain am Lech (nr.), Germany. 2002.
  5. a b c R. Moustafa, E. Wegman: Multivariate continuous data—Parallel Coordinates. In: In: Unwin, A., Theus M., Hofmann, H. (Eds.), Graphics of Large Datasets: Visualizing a Million, Springer. 2006, S. 143–156.
  6. A. Inselberg: Parallel Coordinates: VISUAL Multidimensional Geometry and its Applications. Springer, 2009.
  7. Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets (Seiten 3-4)

Literatur

  • Alfred Inselberg: Parallel Coordinates: Visual Multidimensional Geometry and Its Applications. 1. Auflage. Springer, New York 2009, ISBN 978-0-387-21507-5.
  • Martin Graham, Jessie Kennedy: Using Curves to Enhance Parallel Coordinate Visualisations. Napier University, Edinburgh, UK (napier.ac.uk [PDF; abgerufen am 29. September 2011]).
  • Rida E. Moustafa, Edward J. Wegman: On Some Generalization of Parallel Coordinate Plots. George Mason University 2002 (Technical report).