Zum Inhalt springen

Sternschema

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 24. Mai 2005 um 05:34 Uhr durch Sparti (Diskussion | Beiträge) (Fakten- und Dimensionstabellen). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data-Warehouse-Systeme und OLAP-Anwendungen.

Die Bezeichnung Sternschema rührt daher, dass die Datenelemente sternförmig angeordnet werden: Im Zentrum steht eine Faktentabelle, um die sich mehrere Dimensionstabellen gruppieren.

Eine Weiterentwicklung des Sternschemas ist das Schneeflockenschema.

Fakten- und Dimensionstabellen

Datei:Sternschema.png
Beispiel eines Sternschemas

Die zu verwaltenden Daten werden als Fakten bezeichnet; sie werden typischerweise fortlaufend in der Faktentabelle gespeichert. Andere Namen für die Fakten sind Metriken oder Messwerte. Faktentabellen können sehr groß werden, was ein Data Warehouse zwingt die Daten zu nach und nach zu verdichten (aggregieren) und schließlich nach einer Halteperiode zu löschen.

Im Gegensatz dazu enthält die Dimensionstabelle die "beschreibenden" Daten. Die Faktentabelle enthält Fremdschlüssel auf die Dimensionseinträge, die deren Bedeutung definieren. Dimensionstabellen sind vergleichsweise statisch und üblicherweise erheblich kleiner als Faktentabellen. Die bezeichnung "Dimension" rührt daher, dass jede Dimensionstabelle eine Dimension eines mehrdimensionalen OLAP-Würfels darstellt.

Durch die Denormalisierung der zu einer Tabelle gehörenden Tabellen liegen in der Dimensionstabelle Redundanzen vor. Diese Redundanzen führen zu einer schnelleren Anfragebearbeitung, da nicht wie in normalisierten Schemata erst Joins über mehrere Tabellen gemacht werden müssen. Ein Anwendungsgebiet, in dem eine schnellere Anfragebearbeitung vorteilhaft ist, sind Data-Warehouse-Systeme.

Beispielsweise sind die Dimensionstabellen Zeit, Kunde, Verkäufer, Produkt, während in der Faktentabellen Verkäufe, Lohnzahlungen, Kundenbesuche, etc. gespeichert sind.

In der Faktentabelle werden quantitative Daten gespeichert, beispielsweise die Anzahl der Verkäufe oder der Preis. Die Dimensiontabelle beschreibt das, was verkauft wurde, von wem, an wen und wann.

Vorteil der Trennung von Fakten und Dimensionen ist, dass die Fakten nach jeder Dimension generisch und unabhängig analysiert werden können. Eine OLAP Anwendung benötigt kein "Wissen" über die Bedeutung einer Dimension. Die Interpretation ist allein dem Benutzer überlassen.