Sternschema
Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data-Warehouse-Systeme und OLAP-Anwendungen.
Die Bezeichnung Sternschema rührt daher, dass die Datenelemente sternförmig angeordnet werden: Im Zentrum steht eine Faktentabelle, um die sich mehrere Dimensionstabellen gruppieren.
Eine Weiterentwicklung des Sternschemas ist das Schneeflockenschema.
Fakten- und Dimensionstabellen
Die zu verwaltenden Daten werden als Fakten bezeichnet; sie werden typischerweise fortlaufend in der Faktentabelle gespeichert. Andere Namen für die Fakten sind Metriken oder Messwerte. Faktentabellen können sehr groß werden, was ein Data Warehouse zwingt die Daten zu nach und nach zu verdichten (aggregieren) und schließlich nach einer Halteperiode zu löschen.
Im Gegensatz dazu enthält die Dimensionstabelle die "beschreibenden" Daten. Die Faktentabelle enthält Fremdschlüssel auf die Dimensionseinträge, die deren Bedeutung definieren. Dimensionstabellen sind vergleichsweise statisch und üblicherweise erheblich kleiner als Faktentabellen. Die bezeichnung "Dimension" rührt daher, dass jede Dimensionstabelle eine Dimension eines mehrdimensionalen OLAP-Würfels darstellt.
Durch die Denormalisierung der zu einer Tabelle gehörenden Tabellen liegen in der Dimensionstabelle Redundanzen vor. Diese Redundanzen führen zu einer schnelleren Anfragebearbeitung, da nicht wie in normalisierten Schemata erst Joins über mehrere Tabellen gemacht werden müssen. Ein Anwendungsgebiet, in dem eine schnellere Anfragebearbeitung vorteilhaft ist, sind Data-Warehouse-Systeme.
Beispielsweise sind die Dimensionstabellen Zeit, Kunde, Verkäufer, Produkt, während in der Faktentabellen Verkäufe, Lohnzahlungen, Kundenbesuche, etc. gespeichert sind.
In der Faktentabelle werden quantitative Daten gespeichert, beispielsweise die Anzahl der Verkäufe oder der Preis. Die Dimensiontabelle beschreibt das, was verkauft wurde, von wem, an wen und wann.
Vorteil der Trennung von Fakten und Dimensionen ist, dass die Fakten nach jeder Dimension generisch und unabhängig analysiert werden können. Eine OLAP Anwendung benötigt kein "Wissen" über die Bedeutung einer Dimension. Die Interpretation ist allein dem Benutzer überlassen.