Zum Inhalt springen

Schneeflockenschema

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 8. Juni 2009 um 20:27 Uhr durch Dhbw dbi (Diskussion | Beiträge) (Vor- & Nachteile des Schneeflockenschemas: üb). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Schneeflockenschema: Fakt- und Dimensionstabellen bilden eine schneeflockenförmige Struktur und werden im Unterschied zum Star-Schema weiter verfeinert und normalisiert

Das Schneeflockenschema(engl.: Snowflake schema) ist eine Weiterführung des Sternschemas, das beim OLAP und Data Warehousing eingesetzt wird.

Beim Sternschema liegen die Dimensionstabellen denormalisiert vor, was eine bessere Verarbeitungsgeschwindigkeit zu Lasten der Datenintegrität und des Speicherplatzes mit sich bringt. Im Gegensatz dazu werden beim Schneeflockenschema die einzelnen Dimensionstabellen verfeinert, indem sie klassifiziert oder normalisiert werden. Durch diese Weiterverzweigung des Datenmodells entsteht die Form einer Schneeflocke, woher die Bezeichnung dieses Entwurfsmusters stammt.

Bedingt durch diese feinere Strukturierung sind die Daten zwar weniger redundant als in einem Sternschema, es sind jedoch für Abfragen eventuell zusätzliche Join-Operationen notwendig. Ein Schneeflockenschema führt also zu kleineren und besser strukturierten Datenmengen, die aber komplexere Zusammenhänge haben und damit unter Umständen zu längeren Lade- oder Abfragezeiten führen.

Definition

Eine Weiterführung des Sternschemas ist das Schneeflockenschema. Bei diesem bleibt die Faktentabelle wie beim Sternschema konstant, die Dimensionen werden jedoch weiter verfeinert, indem sie klassifiziert oder normalisiert werden. Jedenfalls werden die Dimensionstabellen dabei um die Attribute erweitert, damit jede Ausprägung einer Dimension in einer eigenen Tabelle dargestellt werden kann. Dies führt also zu kleineren und besser strukturierten Datenmengen. Durch diese Weiterverzweigung des Datenmodells entsteht die Form einer Schneeflocke, was diesem Schema den Namen verleiht.


Eigenschaften Schneeflockenschema

  • Dimensionentabellen
    • Primärschlüssel zur Identifizierung der Dimensionenwerte
    • Abbildung der Dimensionenhierarchie durch Fremdschlüssel
    • Normalisierung
  • Faktentabelle (gleich mit Sternschema)
    • Fremdschlüssel zu den Dimensionentabellen, d.h die unterste Ebene jeder Dimension wird als Schlüssel in die Faktentabelle aufgenommen
    • Fremdschlüssel auf die Dimensionen bilden zusammengesetzten Primärschlüssel für die Fakten

Vor- & Nachteile des Schneeflockenschemas

Folgend werden die Vor- und Nachteile des Schneeflockenschemas im Vergleich zum einfacheren Sternschema aufgezeigt:

Vorteile

  • Geschwindigkeitszuwachs: Durch zusätzliche Verbunde bei den Dimensionstabellen wird eine höhere Geschwindigkeit im Vergleich zum Sternschema erreicht.
  • geringerer Speicherplatzverbrauch: da Dimensionentabellen durch Normalisierung keine redundanten Daten enthalten.

Nachteile

  • Komplexere Strukturierung: Bedingt durch die feinere Strukturierung sind die Daten zwar weniger redundant als in einem Star-Schema, die Zusammenhänge sind jedoch komplexer. Mehrstufigen Dimensionstabellen müssen dehalb wieder über Join-Abfragen verknüpft werden und kann unter Umständen zu längeren Abfragezeiten führen.

Siehe auch

Literatur

  • H. Kemper, W. Mehanna & C. Unger: Business Intelligence - Grundlagen und praktische Anwendungen: Eine Einführung in die IT-basierte Managementunterstützung. 2. erg. Ausgabe, Wiesbaden: Vieweg+Teubner, 2006 ISBN 3-834-80275-1
  • J. Han & M. Kamber: Data Mining. Concepts and Techniques. 2nd Edition, San Francisco (CA) et al: Morgan Kaufmann, 2006 ISBN 1-558-60901-6
  • B. Larson: Delivering Business Intelligence with Microsoft SQL Server. 2nd Edition, New York: Mcgraw-Hill Professional, 2009 ISBN 0-071-54944-7
  • Ralph Kimball, Margy Ross: The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. Second Edition Auflage. Wiley, New York 2002, ISBN 0-471-20024-7.
  • Lynn Langit: Foundations of SQL Server 2005 Business Intelligence. First Edition Auflage. Apress, New York 2007, ISBN 1-59059-834-2.