Zum Inhalt springen

„Bitmap-Index“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[gesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K Schreibung entspr. angepasstem Lemma
Funktionsweise: Suchmaske entsprach nicht der dargestellten Tabelle
Zeile 23: Zeile 23:
Wie bei allen Datenbankindizes existiert von jedem dieser Einträge ein Verweis auf einen (externen) Datenbankeintrag.
Wie bei allen Datenbankindizes existiert von jedem dieser Einträge ein Verweis auf einen (externen) Datenbankeintrag.


Das Durchsuchen der (vorzugsweise intern gespeicherten) Indextabelle geschieht über einfache binäre Operationen, im Beispiel über [[Konjunktion (Logik)|Und-Verknüpfung]] mit einer Suchmaske. Sucht man in dem Beispiel nach Personen, die männlich und verheiratet sind, so ist die Suchmaske 10 010 (die Verweise der Treffer führen zu Fritz und Hans).
Das Durchsuchen der (vorzugsweise intern gespeicherten) Indextabelle geschieht über einfache binäre Operationen, im Beispiel über [[Konjunktion (Logik)|Und-Verknüpfung]] mit einer Suchmaske. Sucht man in dem Beispiel nach Personen, die männlich und verheiratet sind, so ist die Suchmaske 00110 (die Verweise der Treffer führen zu Fritz und Hans).


Ausnutzung der binären Operationen auf [[Prozessor (Hardware)|Prozessorebene]] bietet einen Geschwindigkeitsvorteil bei Vergleichsoperationen. Durch diese Repräsentation wird Rechenaufwand gegen Speicherplatz getauscht.
Ausnutzung der binären Operationen auf [[Prozessor (Hardware)|Prozessorebene]] bietet einen Geschwindigkeitsvorteil bei Vergleichsoperationen. Durch diese Repräsentation wird Rechenaufwand gegen Speicherplatz getauscht.

Version vom 15. Februar 2011, 02:58 Uhr

Ein Bitmap-Index ist ein Datenbankindex, der dazu dient, mehrdimensionale Daten effizient zu indizieren. Auf Grund seiner Eigenschaften findet der Bitmap-Index vor allem bei Data Warehouses Einsatz.

Die Bezeichnung rührt daher, dass der Bitmap-Index ein oder mehrere Attribute in Form eines Bitmusters (engl. Bitmap) speichert. Er ist vor allem sinnvoll einsetzbar für die Indizierung von Tabellenspalten mit einer geringen Kardinalität (Anzahl der in dieser Spalte vorhandenen unterschiedlichen Werte). Das ist genau der Bereich, in dem ein konventioneller Index, realisiert durch einen B-Baum, keine Steigerung der Zugriffsperformance bringt.

Beispiel

Ein einfaches Beispiel: in einen Index einer Personendatenbank werden die Attribute Geschlecht (zwei mögliche Werte, Kardinalität = 2) und Familienstand (Kardinalität = 3) eingetragen. Die Indextabelle könnte so aussehen:

Name männlich weiblich ledig verheiratet geschieden
Anne 0 1 0 1 0
Emil 1 0 0 0 1
Fritz 1 0 0 1 0
Hans 1 0 0 1 0
Willi 1 0 1 0 0

Funktionsweise

Wie bei allen Datenbankindizes existiert von jedem dieser Einträge ein Verweis auf einen (externen) Datenbankeintrag.

Das Durchsuchen der (vorzugsweise intern gespeicherten) Indextabelle geschieht über einfache binäre Operationen, im Beispiel über Und-Verknüpfung mit einer Suchmaske. Sucht man in dem Beispiel nach Personen, die männlich und verheiratet sind, so ist die Suchmaske 00110 (die Verweise der Treffer führen zu Fritz und Hans).

Ausnutzung der binären Operationen auf Prozessorebene bietet einen Geschwindigkeitsvorteil bei Vergleichsoperationen. Durch diese Repräsentation wird Rechenaufwand gegen Speicherplatz getauscht.

Abbildung des Wertebereichs

Die Zuordnung von einem Wert eines Wertebereichs zu einem Bitvektor geschieht durch die Wahl der Basis des Bitvektors. Wird jedem Wert des Wertebereichs eindeutig ein einziger Bitvektor zugeordnet, so entspricht die Länge des Bitvektors im einfachen Fall genau der Kardinalität des Wertebereichs und ist gleichzeitig Basis des Bitvektors. Ein Vorteil dieser Darstellung ist die Möglichkeit, einzelne Werte eines Wertebereichs auszulassen, wenn diese nicht in vorliegenden Daten vorkommen. Weiterhin besteht die Möglichkeit, eine nicht uniforme Basis anzugeben.

Literatur

  • Chee-Yong Chan und Yannis Ioannidis: Bitmap Index Design and Evaluation. Proceedings of the 1998 ACM SIGMOD Conference.