Zum Inhalt springen

Data Warehouse

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 12. Dezember 2003 um 16:12 Uhr durch Motorpsycho (Diskussion | Beiträge) (Business Warehouse und Business Intelligence hinzugefügt). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Der Data-Warehouse-Begriff wurde Mitte der 80er Jahre bei IBM geprägt und mit Information Warehouse bezeichnet. Der Terminus Data Warehouse wurde erstmals 1988 von Devlin verwendet. In jüngerer Zeit werden Data-Warehouse-Systeme auch als Business-Warehouse-Systeme oder als Business-Intelligence-Systeme bezeichnet, wodurch die geschäftliche Bedeutung derartiger Systeme betont werden soll.

Es gibt derzeit keine einheitliche Defnition für den Data-Warehouse-Begriff.

Weitgehend einig ist man sich in Folgendem:

Ein Data Warehouse (deutsch: Datenlager) ermöglicht eine globale Sicht auf heterogene und verteilte Datenbestände, indem die für die globale Sicht relevanten Daten aus den Datenquellen zu einem gemeinsamen konsistenten Datenbestand zusammengeführt werden.

Somit entsteht der Inhalt von Data Warehouses durch Kopieren und Aufbereiten von Daten aus unterschiedlichen Quellen.

Meist dienen Data Warehouses für die Aggregation von betrieblichen Kennzahlen und Analysen innerhalb mehrdimensionaler Matrizen, dem so genanten Online-Analytical-Processing OLAP. Weiter sind Data Warehouses häufig Ausgangsbasis für Data Mining.

In der Regel operieren die Anwendungen mit anwendungsspezifisch konstruierten Auszügen aus dem Data Warehouse, den so genannten Data Marts.

Die anderen Definitionen unterscheiden sich vor allem im generellen Zweck eines Data Warehouses, im Umfang und Umgang der Daten im Data Warehouse.

Das Spektrum der Definitionen beginnt mit der restriktiven Sicht von Inmon:

„Ein Data Warehouse ist eine themenorientierte, integrierte, historisierte, nicht flüchtige (d.h. dauerhafte) Sammlung von Daten, um Manager bei Entscheidungsprozessen zu unterstützen.“

Im Original ”A data warehouse is a subject-oriented, integrated, time-variant, nonvolatile collection of data in support of management´s decision-making process.” (1)

Die folgende Definition von Bauer und Günzel ist weniger restriktiv, ist aber auf einen speziellen Zweck, die Analysefunktion, ausgerichtet:

„Ein Data Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf (beliebige) Daten darstellt, um Analysen zu ermöglichen.“(2)

Das Spektrum der Definitionen endet bei der Definition von Zeh, die ohne Restriktionen an Umfang und Umgang der Daten sowie ohne Zweckbestimmung ist:

„Ein Data Warehouse ist ein physischer Datenbestand, der eine integrierte Sicht auf die zugrundeliegenden Datenquellen ermöglicht.“ (3)

Die Einschränkung ”physisch” ist notwendig, um das Data Warehouse von dem ”logischen” föderierten Datenbanksystem abzugrenzen.

Beste deutsche Entsprechung: Datenlager.


siehe auch: Data-Warehouse-System -- Data Warehousing


Literatur

1. Bauer,A., Günzel,H.: Data Warehouse Systeme - Architektur, Entwicklung, Anwendung, dpunkt, 2000, ISBN 3-932588-76-2
2. Inmon,W.H.; Hackethorn,R.D.: Using the Data Warehouse. New York: John Wiley & Sons, 1994, ISBN 0-471-05966-8
3. Zeh,T.: Data Warehousing als Organisationskonzept des Datenmanagements. Eine kritische Betrachtung der Data-Warehouse-Definition von Inmon. In: Informatik, Forschung und Entwicklung, Band 18, Heft 1, Aug. 2003
4. Devlin,B.: Data Warehouse: from Architecture to Implementation. Massachusetts: Addison-Wesley, 1997
5. Lehner;W.: Datenbanktechnologie für Data-Warehouse-Systeme, Konzepte und Methoden, dpunkt, 2002, ISBN 3-89864-177-5