Informationsintegration
Als Informationsintegration lässt sich das Problem der Zusammenführung von Daten und Inhalten verschiedener Quellen zu einer einheitlichen Menge von Informationen bezeichnen. Dabei sollen vor allem heterogene Quellen möglichst vollständig und effizient zu einer strukturierten Einheit zusammengeführt werden, die sich effektiver nutzen lässt, als dies bei Zugriff auf die einzelnen Quellen möglich wäre. Informationsintegration ist vor allem dort notwenig, wo mehrere gewachsene Systeme miteinander verbunden werden sollen, also beispielsweise bei der Zusammenführung von Firmen, Arbeitsabläufen und Anwendungen oder bei der Informationssuche im Internet. Konkret müssen dabei eine Reihe von Datenbanken und Informationssystemen integriert werden. Ein relativ einfaches Beispiel für ein integrierendes Informationssystem ist eine Metasuchmaschine. Die Integration komplexerer Systeme ist erst in den 1990er Jahren in den Blickpunkt der informatischen Forschung gerückt und somit in der Entwicklung begriffen.
Methoden der Informationsintegration
Die Integration heterogener Informationen aus unterschiedlichen Systemen betrifft sowohl die Integration der konkreten Daten als auch der Strukturen (Schema), in denen sie vorliegen. Zur Datenintegration sind unter Anderem Verfahren der Objektidentifikation/Duplikaterkennung notwendig, während die Schemaintegration mittels Schema Mapping/Schema Matching durchgeführt wird. Grundsätzlich lassen sich zwei Arten von Integration unterscheiden:
- Materialisierte Integration: Die Daten werden zuerst in eine zentrale Datenbasis integriert und stehen danach für Anfragen zur Verfügung (beispielsweise in einem Data Warehouse).
- Virtuelle Integration: Die Daten verbleiben in den unterschiedlichen Quellen und die Integration findet erst bei einer Anfragen statt (Mediator-Wrapper System).
Verwandte Themengebiete
Die Informationsintegration weist unter Anderem Überschneidungen und Verwandtschaften mit folgenden Themengebieten auf:
Siehe auch
Literatur
- Stefan Conrad: Föderierte Datenbanksysteme. Konzepte der Datenintegration. Springer, 1997 ISBN 3540631763
- M. Tamer Özsu, Patrick Valduriez: Principles of Distributed Database Systems. Prentice Hall, 1999 ISBN 0-13-659707-6