Eine Datenbank ist die elektronische Form eines Karteikastens. Es handelt sich um eine Sammlung von Daten, die aus der Sicht des Benutzers zusammengehören, z. B. eine Personaldatenbank oder eine Lagerinventardatenbank. Es gibt hierarchische, relationale und objektorientierte Datenbanken. Die Datenbank wird üblicherweise von einem Datenbankverwaltungssystem (DBMS) verwaltet. Ein DBMS zusammen mit einer oder mehreren Datenbanken nennt man auch Datenbanksystem.
Datenbanksysteme sind heutzutage das Rückgrat jedes größeren Softwaresystems. Egal ob Webshop, Finanzbuchhaltung oder Wikipedia, überall steht ein DBMS dahinter.
Das grundlegende Element einer Datenbank ist der Datensatz (er entspricht einer Karteikarte). Aus einer gewissen Anzahl von Datensätzen wird eine Tabelle oder Liste gebildet. Mehrere Tabellen, die zu einer Gesamtheit zusammengefasst und untereinander verknüpft werden, sind dann eine Datenbank.
Beispiele
- z. B. Bibliothek:
- Tabelle aller Bücher
- Tabelle aller Kunden
- Durch Verknüpfung kann festgestellt werden, welches Buch an welchen Kunden ausgeliehen ist
Eigenschaften
Von einer Datenbank kann man dann sprechen, wenn sie folgende Eigenschaften hat:
- Sie enthält eine große Menge von Daten über einzelne Dinge, Personen etc. unserer Umwelt.
- Diese Daten sind nach bestimmten Merkmalen und Regeln erfasst, geordnet und abgelegt.
- Der Zugriff auf die Daten und deren Änderung ist ohne großen Aufwand für autorisierte Personen möglich.
Es gibt verschiedene Typen von Datenbanken, darunter
Geschichte
Relationale Datenbanken sind heute am weitesten verbreitet. In ihnen werden Daten (Texte, Zahlen und Binärdaten) in Tabellen abgespeichert. Damit die Datensätze eindeutig identifiziert werden können, muss ein eindeutiger Primärschlüssel vergeben werden. Zum schnelleren Auffinden der Daten werden Indizes über bestimmte Spalten, so genannte Schlüsselspalten, erzeugt. Eine relationale Datenbank besteht nicht nur aus einer Tabelle, sondern aus vielen, die miteineinander verknüpft sind. Diese Verknüpfungen werden Relationen genannt - daher auch der Name relationale Datenbank. Die Relation geschieht immer über einen Schlüssel, der eine Tabellenzeile und damit eine Informationsmenge eindeutig charakteriert - z. B. eine Postadresse. Der Schlüssel könnte hier Vor- und Nachname sein. Über die Relation können nun andere Informationen in anderen Tabellen dazu aufgesucht werden, z. B. Rechnungen, Briefe, Behandlungen usw., ohne dass diese spezifische Konstellation an Informationen in einer ebenso spezifischen Tabelle stehen müsste.
Die relationale Datenbank im PC-Bereich schlechthin war lange Zeit dBase, das von AT&T aufgekauft und dann weiterentwickelt wurde. dBase wurde später von der Firma Borland gekauft. Die dBase-Abfragesprache hatte lange Zeit fast ebenso grosse Bedeutung wie heute SQL. Sie war in den Anfangsjahren eine "Killerapplikation" für den IBM-PC. Beispiele für relationale Datenbanken heute sind DB2, Interbase, Microsoft Access, Oracle, MySQL und PostgreSQL.
Vorgänger der relationalen Datenbanken waren die hierarchischen Datenbanken. In ihnen wurden die Datensätze in einer Baumstruktur nach dem Eltern-Kind-Prinzip abgelegt. Die großen Nachteile von hierarchischen Datenbanken waren, dass Verknüpfungen über mehrere Ebenen nicht möglich waren, und - bedingt durch die Baumstruktur - die langen Suchzeiten beim Auffinden eines bestimmten Datensatzes. Ein Beispiel für eine hierarchische Datenbank ist IMS.
Im Gegensatz zu hierarchischen Datenbanken können die Datensätze in Netzwerkdatenbanken auf mehreren Wegen verknüpft sein und nicht nur entlang Eltern-Kind-Relationen. Eine noch häufig eingesetzte Netzwerkdatenbank ist IDMS der Firma Computer Associates.
In neuerer Zeit kommen objektorientierte Datenbanken immer mehr auf. Bei relationalen Datenbanken geht es zuerst um die Struktur, in der die jeweiligen Daten gespeichert werden sollen. Objektorientierte Datenbanken dagegen folgen der objektorientierten Programmiermethode (siehe objektorientierte Programmierung), d. h. es kommen erst die Daten, an denen sich die Datenbankstruktur dann orientiert. Ein Beispiel für eine objektorientierte Datenbank ist Caché von Intersystems.
Objektrelationale Datenbanksysteme (ORDBMS) sind ein Bindeglied zwischen klassischen relationalen und objektorientierten Datenbanken. Sie kommen überall dort zum Einsatz, wo Mengen von Objekten in Relation zu anderen Daten oder Objekten gebracht werden müssen. Ein Einsatzgebiet sind unter anderem Systeme zur Erfassung geographischer Daten (GIS), bei denen Koordinaten miteinander verknüpft sind oder andere Daten referenzieren. Beispielsweise referenzieren mehrere Koordinanten-Objekte eine Straße; die Koordinaten stehen als in Relation mit einem Straßennamen und sind selbst Objekte, die zueinander eine Beziehung haben.
Begriffserklärungen
Eine Tabelle ist eine Zusammenfassung einer Anzahl von Datensätzen mit gleicher Struktur, vergleichbar einem Karteikasten. z. B. Adresstabelle: Name, Vorname, Straße, Hausnummer, Ort, Telefonnummer
Alle Informationen, die zusammen einen Datensatz (Entität, Record) ausmachen, sind als eine Zeile der Tabelle realisiert. Man kann den Datensatz als Zeile anschauen oder übersichtlicher als Formular auf einer Seite darstellen. Ein Datensatz ist vergleichbar mit einer Karte aus einem Karteikasten.
Ein (Daten-) Feld ist ein Teil eines Datensatzes, z. B. in einer Adresstabelle das Feld mit dem Nachnamen. In Feldern können sich Daten unterschiedlichster Art befinden, z. B. Text, Zahlen, Daten, Bilder, etc. Ein Feld ist vergleichbar einer Zeile auf einer Karte eines Karteikastens. Hierbei werden Schlüssel und Attribute unterschieden. Der Schlüssel dient zum Identifizieren und Verknüpfen von Datensätzen, Attribute enthalten vom Schlüssel abhängige Daten. (Beispiel: Personalnummer ist Schlüssel; Eintrittsdatum und Geburtsdatum sind Attribute).
Eine Abfrage dient der Ansicht einer oder mehrerer verknüpfter Tabellen bzw. Teilen davon. Das Ergebnis ist wiederum eine (temporäre) Tabelle, die nach bestimmten Kriterien gefiltert sein kann. Bei Karteikästen entspräche eine Abfrage der Auswahl einiger Karten nach bestimmten Kriterien, z. B. alle Kunden die mit A beginnen und daneben alle Karten der vom jeweiligen Kunden geliehenen Büchern.
Simple Abfragen sind z. B. Befehle zum alphabetischen Ordnen oder die Filterungen nach bestimmten Kriterien.
Üblicherweise werden Abfragen in der Abfragesprache SQL erstellt. Abfragen können bei den meisten DBMS auch ohne Wissen über SQL, mit den jeweiligen Hilfsprogrammen erstellt werden.
Die aufbereitete Ansicht und/oder Zusammenfassung mehrere Abfragen, dann letztendlich in Papierform, nennt man Report oder Bericht. Berichte oder Reports können mit vom Hersteller mitgelieferter (bzw. integrierter Software) oder von Fremdherstellern gelieferter Software erzeugt werden. Diese Berichtsgeneratoren sind aber nicht Bestandteil des eigentlich DBMS.
Verschiedene Datenbankverwaltungssysteme
- 4D, eine Entwicklungsumgebung für Mac OS und Windows
- Access wurde von der Microsoft gekauft und zu MS-Access gemacht
- ADABAS wurde von der Software AG entwickelt, Siehe http://www.softwareag.com/adabas/default.htm
- AscSam, eine Kombination von Datenbank und Textverarbeitung mit vielen innovativen Eigenschaften
- DB1
- DB2
- dBase war die meistverbreitete Datenbank für DOS, wurde für Windows zu Visual dBase
- FileMaker ursprünglich von Claris, eine sehr benutzerfreundliche relationelle Datenbank, funktioniert mit der gleicher Software sowohl unter Mac OS, wie auch unter Windows, die neueste Version ist 6.0
- Firebird
- FoxBase wurde von der Microsoft gekauft und zu MS FoxPro gemacht, bis zu Version 2.6 für DOS und Windows.
- IDMS
- IMS
- Ingres
- InterBase
- MS Access, ein Teil des MS Office, aktuelle Version 2002 (bzw. XP)
- MS Visual FoxPro, die derzeit aktuelle Version ist 8.0
- MS SQL-Server, aktuelle Version 2000 (8.0)
- Sybase, eine frühere Version wurde von Microsoft gekauft und zu MS SQL-Server gemacht.
- mySQL
- Oracle, aktuelle Version 9.0
- Paradox wurde von Borland entwickelt, später von Corel (Word Perfect Suite) weitergeführt
- PostgreSQL
- SAP DB
- Visual dBase, die letzte Version war 5.0, dann verschwand dBase vom Markt
Siehe auch: XML-Datenbank
Literatur
- Helmut Eirund, Ullrich Kohl: Datenbanken, leicht gemacht.Ein Arbeitsbuch für Nicht-Informatiker. Informatik & Praxis. 2000. ISBN 3-519-02644-9