SQL

SQL (Structured Query Language) ist eine Abfragesprache für relationale Datenbanken. Sie hat eine relativ einfache Syntax, die an die englische Umgangssprache angelehnt ist, und stellt eine Reihe von Befehlen zur Definition von Datenstrukturen nach der relationalen Algebra zur Manipulation von Datenbeständen (Anfügen, Bearbeiten und Löschen von Datensätzen) und zur Abfrage von Daten zur Verfügung. Durch ihre Rolle als Quasi-Standard ist SQL von großer Bedeutung, da eine weitgehende Unabhängigkeit von der benutzten Software erzielt werden kann. Die meisten SQL-Implementierungen bieten darüber hinaus allerdings noch herstellerspezifische Erweiterungen, die nicht dem Standard-Sprachumfang entsprechen.

Viele bekannte Datenbanksysteme wie DB2, Microsoft SQL Server, MySQL, Oracle, PostgreSQL und neueren Versionen von Access implementieren Teile des SQL Sprachstandards.

Geschichte

Die Grundlage aller relationalen Datenbanken legte 1970 Edgar F. Codd mit seinem Artikel "A Relational Model of Data for Large Shared Data Banks". Codd arbeitete damals im IBM-Forschungslabor in San Jose, Kalifornien. Bei den auf diesen Artikel folgenden weltweiten Forschungsarbeiten war ein Aspekt die Entwicklung relationaler Sprachen. Die Bedeutendste von der kommerziellen Sichtweise her war die "Structured English Query Language" SEQUEL, die in den IBM Forschungslabors 1974 entwickelt wurde. 1976 wurde SEQUEL /2 definiert und aus rechtlichen Gründen in SQL umbenannt. Der Prototyp System R wurde 1977 funktionsfähig implementiert und enthielt einen Großteil der Sprache SQL.

Nach den Erfolgen bei den Benutzern von System R beschlossen mehrere Firmen SQL-basierte Datenbanken auf den Markt zu bringen. Das System ORACLE der Firma Relational Software Inc. (später in Oracle Corporation umbenannt) kam 1980 vor IBMs SQL/DS (1981) auf den Markt. Die Urversion der noch aktuell verfügbaren SQL-Implementierung DB2 von IBM entstand 1983. INGRES folgte im Jahre 1985, SYBASE 1986. SQL hatte sich innerhalb von 10 Jahren zum de-facto-Standard in der Welt der Datenbanken etabliert.

Das American National Standards Institute (ANSI) beauftragte 1982 die Standardisierung einer relationalen Sprache, die 1986 ratifiziert wurde und zum guten Teil aus dem IBM-Dialekt von SQL bestand. 1987 wurde SQL/86 auch als ISO-Standard akzeptiert. Aktualisierungen und Erweiterungen erfolgten mit SQL/89, SQL/92 und SQL/99.

Neue SQL-Version SQL:2003 vor der Veröffentlichung Im Juni 2003 wurden bei einer Tagung der Arbeitsgruppe der ISO/IEC JTC1/SC32/WG3 in Stockholm die Arbeiten an 9 SQL-Dokumenten abgeschlossen. Die letzte Abstimmungsrunde startet in den nächsten Wochen und Anfang des Jahres 2004 sollten die Dokumente veröffentlicht werden.

Sprachelemente und Beispiele

Die Sprache SQL wird in drei Teilsprachen untergliedert: die Data Manipulation Language (DML, Datenabfrage und -manipulation), die Data Definition Language (DDL, Datendefinition) und die Data Control Language (DCL, Rechteverwaltung).

Data Manipulation Language: INSERT, UPDATE, DELETE

Befehle zur Datenabfrage: SELECT

select * from Adressen where Name="Müller"

Wählt alle Einträge aus der Tabelle Adressen, bei denen in der Spalte Name der Wert Müller steht.

select Name from Adressen order by Name

Zeigt die Inhalte der Spalte Name aus der Tabelle Adressen an. Da die abgefragten Datensätze im Normalfall nicht geordnet werden, muss ein Ordnungsbegriff (hier der Name) ausdrücklich angegeben werden.

select count (*) as Anzahl_Adressen from Adressen

Gibt die Anzahl der Datensätze in der Tabelle Adressen aus. Die Ausgabe besteht lediglich aus einer Zeile und einer Spalte, welche die Überschrift Anzahl_Adressen trägt.

select Name, count(*) as Anzahl from Adressen group by Name

Gibt alle vorkommenden Namen zusammen mit der Häufigkeit ihres Vorkommens aus.

Befehle zur Datenmanipulation: INSERT, UPDATE, DELETE

insert into Adressen (Name, Vorname, Ort) values ('Schroeder', 'Knut', 'Köln')

Fügt eine Zeile mit den geg. Werten für die Spalten Name, Vorname und Ort in die Tabelle Adressen hinzu.

update Adressen set Ort="Berlin", Telefon="030..." where Name="Schroeder"

Ändert das Feld Ort aller Einträge auf "Berlin" (Telefon auf ... usw) wenn dieser Eintrag als Namen "Schroeder" aufweist.

delete from Adressen

Löscht alle Einträge aus der Tabelle "Adressen".

truncate table Adressen

Wie oben, aber nur von einigen DBMS unterstützt. Im Gegensatz zu delete nicht transaktionssicher.

delete from Adressen where name="Müller"

Löscht alle Datensätze aus der Tabelle Adressen mit dem Namen Müller.

oder anders

Data Definition Language: CREATE, ALTER, DROP

Befehle zur Datendefinition: CREATE, ALTER, DROP

create table Laender (Kuerzel_ISO character (2) primary key, Land_Name varchar2 (50) not null)

Erzeugt eine neue Tabelle namens Laender mit den Spalten Kuerzel_ISO und Land_Name, wobei Kuerzel_ISO der Primärschlüssel ist und in keiner der Spalten leere Felder erlaubt sind.

alter table Laender add Kuerzel_Auto varchar2 (3)

Definiert eine neue Spalte namens Kuerzel_Auto in der Tabelle Laender.

drop table Adressen

Löscht die gesamte Tabelle Adressen.

create index idx_Adressen on Adressen (Name)

Legt einen Index auf die Spalte Name der Tabelle Adressen. der Index bekommt die Bezeichnung idx_Adressen und beschleunigt die Suche nach Datensätzen in der Tabelle Adressen, wenn der Name als Suchkriterium angegeben wird.

drop index idx_Adressen

Löscht den Index idx_Adressen.

Data Control Language: GRANT and REVOKE

Befehle zur Vergabe von Rechten.

grant select,update on table Adressen to groupx

Gestattet dem Benutzer bzw. der Gruppe groupx einen lesenden und ändernden Zugriff auf die Tabelle Adressen.

revoke execute on procedure DSN8ED6 from public

Entzieht allen nicht explizit berechtigten Benutzern das Recht, die Stored-Procedure DSN8ED6 auszuführen. Berechtigungen, die einem Benutzer oder einer Gruppe erteilt wurden, bleiben bestehen.

SQL-Datentypen

In den oben vorgestellten Befehlen create table und alter table wird bei der Definition jeder Spalte angegeben, welches Datenformat sie unterstützen soll. Dazu liefert SQL eine ganze Reihe standardisierter Datentypen mit. Dies sind die wichtigsten von ihnen:

integer

Ganzzahl (positiv oder negativ)

number (n)

Ganzzahl (positiv oder negativ) mit maximal n Stellen

number (n, m)

Festkommazahl (positiv oder negativ) mit maximal n Stellen, davon m nach dem Komma

float (m)

Gleitkommazahl (positiv oder negativ) mit maximal m Stellen nach dem Komma

character (n)

Zeichenkette (also Text) mit n druckbaren und/oder nicht druckbaren Zeichen

varchar (n), varchar2 (n)

Zeichenkette (also Text) mit maximal n druckbaren und/oder nicht druckbaren Zeichen. Die Variante varchar2 ist für Oracle spezifisch.

date

Datum (bei Oracle inklusive Uhrzeit)

boolean

Boolesche Variable (kann die Werte true (wahr) oder false (falsch) annehmen). Dieser Datentyp fehlt in Oracle.

raw (n)

Binärdaten von maximal n Bytes Länge

SQL - Begrifflichkeiten

Primärschlüssel

In jeder Tabelle sollte grundsätzlich ein Primärschlüssel definiert werden. Dieser ist entweder der natürliche Schlüssel der Tabelle oder ein künstlicher, bspw. ein Zähler, der pro Datensatz hoch gezählt wird. Dieser Schlüssel ermöglicht es, dass jeder Datensatz innerhalb der Tabelle eindeutig ist. Über den Schlüssel, kann man den Datensatz eindeutig identifizieren. Ein Primärschlüssel kann auch aus mehreren Attributen der Tabelle bestehen (zusammengesetzter Primärschlüssel). Kein anderer Datensatz kann in dieser Tabelle denselben Schlüssel erhalten.

Fremdschlüssel

Im Bereich der Relationalen Datenbanken bezeichnet der Fremdschlüssel ein Attribut einer Relation (Tabelle), das auf ein primäres Attribut einer anderen Relation verweist. Ein Fremdschlüssel kann, muss aber nicht Primärschlüssel seiner Relation sein.

Datenbank-Session

Eine Datenbank-Session ist sozusagen eine Sitzung. Sobald man sich in eine Datenbank eingeloggt hat, beginnt die Session (Sitzung). Erst mit dem Ausloggen beenden wir die Session (Sitzung).

Transaktion, Commit und Rollback

Loggt man sich in eine Datenbank ein, kann man Änderungen an den Tabellen oder den Daten vornehmen. Man kann eine Transaktion mittels begin transaction starten. Wenn man etwas außerhalb einer manuell gestarteten Transaktion ändert, hat man automatisch eine Transaktion gestartet, die sofort wieder beendet wird.Die Änderungen werden erst dann endgültig in die Datenbank übernommen, wenn die Transaktion erfolgreich beendet wird. Eine Transaktion beendet man mit dem Befehl Commit. Mit dem Befehl Rollback wird die Transaktion ebenfalls beendet, es werden jedoch alle Änderungen seit Beginn der Transaktion wieder rückgängig gemacht.

Dateninkonsistenz

Eine nicht Übereinstimmung von Daten nennt man Dateninkonsistenz. Das passiert immer dann, wenn bspw. eine Tabelle auf einen Wert einer anderen Tabelle weist, dieser Wert jedoch nicht mehr vorhanden ist.

Eine Dateninkonsistenz kann auch dann vorkommen, wenn sich Transaktionen gegenseitig beeinflussen könnten und so Bedingungen innerhalb einer Transaktion nachträglich falsch werden könnten.

referentielle Integrität

Um eine Dateninkonsistenz zu vermeiden, verknüpft man die Tabellen untereinander. Über die Verbindung mit Fremdschlüssen kann man nun angeben was passieren soll, wenn ein verknüpfter Datensatz gelöscht oder geändert wird. Beim Löschen kann man zum Beispiel eine Kaskadierung des Löschens auf alle über Fremdschlüssel verknüpften Datensätze erreichen oder das Verbieten des Löschvorgangs. Beim Update kann man die Änderung in den referenzierenden Tabellen ebenfalls durchführen.

Redundanz

Ein Grundsatz einer guten Datenbank ist, dass innerhalb einer Datenbank niemals zwei Zeilen identisch sein sollten. Man spricht dann von einer redundanzfreien Datenbank. Durch einen Primärschlüssel pro Tabelle ist dieser Grundsatz realisierbar. Der Primärschlüssel sorgt dafür, dass jeder Datensatz eine eigene, eindeutige Nummer erhält und somit zwei Datensätze niemals identisch sein können.

Statisches und Dynamisches SQL

Die meisten Datenbanken, welche SQL unterstützen, unterscheiden zwischen statischem und dynamischem SQL.

Bei statischem SQL sind die SQL-Anweisungen fest in einem Anwendungsprogramm kodiert (so genanntes Embedded SQL). Während der Programmvorbereitung übersetzt ein Precompiler die SQL-Befehle in Funktionsaufrufe, anschließend definiert ein Optimizer den besten Zugriffspfad auf die Daten und speichert diesen im Datenbanksystem ab.

Dynamisches SQL wird dagegen während der Laufzeit eines Programms interpretiert und der Zugriffspfad wird bei jedem Durchlauf neu optimiert.

Beide Arten von SQL haben ihre Vor- und Nachteile. Statisches SQL mit voroptimierten Zugriffen erspart den aufwändigen Aufruf des Optimizers und wird deshalb häufig für zeitkritische Transaktionsverarbeitungen gebraucht. Das flexiblere dynamische SQL kommt dort zum Tragen, wo zur Codierzeit die auszuführenden SQL - Anweisungen noch nicht bekannt sind.

SQL-Datenbanksysteme

Adabas - eine kommerzielle Datenbank von der Software AG.
DB2 - eine kommerzielle Datenbank von IBM.
dBase IV
Firebird
GUPTA
Informix
INGRES
InterBase
JetSQL
Microsoft Access
Microsoft SQL Server
MySQL - eine sehr verbreitete Open-Source-Datenbank.
PostgreSQL - ebenfalls eine sehr verbreitete Open Source-Datenbank, die für Linux und Unix verfügbar ist.
Oracle - eine kommerzielle Datenbank vom gleichnamigen Unternehmen.
MaxDB früher unter dem Namen SAP DB bekannte, jetzt von MySQL weiterentwickelte Datenbank.
SQLite
SYBASE
Transact SQL
Teradata
YARD-SQL

Literatur

Günter Matthiessen, Michael Unterstein: Relationale Datenbanken und SQL - Konzepte der Entwicklung und Anwendung, Addison-Wesley, ISBN 3-8273-2085-2
Edwin Schicker: Datenbanken und SQL - Eine praxisorientierte Einführung, Teubner, ISBN 3-519-02991-X

Obwohl bereits etwas betagt, ist dieses Buch gerade als wissenschaftlich fundierte und trotzdem leicht verständliche Einführung in SQL sehr zu empfehlen.

Oliver Bartosch, Markus Throll: Einstieg in SQL, Galileo Press, ISBN 3-89842-497-9
Daniel Warner, Günter Leitenbauer: SQL, Franzis, ISBN 3-7723-7527-8
Jörg Fritze, Jürgen Marsch: Erfolgreiche Datenbankanwendung mit SQL3. Praxisorientierte Anleitung - effizienter Einsatz - inklusive SQL-Tuning, Vieweg Verlag, ISBN 3-528-55210-7
Can Türker: SQL 1999 & SQL 2003, Dpunkt Verlag, ISBN 3-89864-219-4
Gregor Kuhlmann, Friedrich Müllmerstadt: SQL, Rowohlt, ISBN 3-499-61245-3
Michael J. Hernandez, John L. Viescas: Go To SQL, Addison-Wesley, ISBN 3-8273-1772-X

Weblinks

Siehe auch: SQL-Injection