SQL
SQL (Structured Query Language) ist eine Abfragesprache für relationale Datenbanken. Sie hat eine relativ einfache Syntax, die an die englische Umgangssprache angelehnt ist, und stellt eine Reihe von Befehlen zur Definition von Datenstrukturen nach der relationalen Algebra zur Manipulation von Datenbeständen (Anfügen, Bearbeiten und Löschen von Datensätzen) und zur Abfrage von Daten zur Verfügung. Durch ihre Rolle als Quasi-Standard ist SQL von großer Bedeutung, da eine weitgehende Unabhängigkeit von der benutzten Software erzielt werden kann. Die meisten SQL-Implementierungen bieten darüber hinaus allerdings noch herstellerspezifische Erweiterungen, die nicht dem Standard-Sprachumfang entsprechen.
Viele bekannte Datenbanksysteme wie DB2, Microsoft SQL Server, MySQL, Oracle, PostgreSQL und neueren Versionen von Access implementieren Teile des SQL Sprachstandards.
Geschichte
Die Grundlage aller relationalen Datenbanken legte 1970 Edgar F. Codd mit seinem Artikel "A Relational Model of Data for Large Shared Data Banks". Codd arbeitete damals im IBM-Forschungslabor in San Jose, Kalifornien. Bei den auf diesen Artikel folgenden weltweiten Forschungsarbeiten war ein Aspekt die Entwicklung relationaler Sprachen. Die Bedeutendste von der kommerziellen Sichtweise her war die "Structured English Query Language" SEQUEL, die in den IBM Forschungslabors 1974 entwickelt wurde. 1976 wurde SEQUEL /2 definiert und aus rechtlichen Gründen in SQL umbenannt. Der Prototyp System R wurde 1977 funktionsfähig implementiert und enthielt einen Großteil der Sprache SQL.
Nach den Erfolgen bei den Benutzern von System R beschlossen mehrere Firmen SQL-basierte Datenbanken auf den Markt zu bringen. Das System ORACLE der Firma Relational Software Inc. (später in Oracle Corporation umbenannt) kam 1980 vor IBMs SQL/DS (1981) auf den Markt. Die Urversion der noch aktuell verfügbaren SQL-Implementierung DB2 von IBM entstand 1983. INGRES folgte im Jahre 1985, SYBASE 1986. SQL hatte sich innerhalb von 10 Jahren zum de-facto-Standard in der Welt der Datenbanken etabliert.
Das American National Standards Institute (ANSI) beauftragte 1982 die Standardisierung einer relationalen Sprache, die 1986 ratifiziert wurde und zum guten Teil aus dem IBM-Dialekt von SQL bestand. 1987 wurde SQL/86 auch als ISO-Standard akzeptiert. Aktualisierungen und Erweiterungen erfolgten mit SQL/89, SQL/92 und SQL/99.
Neue SQL-Version SQL:2003 vor der Veröffentlichung Im Juni 2003 wurden bei einer Tagung der Arbeitsgruppe der ISO/IEC JTC1/SC32/WG3 in Stockholm die Arbeiten an 9 SQL-Dokumenten abgeschlossen. Die letzte Abstimmungsrunde startet in den nächsten Wochen und Anfang des Jahres 2004 sollten die Dokumente veröffentlicht werden.
Sprachelemente und Beispiele
Die Sprache SQL wird in drei Teilsprachen untergliedert: die Data Manipulation Language (DML, Datenabfrage und -manipulation), die Data Definition Language (DDL, Datendefinition) und die Data Control Language (DCL, Rechteverwaltung).
Data Manipulation Language: INSERT, UPDATE, DELETE
Befehle zur Datenabfrage: SELECT
select * from Adressen where Name="Müller"
select Name from Adressen order by Name
- Zeigt die Inhalte der Spalte Name aus der Tabelle Adressen an. Da die abgefragten Datensätze im Normalfall nicht geordnet werden, muss ein Ordnungsbegriff (hier der Name) ausdrücklich angegeben werden.
select count (*) as Anzahl_Adressen from Adressen
- Gibt die Anzahl der Datensätze in der Tabelle Adressen aus. Die Ausgabe besteht lediglich aus einer Zeile und einer Spalte, welche die Überschrift Anzahl_Adressen trägt.
select Name, count(*) as Anzahl from Adressen group by Name
- Gibt alle vorkommenden Namen zusammen mit der Häufigkeit ihres Vorkommens aus.
Befehle zur Datenmanipulation: INSERT, UPDATE, DELETE
insert into Adressen (Name, Vorname, Ort) values ('Schroeder', 'Knut', 'Köln')
- Fügt eine Zeile mit den geg. Werten für die Spalten Name, Vorname und Ort in die Tabelle Adressen hinzu.
update Adressen set Ort="Berlin", Telefon="030..." where Name="Schroeder"
- Ändert das Feld Ort aller Einträge auf "Berlin" (Telefon auf ... usw) wenn dieser Eintrag als Namen "Schroeder" aufweist.
delete from Adressen
- Löscht alle Einträge aus der Tabelle "Adressen".
truncate table Adressen
- Wie oben, aber nur von einigen DBMS unterstützt. Im Gegensatz zu delete nicht transaktionssicher.
delete from Adressen where name="Müller"
- Löscht alle Datensätze aus der Tabelle Adressen mit dem Namen Müller.
oder anders
Data Definition Language: CREATE, ALTER, DROP
Befehle zur Datendefinition: CREATE, ALTER, DROP
create table Laender (Kuerzel_ISO character (2) primary key, Land_Name varchar2 (50) not null)
- Erzeugt eine neue Tabelle namens Laender mit den Spalten Kuerzel_ISO und Land_Name, wobei Kuerzel_ISO der Primärschlüssel ist und in keiner der Spalten leere Felder erlaubt sind.
alter table Laender add Kuerzel_Auto varchar2 (3)
- Definiert eine neue Spalte namens Kuerzel_Auto in der Tabelle Laender.
drop table Adressen
- Löscht die gesamte Tabelle Adressen.
create index idx_Adressen on Adressen (Name)
- Legt einen Index auf die Spalte Name der Tabelle Adressen. der Index bekommt die Bezeichnung idx_Adressen und beschleunigt die Suche nach Datensätzen in der Tabelle Adressen, wenn der Name als Suchkriterium angegeben wird.
drop index idx_Adressen
- Löscht den Index idx_Adressen.
Data Control Language: GRANT and REVOKE
Befehle zur Vergabe von Rechten.
grant select,update on table Adressen to groupx
- Gestattet dem Benutzer bzw. der Gruppe groupx einen lesenden und ändernden Zugriff auf die Tabelle Adressen.
revoke execute on procedure DSN8ED6 from public
- Entzieht allen nicht explizit berechtigten Benutzern das Recht, die Stored-Procedure DSN8ED6 auszuführen. Berechtigungen, die einem Benutzer oder einer Gruppe erteilt wurden, bleiben bestehen.
SQL-Datentypen
In den oben vorgestellten Befehlen create table
und alter table
wird bei der Definition jeder Spalte angegeben, welches Datenformat sie unterstützen soll. Dazu liefert SQL eine ganze Reihe standardisierter Datentypen mit. Dies sind die wichtigsten von ihnen:
integer
- Ganzzahl (positiv oder negativ)
number (n)
- Ganzzahl (positiv oder negativ) mit maximal
n
Stellen
number (n, m)
- Festkommazahl (positiv oder negativ) mit maximal
n
Stellen, davonm
nach dem Komma
float (m)
- Gleitkommazahl (positiv oder negativ) mit maximal
m
Stellen nach dem Komma
character (n)
- Zeichenkette (also Text) mit
n
druckbaren und/oder nicht druckbaren Zeichen
varchar (n)
,varchar2 (n)
- Zeichenkette (also Text) mit maximal
n
druckbaren und/oder nicht druckbaren Zeichen. Die Variantevarchar2
ist für Oracle spezifisch.
date
- Datum (bei Oracle inklusive Uhrzeit)
boolean
- Boolesche Variable (kann die Werte
true
(wahr) oderfalse
(falsch) annehmen). Dieser Datentyp fehlt in Oracle.
raw (n)
- Binärdaten von maximal
n
Bytes Länge
SQL - Begrifflichkeiten
In jeder Tabelle sollte grundsätzlich ein Primärschlüssel definiert werden. Dieser ist entweder der natürliche Schlüssel der Tabelle oder ein künstlicher, bspw. ein Zähler, der pro Datensatz hoch gezählt wird. Dieser Schlüssel ermöglicht es, dass jeder Datensatz innerhalb der Tabelle eindeutig ist. Über den Schlüssel, kann man den Datensatz eindeutig identifizieren. Ein Primärschlüssel kann auch aus mehreren Attributen der Tabelle bestehen (zusammengesetzter Primärschlüssel). Kein anderer Datensatz kann in dieser Tabelle denselben Schlüssel erhalten.
Im Bereich der Relationalen Datenbanken bezeichnet der Fremdschlüssel ein Attribut einer Relation (Tabelle), das auf ein primäres Attribut einer anderen Relation verweist. Ein Fremdschlüssel kann, muss aber nicht Primärschlüssel seiner Relation sein.
Eine Datenbank-Session ist sozusagen eine Sitzung. Sobald man sich in eine Datenbank eingeloggt hat, beginnt die Session (Sitzung). Erst mit dem Ausloggen beenden wir die Session (Sitzung).
Transaktion, Commit und Rollback
Loggt man sich in eine Datenbank ein, kann man Änderungen an den Tabellen oder den Daten vornehmen. Man kann eine Transaktion mittels begin transaction
starten. Wenn man etwas außerhalb einer manuell gestarteten Transaktion ändert, hat man automatisch eine Transaktion gestartet, die sofort wieder beendet wird.Die Änderungen werden erst dann endgültig in die Datenbank übernommen, wenn die Transaktion erfolgreich beendet wird.
Eine Transaktion beendet man mit dem Befehl Commit
.
Mit dem Befehl Rollback
wird die Transaktion ebenfalls beendet, es werden jedoch alle Änderungen seit Beginn der Transaktion wieder rückgängig gemacht.
Eine nicht Übereinstimmung von Daten nennt man Dateninkonsistenz. Das passiert immer dann, wenn bspw. eine Tabelle auf einen Wert einer anderen Tabelle weist, dieser Wert jedoch nicht mehr vorhanden ist.
Eine Dateninkonsistenz kann auch dann vorkommen, wenn sich Transaktionen gegenseitig beeinflussen könnten und so Bedingungen innerhalb einer Transaktion nachträglich falsch werden könnten.
Um eine Dateninkonsistenz zu vermeiden, verknüpft man die Tabellen untereinander. Über die Verbindung mit Fremdschlüssen kann man nun angeben was passieren soll, wenn ein verknüpfter Datensatz gelöscht oder geändert wird. Beim Löschen kann man zum Beispiel eine Kaskadierung des Löschens auf alle über Fremdschlüssel verknüpften Datensätze erreichen oder das Verbieten des Löschvorgangs. Beim Update kann man die Änderung in den referenzierenden Tabellen ebenfalls durchführen.
Ein Grundsatz einer guten Datenbank ist, dass innerhalb einer Datenbank niemals zwei Zeilen identisch sein sollten. Man spricht dann von einer redundanzfreien Datenbank. Durch einen Primärschlüssel pro Tabelle ist dieser Grundsatz realisierbar. Der Primärschlüssel sorgt dafür, dass jeder Datensatz eine eigene, eindeutige Nummer erhält und somit zwei Datensätze niemals identisch sein können.
Statisches und Dynamisches SQL
Die meisten Datenbanken, welche SQL unterstützen, unterscheiden zwischen statischem und dynamischem SQL.
Bei statischem SQL sind die SQL-Anweisungen fest in einem Anwendungsprogramm kodiert (so genanntes Embedded SQL). Während der Programmvorbereitung übersetzt ein Precompiler die SQL-Befehle in Funktionsaufrufe, anschließend definiert ein Optimizer den besten Zugriffspfad auf die Daten und speichert diesen im Datenbanksystem ab.
Dynamisches SQL wird dagegen während der Laufzeit eines Programms interpretiert und der Zugriffspfad wird bei jedem Durchlauf neu optimiert.
Beide Arten von SQL haben ihre Vor- und Nachteile. Statisches SQL mit voroptimierten Zugriffen erspart den aufwändigen Aufruf des Optimizers und wird deshalb häufig für zeitkritische Transaktionsverarbeitungen gebraucht. Das flexiblere dynamische SQL kommt dort zum Tragen, wo zur Codierzeit die auszuführenden SQL - Anweisungen noch nicht bekannt sind.
SQL-Datenbanksysteme
- Adabas - eine kommerzielle Datenbank von der Software AG.
- DB2 - eine kommerzielle Datenbank von IBM.
- dBase IV
- Firebird
- GUPTA
- Informix
- INGRES
- InterBase
- JetSQL
- Microsoft Access
- Microsoft SQL Server
- MySQL - eine sehr verbreitete Open-Source-Datenbank.
- PostgreSQL - ebenfalls eine sehr verbreitete Open Source-Datenbank, die für Linux und Unix verfügbar ist.
- Oracle - eine kommerzielle Datenbank vom gleichnamigen Unternehmen.
- MaxDB früher unter dem Namen SAP DB bekannte, jetzt von MySQL weiterentwickelte Datenbank.
- SQLite
- SYBASE
- Transact SQL
- Teradata
- YARD-SQL
Literatur
- Günter Matthiessen, Michael Unterstein: Relationale Datenbanken und SQL - Konzepte der Entwicklung und Anwendung, Addison-Wesley, ISBN 3-8273-2085-2
- Edwin Schicker: Datenbanken und SQL - Eine praxisorientierte Einführung, Teubner, ISBN 3-519-02991-X
- Obwohl bereits etwas betagt, ist dieses Buch gerade als wissenschaftlich fundierte und trotzdem leicht verständliche Einführung in SQL sehr zu empfehlen.
- Oliver Bartosch, Markus Throll: Einstieg in SQL, Galileo Press, ISBN 3-89842-497-9
- Daniel Warner, Günter Leitenbauer: SQL, Franzis, ISBN 3-7723-7527-8
- Jörg Fritze, Jürgen Marsch: Erfolgreiche Datenbankanwendung mit SQL3. Praxisorientierte Anleitung - effizienter Einsatz - inklusive SQL-Tuning, Vieweg Verlag, ISBN 3-528-55210-7
- Can Türker: SQL 1999 & SQL 2003, Dpunkt Verlag, ISBN 3-89864-219-4
- Gregor Kuhlmann, Friedrich Müllmerstadt: SQL, Rowohlt, ISBN 3-499-61245-3
- Michael J. Hernandez, John L. Viescas: Go To SQL, Addison-Wesley, ISBN 3-8273-1772-X
Weblinks
- SQL-Tutorium
- SQL-Tutorial aus der W3C Schule (Englisch)
- SQL-Beispiele für typische betriebswirtschaftliche Problemstellungen
- MySQL Webseite
- PostgreSQL Webseite
- SQLite Website
- SQL Kurzreferenz
- SQL Hilfe und Tutorial
Siehe auch: SQL-Injection