SQL

relationale Datenbank-Abfragesprache
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 4. November 2004 um 12:36 Uhr durch 195.127.176.90 (Diskussion) (Befehle zur Datenmanipulation: INSERT, UPDATE, DELETE). Sie kann sich erheblich von der aktuellen Version unterscheiden.

SQL (Structured Query Language) ist eine Abfragesprache für relationale Datenbanken. Sie hat eine relativ einfache Syntax, die an die englische Umgangssprache angelehnt ist, und stellt eine Reihe von Befehlen zur Definition von Datenstrukturen nach der relationalen Algebra zur Manipulation von Datenbeständen (Anfügen, Bearbeiten und Löschen von Datensätzen) und zur Abfrage von Daten zur Verfügung. Durch ihre Rolle als Quasi-Standard ist SQL von großer Bedeutung, da eine weitgehende Unabhängigkeit von der benutzten Software erzielt werden kann. Die meisten SQL-Implementierungen bieten darüber hinaus allerdings noch herstellerspezifische Erweiterungen, die nicht dem Standard-Sprachumfang entsprechen.

Viele bekannte Datenbanksysteme wie DB2, Microsoft SQL Server, MySQL, Oracle, PostgreSQL und neueren Versionen von Access implementieren Teile des SQL Sprachstandards.


Geschichte

Die Grundlage aller relationalen Datenbanken legte 1970 Edgar F. Codd mit seinem Artikel "A Relational Model of Data for Large Shared Data Banks". Codd arbeitete damals im IBM-Forschungslabor in San Jose, Kalifornien. Bei den auf diesen Artikel folgenden weltweiten Forschungsarbeiten war ein Aspekt die Entwicklung relationaler Sprachen. Die Bedeutendste von der kommerziellen Sichtweise her war die "Structured English Query Language" SEQUEL, die in den IBM Forschungslabors 1974 entwickelt wurde. 1976 wurde SEQUEL /2 definiert und aus rechtlichen Gründen in SQL umbenannt. Der Prototyp System R wurde 1977 funktionsfähig implementiert und enthielt einen Großteil der Sprache SQL.

Nach den Erfolgen bei den Benutzern von System R beschlossen mehrere Firmen SQL-basierte Datenbanken auf den Markt zu bringen. Das System ORACLE der Firma Relational Software Inc. (später in Oracle Corporation umbenannt) kam 1980 vor IBMs SQL/DS (1981) auf den Markt. Die Urversion der noch aktuell verfügbaren SQL-Implementierung DB2 von IBM entstand 1983. INGRES folgte im Jahre 1985, SYBASE 1986. SQL hatte sich innerhalb von 10 Jahren zum de-facto-Standard in der Welt der Datenbanken etabliert.

Das American National Standards Institute (ANSI) beauftragte 1982 die Standardisierung einer relationalen Sprache, die 1986 ratifiziert wurde und zum guten Teil aus dem IBM-Dialekt von SQL bestand. 1987 wurde SQL/86 auch als ISO-Standard akzeptiert. Aktualisierungen und Erweiterungen erfolgten mit SQL/89, SQL/92 und SQL/99.

Neue SQL-Version SQL:2003 vor der Veröffentlichung Im Juni 2003 wurden bei einer Tagung der Arbeitsgruppe der ISO/IEC JTC1/SC32/WG3 in Stockholm die Arbeiten an 9 SQL-Dokumenten abgeschlossen. Die letzte Abstimmungsrunde startet in den nächsten Wochen und Anfang des Jahres 2004 sollten die Dokumente veröffentlicht werden.

Sprachelemente und Beispiele

Die Sprache SQL wird in drei Teilsprachen untergliedert: die Data Manipulation Language (DML, Datenabfrage und -manipulation), die Data Definition Language (DDL, Datendefinition) und die Data Control Language (DCL, Rechteverwaltung).

Data Manipulation Language: INSERT, UPDATE, DELETE

Befehle zur Datenabfrage: SELECT

  • select * from Adressen where Name="Müller"
Wählt alle Einträge aus der Tabelle Adressen, bei denen in der Spalte Name der Wert Müller steht.
  • select Name from Adressen order by Name
Zeigt die Inhalte der Spalte Name aus der Tabelle Adressen an. Da die abgefragten Datensätze im Normalfall nicht geordnet werden, muss ein Ordnungsbegriff (hier der Name) ausdrücklich angegeben werden.
  • select count (*) as Anzahl_Adressen from Adressen
Gibt die Anzahl der Datensätze in der Tabelle Adressen aus. Die Ausgabe besteht lediglich aus einer Zeile und einer Spalte, welche die Überschrift Anzahl_Adressen trägt.
  • select Name, count(*) as Anzahl from Adressen group by Name
Gibt alle vorkommenden Namen zusammen mit der Häufigkeit ihres Vorkommens aus.

Befehle zur Datenmanipulation: INSERT, UPDATE, DELETE

  • insert into Adressen (Name, Vorname, Ort) values ('Schroeder', 'Knut', 'Köln')
Fügt eine Zeile mit den geg. Werten für die Spalten Name, Vorname und Ort in die Tabelle Adressen hinzu.
  • update Adressen set Ort="Berlin", Telefon="030..." where Name="Schroeder"
Ändert das Feld Ort aller Einträge auf "Berlin" (Telefon auf ... usw) wenn dieser Eintrag als Namen "Schroeder" aufweist.
  • delete from Adressen
Löscht alle Einträge aus der Tabelle "Adressen".
  • truncate table Adressen
Wie oben, aber nur von einigen DBMS unterstützt. Im Gegensatz zu delete nicht transaktionssicher.
  • delete from Adressen where name="Müller"
Löscht alle Datensätze aus der Tabelle Adressen mit dem Namen Müller.

oder anders

Data Definition Language: CREATE, ALTER, DROP

Befehle zur Datendefinition: CREATE, ALTER, DROP

  • create table Laender (Kuerzel_ISO character (2) primary key, Land_Name varchar2 (50) not null)
Erzeugt eine neue Tabelle namens Laender mit den Spalten Kuerzel_ISO und Land_Name, wobei Kuerzel_ISO der Primärschlüssel ist und in keiner der Spalten leere Felder erlaubt sind.
  • alter table Laender add Kuerzel_Auto varchar2 (3)
Definiert eine neue Spalte namens Kuerzel_Auto in der Tabelle Laender.
  • drop table Adressen
Löscht die gesamte Tabelle Adressen.
  • create index idx_Adressen on Adressen (Name)
Legt einen Index auf die Spalte Name der Tabelle Adressen. der Index bekommt die Bezeichnung idx_Adressen und beschleunigt die Suche nach Datensätzen in der Tabelle Adressen, wenn der Name als Suchkriterium angegeben wird.
  • drop index idx_Adressen
Löscht den Index idx_Adressen.

Data Control Language: GRANT and REVOKE

Befehle zur Vergabe von Rechten.

  • grant select,update on table Adressen to groupx
Gestattet dem Benutzer bzw. der Gruppe groupx einen lesenden und ändernden Zugriff auf die Tabelle Adressen.
  • revoke execute on procedure DSN8ED6 from public
Entzieht allen nicht explizit berechtigten Benutzern das Recht, die Stored-Procedure DSN8ED6 auszuführen. Berechtigungen, die einem Benutzer oder einer Gruppe erteilt wurden, bleiben bestehen.

SQL-Datentypen

In den oben vorgestellten Befehlen create table und alter table wird bei der Definition jeder Spalte angegeben, welches Datenformat sie unterstützen soll. Dazu liefert SQL eine ganze Reihe standardisierter Datentypen mit. Dies sind die wichtigsten von ihnen:

  • integer
Ganzzahl (positiv oder negativ)
  • number (n)
Ganzzahl (positiv oder negativ) mit maximal n Stellen
  • number (n, m)
Festkommazahl (positiv oder negativ) mit maximal n Stellen, davon m nach dem Komma
  • float (m)
Gleitkommazahl (positiv oder negativ) mit maximal m Stellen nach dem Komma
  • character (n)
Zeichenkette (also Text) mit n druckbaren und/oder nicht druckbaren Zeichen
  • varchar (n), varchar2 (n)
Zeichenkette (also Text) mit maximal n druckbaren und/oder nicht druckbaren Zeichen. Die Variante varchar2 ist für Oracle spezifisch.
  • date
Datum (bei Oracle inklusive Uhrzeit)
  • boolean
Boolesche Variable (kann die Werte true (wahr) oder false (falsch) annehmen). Dieser Datentyp fehlt in Oracle.
  • raw (n)
Binärdaten von maximal n Bytes Länge

SQL - Begrifflichkeiten

In jeder Tabelle sollte grundsätzlich ein Primärschlüssel definiert werden. Dieser ist entweder der natürliche Schlüssel der Tabelle oder ein künstlicher, bspw. ein Zähler, der pro Datensatz hoch gezählt wird. Dieser Schlüssel ermöglicht es, dass jeder Datensatz innerhalb der Tabelle eindeutig ist. Über den Schlüssel, kann man den Datensatz eindeutig identifizieren. Ein Primärschlüssel kann auch aus mehreren Attributen der Tabelle bestehen (zusammengesetzter Primärschlüssel). Kein anderer Datensatz kann in dieser Tabelle denselben Schlüssel erhalten.

Im Bereich der Relationalen Datenbanken bezeichnet der Fremdschlüssel ein Attribut einer Relation (Tabelle), das auf ein primäres Attribut einer anderen Relation verweist. Ein Fremdschlüssel kann, muss aber nicht Primärschlüssel seiner Relation sein.

Eine Datenbank-Session ist sozusagen eine Sitzung. Sobald man sich in eine Datenbank eingeloggt hat, beginnt die Session (Sitzung). Erst mit dem Ausloggen beenden wir die Session (Sitzung).


Loggt man sich in eine Datenbank ein, kann man Änderungen an den Tabellen oder den Daten vornehmen. Man kann eine Transaktion mittels begin transaction starten. Wenn man etwas außerhalb einer manuell gestarteten Transaktion ändert, hat man automatisch eine Transaktion gestartet, die sofort wieder beendet wird.Die Änderungen werden erst dann endgültig in die Datenbank übernommen, wenn die Transaktion erfolgreich beendet wird. Eine Transaktion beendet man mit dem Befehl Commit. Mit dem Befehl Rollback wird die Transaktion ebenfalls beendet, es werden jedoch alle Änderungen seit Beginn der Transaktion wieder rückgängig gemacht.

Eine nicht Übereinstimmung von Daten nennt man Dateninkonsistenz. Das passiert immer dann, wenn bspw. eine Tabelle auf einen Wert einer anderen Tabelle weist, dieser Wert jedoch nicht mehr vorhanden ist.

Eine Dateninkonsistenz kann auch dann vorkommen, wenn sich Transaktionen gegenseitig beeinflussen könnten und so Bedingungen innerhalb einer Transaktion nachträglich falsch werden könnten.

Um eine Dateninkonsistenz zu vermeiden, verknüpft man die Tabellen untereinander. Über die Verbindung mit Fremdschlüssen kann man nun angeben was passieren soll, wenn ein verknüpfter Datensatz gelöscht oder geändert wird. Beim Löschen kann man zum Beispiel eine Kaskadierung des Löschens auf alle über Fremdschlüssel verknüpften Datensätze erreichen oder das Verbieten des Löschvorgangs. Beim Update kann man die Änderung in den referenzierenden Tabellen ebenfalls durchführen.

Ein Grundsatz einer guten Datenbank ist, dass innerhalb einer Datenbank niemals zwei Zeilen identisch sein sollten. Man spricht dann von einer redundanzfreien Datenbank. Durch einen Primärschlüssel pro Tabelle ist dieser Grundsatz realisierbar. Der Primärschlüssel sorgt dafür, dass jeder Datensatz eine eigene, eindeutige Nummer erhält und somit zwei Datensätze niemals identisch sein können.

Statisches und Dynamisches SQL

Die meisten Datenbanken, welche SQL unterstützen, unterscheiden zwischen statischem und dynamischem SQL.

Bei statischem SQL sind die SQL-Anweisungen fest in einem Anwendungsprogramm kodiert (so genanntes Embedded SQL). Während der Programmvorbereitung übersetzt ein Precompiler die SQL-Befehle in Funktionsaufrufe, anschließend definiert ein Optimizer den besten Zugriffspfad auf die Daten und speichert diesen im Datenbanksystem ab.

Dynamisches SQL wird dagegen während der Laufzeit eines Programms interpretiert und der Zugriffspfad wird bei jedem Durchlauf neu optimiert.

Beide Arten von SQL haben ihre Vor- und Nachteile. Statisches SQL mit voroptimierten Zugriffen erspart den aufwändigen Aufruf des Optimizers und wird deshalb häufig für zeitkritische Transaktionsverarbeitungen gebraucht. Das flexiblere dynamische SQL kommt dort zum Tragen, wo zur Codierzeit die auszuführenden SQL - Anweisungen noch nicht bekannt sind.

SQL-Datenbanksysteme

  1. Adabas - eine kommerzielle Datenbank von der Software AG.
  2. DB2 - eine kommerzielle Datenbank von IBM.
  3. dBase IV
  4. Firebird
  5. GUPTA
  6. Informix
  7. INGRES
  8. InterBase
  9. JetSQL
  10. Microsoft Access
  11. Microsoft SQL Server
  12. MySQL - eine sehr verbreitete Open-Source-Datenbank.
  13. PostgreSQL - ebenfalls eine sehr verbreitete Open Source-Datenbank, die für Linux und Unix verfügbar ist.
  14. Oracle - eine kommerzielle Datenbank vom gleichnamigen Unternehmen.
  15. MaxDB früher unter dem Namen SAP DB bekannte, jetzt von MySQL weiterentwickelte Datenbank.
  16. SQLite
  17. SYBASE
  18. Transact SQL
  19. Teradata
  20. YARD-SQL

Literatur

Obwohl bereits etwas betagt, ist dieses Buch gerade als wissenschaftlich fundierte und trotzdem leicht verständliche Einführung in SQL sehr zu empfehlen.


Siehe auch: SQL-Injection