Alphabetische Sortierung
Eine alphabetische Sortierung ist eine Sortierung, bei der Zeichenketten entsprechend der Reihenfolge der Buchstaben im Alphabet angeordnet werden. Die herkömmliche alphabetische Sortierung wird auch als initialalphabetische Sortierung bezeichnet, da die Ordnung der einzelnen Buchstaben in Schriftrichtung ermittelt wird.
Bei der alphabetischen Sortierung müssen Besonderheiten wie Sonderzeichen, Umlaute, Leerzeichen, Groß- und Kleinschreibung sowie Ziffern beachtet werden, die sich in unterschiedlichen Regeln und Normen niederschlagen.
Alphabetische Sortierung nach DIN 5007
Die DIN 5007 beschreibt unter dem Titel „Ordnen von Schriftzeichenfolgen (ABC-Regeln)“ das Sortieren. Die Besonderheiten im deutschsprachigen Raum beschränken sich im Wesentlichen auf die Darstellung der Umlaute Ä, Ö und Ü und des ß. Hierauf fußen im weiteren die praktischen Variationsmöglichkeiten.
Ausländische Sonderzeichen werden gegebenenfalls nach spezifischen Bedingungen sortiert.
DIN 5007-1 (für Wörter verwendet, etwa in Lexika)
- ä und a sind gleich
- ö und o sind gleich
- ü und u sind gleich
- ß und ss sind gleich
DIN 5007-2 (für Namen verwendet, etwa in Telefonbüchern)
- ä und ae sind gleich
- ö und oe sind gleich
- ü und ue sind gleich
- ß und ss sind gleich
Österreichische Sortierung (für Telefonbücher)
- ä kommt nach az
- ö kommt nach oz
- ü kommt nach uz
- ß und ss sind gleich
Schwedische Sortierung (Auszug)
- å kommt nach z
- ä kommt nach å
- ö kommt nach ä
- ü und y sind gleich
Finnische Sortierung (Auszug)
- å kommt nach z
- ä kommt nach å
- ö kommt nach ä
- ü und y sind gleich
Englische Sortierung (auch allgemeine Sortierung)
- ä kommt nach a
- ö kommt nach o
- ü kommt nach u
- ß kommt nach s
Beispiel
DIN 5007-1 (Lexikon) |
DIN 5007-2 (Telefonbuch) |
Österreichische Sortierung |
---|---|---|
Göbel | Göbel | Goethe |
Goethe | Goethe | Goldmann |
Goldmann | Götz | Göbel |
Götz | Goldmann | Götz |
Computersysteme
Computersysteme codieren die gespeicherten Zeichenketten meist mittels des ASCII-, seltener noch des EBCDIC-Codes und ordnen die Zeichen (einschließlich Leerzeichen, Satz- und Sonderzeichen) nach dem zugeordneten Zahlenwert dieses Codes.
Datenbankprogramme und Verlagsprogramme (zum Beispiel für Telefonbuchverlage) wenden aber mehr und mehr die richtige nationale Sortierung nach einer der traditionellen Normen an. Dabei gibt es Möglichkeiten, auf die Sortierreihenfolge durch individuelle Kodierung oder Parametrierung Einfluss zu nehmen.
Als neuere Codierung erlangt Unicode eine immer weitere Verbreitung und Unterstützung.
Rückläufige Sortierung
Die rückläufige Sortierung ist eine alphabetische Sortierung, die die Wörter von rückwärts gelesen sortiert. Solch eine Sortierung ist z. B. günstig für Wörterbücher von reihenden Sprachen oder Reimlexika.
Siehe auch
- Als Lemmastrecke bezeichnet man einen Ausschnitt einer alphabetisch sortierten Reihe, beispielsweise einen Band eines mehrbändigen Lexikons.
Weblinks
- Zur Ordnung und Codierung der Umlautbuchstaben in Bibliotheksdienst Heft 4, 98 (S. 724-735)