ISO 639
ISO 639 ist ein internationaler Standard, der Sprachen Sprachkennungen zuordnet. Die Buchstabenkürzel werden in kleinen Buchstaben geschrieben (siehe dazu auch das Kapitel Abgrenzung zu ISO 3166 und RFC 1766).
Struktur
Gemäß der ISO-Website sind bislang zwei Teile von ISO 639 veröffentlicht:
- ISO 639-1:2002 -- Codes for the representation of names of languages -- Part 1: Alpha-2 code (Kurzbezeichnung aus jeweils zwei Buchstaben)
- ISO 639-2:1998 -- Codes for the representation of names of languages -- Part 2: Alpha-3 code (Kurzbezeichnung aus jeweils drei Buchstaben)
Weitere Teile befinden sich derzeit noch in Entwicklung:
- ISO 639-3:2006? -- Codes for the representation of names of languages -- Part 3: Alpha-3 code for comprehensive coverage of languages (Draft technical report: Language codes part 3 (PDF))
- ISO 639-4:2007? -- Codes for the representation of names of languages -- Part 4: Implementation guidelines and general principles for language coding
- ISO 639-5:2006? -- Codes for the representation of names of languages -- Part 5: Alpha-3 code for language families and groups
Beispiele
Eine (englischsprachige) Liste der Kürzel in beiden Varianten ist im englischen Artikel zur ISO 639 enthalten. Die deutschen Entsprechungen sind im Wiktionary auf der Seite Wiktionary:Sprachen verzeichnet.
- Für heutiges Deutsch gibt es drei Kürzel:
ger
(bibliographischer Code),deu
(terminologischer Code) undde
. - Mittelhochdeutsch (ca. 1050 - 1500) ist
gmh
(German, Middle High), - Althochdeutsch (ca. 750 - 1050)
goh
(German, Old High) und - Platt
nds
(Low Saxon).
Es werden auch Kunstsprachen (z. B. Klingonisch unter tlh
) in die ISO-Listen aufgenommen.
Language Code nach ISO 639 (Liste/Auswahl)


(Liste bestehend nur aus Sprachen mit Codes nach ISO 639-1 und ISO 639-2!)
Abgrenzung zu ISO 3166 und RFC 3066
Während ISO 639 die sprachliche Einteilung definiert, beschreibt ISO 3166 die geografische Einteilung. ISO 639-1 und ISO 3166 verwenden dabei beide 2-buchstabige Kürzel, aber während diese im ISO 639-1 aus Kleinbuchstaben bestehen, verlangt die ISO 3166 Großbuchstaben. Abweichend vom Standard wird die Sprachkodierung aber oft in Großbuchstaben angegeben. Dies kann zur Verwechslung mit der Geografiekodierung führen, da einige Länder die selben Kürzel für ihre geografische und sprachliche Einteilung haben während andererseits das selbe Kürzel für völlig verschiedene Geografien bzw. Sprachen stehen kann.
Beispielsweise stehen DE
/de
für Deutschland/deutsch, FR
/fr
stehen für Frankreich/französisch, aber BE
/be
stehen für Belgien/belorussisch.
Andererseits lautet die geografische Einteilung für Griechenland GR
, während die sprachliche Einteilung für die griechische Sprache el
lautet.
Es existieren viele weitere Beispiele. Das Kürzel EU
/eu
steht einerseits für die geografische Einteilung Europäische Union, andererseits für die sprachliche Einteilung baskische Sprache. Das Kürzel AF
/af
steht einerseits für die geografische Einteilung Afghanistan, andererseits für die sprachliche Einteilung Afrikaans. Sämtliche Homographen finden sich auf meta:Language codes/Conflicts (engl.).
Die Einteilung in Geografie und Sprache ist jedoch sinnvoll: beispielsweise gilt, dass Deutsch nicht nur in Deutschland und Französisch nicht nur in Frankreich gesprochen wird.
In Kombination mit den Geografiecodes nach ISO 3166 für Länder erklärt der RFC 3066 (früher RFC 1766) die Angabe von Sprachenkürzeln wie man sie für Locales benutzt, z.B. en_US
(englische Sprache im Gebiet der Vereinigten Staaten von Amerika; amerikanisch) im Gegensatz zu en_GB
(englische Sprache im Gebiet des Vereinigten Königreichs; britisch). Die Sprachkürzel werden hier durch Kleinbuchstaben symbolisiert, die Länder durch Großbuchstaben. Neben dem Unterstrich (engl. underscore) kommt als Trennzeichen auch oft der Bindestrich zum Einsatz. Locales definieren aber nicht nur eine Landessprache bzw. Regionalsprache, sondern werden auch zur Lokalisierung herangezogen.
Weblinks
- ISO 639-2/RA Änderungsangaben der Library of Congress
- Komplette Codeliste (alphabetisch sortiert)
- Details at Library of Congress website
- RFC 3066, Tags for the Identification of Languages, Best Current Practice, Januar 2001
- ISO 639 and the Ethnologue
- XML version of the official ISO 639 HTML data at the Library of Congress
- Künftige ISO 639-3-Codes bei der SIL (Online-Version)