Zum Inhalt springen

ISO 639

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 7. Februar 2006 um 16:27 Uhr durch Chlewbot (Diskussion | Beiträge) (Bot: Ergänze: bs). Sie kann sich erheblich von der aktuellen Version unterscheiden.

ISO 639 ist ein internationaler Standard, der Sprachen Sprachkennungen zuordnet. Die Buchstabenkürzel werden in kleinen Buchstaben geschrieben (siehe dazu auch das Kapitel Abgrenzung zu ISO 3166 und RFC 1766).

Struktur

Gemäß der ISO-Website sind bislang zwei Teile von ISO 639 veröffentlicht:

  • ISO 639-1:2002 -- Codes for the representation of names of languages -- Part 1: Alpha-2 code (Kurzbezeichnung aus jeweils zwei Buchstaben)
  • ISO 639-2:1998 -- Codes for the representation of names of languages -- Part 2: Alpha-3 code (Kurzbezeichnung aus jeweils drei Buchstaben)

Weitere Teile befinden sich derzeit noch in Entwicklung:

  • ISO 639-3:2006? -- Codes for the representation of names of languages -- Part 3: Alpha-3 code for comprehensive coverage of languages (Draft technical report: Language codes part 3 (PDF))
  • ISO 639-4:2007? -- Codes for the representation of names of languages -- Part 4: Implementation guidelines and general principles for language coding
  • ISO 639-5:2006? -- Codes for the representation of names of languages -- Part 5: Alpha-3 code for language families and groups

Beispiele

Eine (englischsprachige) Liste der Kürzel in beiden Varianten ist im englischen Artikel zur ISO 639 enthalten. Die deutschen Entsprechungen sind im Wiktionary auf der Seite Wiktionary:Sprachen verzeichnet.

  • Für heutiges Deutsch gibt es drei Kürzel: ger (bibliographischer Code), deu (terminologischer Code) und de.
  • Mittelhochdeutsch (ca. 1050 - 1500) ist gmh (German, Middle High),
  • Althochdeutsch (ca. 750 - 1050) goh (German, Old High) und
  • Platt nds (Low Saxon).

Es werden auch Kunstsprachen (z. B. Klingonisch unter tlh) in die ISO-Listen aufgenommen.

Language Code nach ISO 639 (Liste/Auswahl)

Wikipedia Symbol für die Sprache Deutsch basierend auf der Kennung nach ISO 639-1.
Wikipedia Symbol für die Sprache Englisch basierend auf der Kennung nach ISO 639-1.
Sprache ISO 639-1 ISO 639-2
Abchasisch ab abk
Afar aa aar
Afrikaans af afr
Akan ak aka
Albanisch sq alb/sqi
Altkirchenslawisch cu chu
Amharisch am amh
Anishinabe oj oji
Arabisch ar ara
Aragonesisch an arg
Armenisch hy hye/arm
Assamesisch/Assami as asm
Aserbaidschanisch az aze
Avestisch ae ave
(Neu-)Awarisch av ava
Aymara ay aym
Bambara bm bam
Banyumasan by bdf/ban
Baschkirisch ba bak
Baskisch eu eus/baq
Bengali bn ben
Bihari bh bih
Bislama bi bis
Bosnisch bs bos
Bretonisch br bre
Bulgarisch bg bul
Birmanisch my mya/bur
Chamorro ch cha
Chichewa ny nya
Chinesisch zh zho/chi
Cree cr cre
Dänisch da dan
Deutsch de deu/ger
Dhivehi dv div
Dzongkha dz dzo
Englisch en eng
Esperanto eo epo
Estnisch et est
Ewe ee ewe
Färöisch fo fao
Fidschi fj fij
Finnisch fi fin
Französisch fr fra/fre
Friesisch fy fry
Ful ff ful
Galicisch gl glg
(Schottisch-)Gälisch gd gla
Ganda lg lug
Georgisch ka kat/geo
(Neu-)Griechisch el ell/gre
Guaraní gn grn
Gujarati gu guj
Haitianisch ht hat
Hausa ha hau
Hebräisch he heb
Herero hz her
Hindi hi hin
Hiri Motu ho hmo
Ibo ig ibo
Ido io ido
Indonesisch id ind
Interlingua ia ina
Interlingue ie ile
Inuktitut iu iku
Inupiaq ik ipk
Irisch ga gle
IsiXhosa xh xho
IsiZulu zu zul
Isländisch is isl/ice
Italienisch it ita
Japanisch ja jpn
Javanisch jv jav
Jiddisch yi yid
Kalaallisut; Grönländisch kl kal
Kannada; Kanaresisch kn kan
Kanuri kr kau
Kasachisch kk kaz
Kaschmiri ks kas
Katalanisch ca cat
Khmer km khm
Kikuyu ki kik
Kinyarwanda rw kin
Kirgisisch ky kir
Kirundi rn run
Kongo; Kikongo kg kon
Komi kv kom
Koreanisch ko kor
Kornisch kw cor
Korsisch co cos
Kroatisch hr hrv/scr
Kuanyama kj kua
Kurdisch ku kur
Lao lo lao
Lateinisch la lat
Lettisch lv lav
Limburgisch li lim
Lingala ln lin
Litauisch lt lit
Luba-Katanga lu lub
Luxemburgisch lb ltz
Madagassisch mg mlg
Malaiisch ms msa/may
Malayalam ml mal
Maltesisch mt mlt
Manx gv glv
Maori mi mri/mao
Marathi mr mar
Marshallisch mh mah
Mazedonisch mk mkd/mac
Moldawisch mo mol
Mongolisch mn mon
Nauruisch na nau
Navajo nv nav
Nördliches Ndebele nd nde
Südliches Ndebele nr nbl
Ndonga ng ndo
Nepalesisch ne nep
Niederländisch nl nld/dut
Norwegisch no nor
Bokmål-Norwegisch nb nob
Nynorsk-Norwegisch nn nno
Oriya or ori
Oromo om orm
Ossetisch os oss
Pali pi pli
Paschtunisch ps pus
Persisch fa fas/per
Polnisch pl pol
Portugiesisch pt por
Provenzalisch oc oci
Punjabi pa pan
Quechua qu que
Rätoromanische Sprache rm roh
Rumänisch ro ron/rum
Russisch ru rus
Samisch se sme
Samoanisch sm smo
Sango sg sag
Sanskrit sa san
Sardisch sc srd
Schwedisch sv swe
Serbisch sr srp/scc
Sesotho st sot
Setswana tn tsn
Shona sn sna
Sichuanhua ii iii
Sindhi sd snd
Singhalesisch si sin
Siswati ss ssw
Slowakisch sk slk/slo
Slowenisch sl slv
Somali so som
Spanisch es spa
Sundanesisch su sun
Swahili sw swa
Tadschikisch tg tgk
Tagalog tl tgl
Tahitianisch ty tah
Tamilisch ta tam
Tatarisch tt tat
Telugu te tel
Thailändisch th tha
Tibetisch bo bod/tib
Tigrinya ti tir
Tongaisch to tom
Tschechisch cs ces/cze
Tschetschenisch ce che
Tschuwaschisch cv chv
Tsonga ts tso
Türkisch tr tur
Turkmenisch tk tuk
Twi tw twi
Uigurisch ug uig
Ukrainisch uk ukr
Ungarisch hu hun
Urdu ur urd
Usbekisch uz uzb
Venda ve ven
Vietnamesisch vi vie
Volapük vo vol
Walisisch cy cym/wel
Wallonisch wa wln
Weißrussisch be bel
Wolof wo wol
Yoruba yo yor
Zhuang za zha

(Liste bestehend nur aus Sprachen mit Codes nach ISO 639-1 und ISO 639-2!)

Abgrenzung zu ISO 3166 und RFC 3066

Während ISO 639 die sprachliche Einteilung definiert, beschreibt ISO 3166 die geografische Einteilung. ISO 639-1 und ISO 3166 verwenden dabei beide 2-buchstabige Kürzel, aber während diese im ISO 639-1 aus Kleinbuchstaben bestehen, verlangt die ISO 3166 Großbuchstaben. Abweichend vom Standard wird die Sprachkodierung aber oft in Großbuchstaben angegeben. Dies kann zur Verwechslung mit der Geografiekodierung führen, da einige Länder die selben Kürzel für ihre geografische und sprachliche Einteilung haben während andererseits das selbe Kürzel für völlig verschiedene Geografien bzw. Sprachen stehen kann.

Beispielsweise stehen DE/de für Deutschland/deutsch, FR/fr stehen für Frankreich/französisch, aber BE/be stehen für Belgien/belorussisch.

Andererseits lautet die geografische Einteilung für Griechenland GR, während die sprachliche Einteilung für die griechische Sprache el lautet.

Es existieren viele weitere Beispiele. Das Kürzel EU/eu steht einerseits für die geografische Einteilung Europäische Union, andererseits für die sprachliche Einteilung baskische Sprache. Das Kürzel AF/af steht einerseits für die geografische Einteilung Afghanistan, andererseits für die sprachliche Einteilung Afrikaans. Sämtliche Homographen finden sich auf meta:Language codes/Conflicts (engl.).

Die Einteilung in Geografie und Sprache ist jedoch sinnvoll: beispielsweise gilt, dass Deutsch nicht nur in Deutschland und Französisch nicht nur in Frankreich gesprochen wird.

In Kombination mit den Geografiecodes nach ISO 3166 für Länder erklärt der RFC 3066 (früher RFC 1766) die Angabe von Sprachenkürzeln wie man sie für Locales benutzt, z.B. en_US (englische Sprache im Gebiet der Vereinigten Staaten von Amerika; amerikanisch) im Gegensatz zu en_GB (englische Sprache im Gebiet des Vereinigten Königreichs; britisch). Die Sprachkürzel werden hier durch Kleinbuchstaben symbolisiert, die Länder durch Großbuchstaben. Neben dem Unterstrich (engl. underscore) kommt als Trennzeichen auch oft der Bindestrich zum Einsatz. Locales definieren aber nicht nur eine Landessprache bzw. Regionalsprache, sondern werden auch zur Lokalisierung herangezogen.

Vorlage:Commons2