Zum Inhalt springen

Diskussion:ISO 639

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 9. November 2007 um 15:26 Uhr durch 888344 (Diskussion | Beiträge) (22 oder 23 B/T-Fälle ?). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 17 Jahren von Chrislb in Abschnitt 22 oder 23 B/T-Fälle ?

Soll ich auch die einzelnen Sprache zu ihrem Wikipedia-Eintrag verlinken? 145.254.127.232 15:49, 14. Mai 2005 (CEST)Beantworten

Sei mutig;-) --rdb? 15:51, 14. Mai 2005 (CEST)Beantworten

Mandarin und kantonesisch

ist es nicht ein bisschen blöd gewesen, mandarin und kantonesisch als "chinesische sprache" unter demselben kürzel "zh" zu vereinen? --Abdull 15:43, 13. Sep 2005 (CEST)

Steht jetzt im Artikel, wieso es so gemacht wurde. --chrislb 问题 11:08, 27. Okt. 2006 (CEST)Beantworten

Symbole "((en))" und "((de))"

Inwieweit haben die im Artikel verwendeten Grafiken zu "de" und zu "en" offiziellen Charakter? Ist dies nur eine Wikipedia-interne Idee? Falls dem so ist, so sollte deutlich darauf hingewiesen werden.

82.83.1.25 23:42, 26. Sep 2005 (CEST)

Selbstverlinkung?

Huhu. In ISO_639#Struktur ist ein Link auf ISO_639-3 - welche allerdings ein Redirect auf ISO 639 ist. Sinn? --Suchi 16:02, 19. Feb 2006 (CET)

Keiner. Histerisch gewachsen. --jpp ?! 20:36, 19. Feb 2006 (CET)

Locales und Sprachangaben nach RFC 3066 falsch

„In Kombination mit den Geografiecodes nach ISO 3166 für Länder erklärt der RFC 3066 (früher RFC 1766) die Angabe von Sprachenkürzeln wie man sie für Locales benutzt, z.B. en_US (englische Sprache im Gebiet der Vereinigten Staaten von Amerika; amerikanisch) im Gegensatz zu en_GB (englische Sprache im Gebiet des Vereinigten Königreichs; britisch). Die Sprachkürzel werden hier durch Kleinbuchstaben symbolisiert, die Länder durch Großbuchstaben. Neben dem Unterstrich (engl. underscore) kommt als Trennzeichen auch oft der Bindestrich zum Einsatz. Locales definieren aber nicht nur eine Landessprache bzw. Regionalsprache, sondern werden auch zur Lokalisierung herangezogen.“

Aus dem Artikel

Laut RFC 3066 sind Unterstriche aber nicht erlaubt! Das einzige zulässige Trennzeichen nach RFC 3066 (Auch schon RFC 1766) ist der Bindestrich! Die Tiefstrichvariante der Locales ist nach POSIX. RFC 3066 wären zum Beispiel:

  • de - Deutsch
  • de-DE - Deutsch, Deutschland
  • en-US - Englisch, USA
  • x-klingon - Klingonisch
  • en-US-GB - Englisch, USA und England
  • i-en-GB-oed - Englisch, England, Oxford Dictionary Spelling

Bei den Locales wären nur die ersten drei Varianten mit unterstrich möglich!

Auch ist die Bezeichnung "Sprachcode" hier besser geeignet als Locale, denn die RFC 3066 Sprachkürzel dienen tatsächlich der genauen Identifikation der Sprache, wärend die Locales eben eher der Lokalisierung dienen, die aber auch mit einer Sprache einhergeht. Ein Locale ist aber z.B. auch wichtig für die Zahlenformatierung u.ä. - Ein Sprachcode nicht unbedingt. Das zeigt sich u.a. auch durch die Optinale Charset angabe bei Locales, zb de_DE.ISO-8859-1, die bei Sprachcodes gänzlich fehlt. Die Zielgebiete sind unterschiedlich. Man sollte ganz eindeutig die Sprachcodes der I18N zuweisen und die Locales der L10N, man kann ja erwähnen dass sie beide in die Aufgabenbereiche der G11N fallen.

--EmCee 21:07, 18. Mai 2006 (CEST)Beantworten

ISO-Code "zxx"

Hi, in den Original-Code-Tabellen steht der ISO-Code „zxx“ mit dem Kommentar „No linguistic content“. Weiß jemand, wofür der benutzt wird? --jpp ?! 08:39, 25. Okt. 2006 (CEST)Beantworten

Vielleicht für Computercode? Oder nehmen wir an, du hast einen deutschen Wikipedia-Artikel über den Buchstaben Q. Um den Lesern zu zeigen, wie das Q aussieht, schreibst du ein dickes Q in den Artikel. Da dieses Q im Gegensatz zum Rest des Artikels keine menschliche Sprache ist, sondern ganz sinnfrei das Aussehen eines Buchstabens zeigt, kannst du es mithilfe des Kürzels zxx als nichtsprachlich markieren:
Dies ist ein deutscher Satz. Jenes ist ein sprachneutrales Q: q
Außerdem könntest du mit dem Code zxx-Latf ein Ausrufungszeichen in Frakturschrift anzeigen lassen, mit zxx-Latg ein ⁊ in gälischer Lateinschrift oder mit zxx-Latf ein Eszett in Frakturschrift anzeigen lassen, wo diese keinen „sprachlichen“ Wert beinhalten, sondern es z. B. nur um die Form der Glyphen geht. Ich bin aber nicht sicher, ob der Code nicht womöglich nur für Zeichen ohne Aussprache wie Smileys gedacht ist oder ob man ihn ruhig für sowas wie %, & oder auch Buchstaben benutzen soll. 17:14, 25. Okt. 2006 (CEST)
Ich wäre dafür, dass Jpp mal bei der ISO nachfragt und eine Antwort in den Artikel stellt. Pro --chrislb 问题 17:26, 25. Okt. 2006 (CEST)Beantworten
Ist mir da was entgangen? War deine Antwort, chrislb, eine Retourkutsche für irgendwas?
Aber ja, ich werde da mal weiterrecherchieren, obwohl Wikipeditor das schon ganz gut erklärt hat (auch wenn ihm seine Signatur missglückt ist). --jpp ?! 17:46, 25. Okt. 2006 (CEST)Beantworten
Nein, ganz und garnicht. Nur dass ich selbst das in dem Standard zu -2 nicht gefunden habe. Ich weiß noch nichtmal welche Bücher man zu dem Thema befragen kann, so dass für mich nur Internetrecherche oder Nachfragen hilft. --chrislb 问题 18:27, 25. Okt. 2006 (CEST)Beantworten
Scheint wohl noch recht neu zu sein: Siehe z.  B. diese beiden Quellen: Aktualisierung der Sprachcodes nach ISO 639-2 im Hessischen Bibliothekssystem und ISO 639-2/RA Change Notice. --jpp ?! 20:11, 25. Okt. 2006 (CEST)Beantworten
Wir haben übrigens schon einen Wikipediaeintrag dazu in (einer) deutscher/n Sprache: ksh:ZXX (Watt ėßß datt?) --chrislb 问题 20:49, 25. Okt. 2006 (CEST)Beantworten

Friesisch

Jetzt hab ich einen "Knoten" im Kopf und weiß nicht was die Jungs da machen:

  • [1] (ISO 639-2) ändert "Friesisch" für fry in "Westfriesisch" (die wichtigste der Friesischen Sprachen), da diese ursprünglich gemeint war, doch falsch benannt wurde. Gleichzeitig wird Ost-Friesisch hinzugefügt. «Previous usage of code has been for Western Frisian, although language name was "Frisian"»
  • [2] (ISO 639-3) führt allerdings fri für Westfriesisch und ordnet fry den ganzen Friesischen Sprache zu.
  • [3] die Hessen stellen fry auf Westfriesisch um.

Haben die bei der 639-3 einfach gepennt und das noch nicht entsprechend umbenannt? Sie sind ja noch in der Draft-Phase --chrislb 问题 21:36, 25. Okt. 2006 (CEST)Beantworten

Anmerkung: Sonst wäre da etwas zwischen -2 und -3 inkonsistent... --chrislb 问题 21:40, 25. Okt. 2006 (CEST)Beantworten
[4] Hinweis auf eine bevorstehende Änderung? in ISO 639-3 zu fry. [5] Hinweis auf die Umstellung von fy und fry. --chrislb 问题 21:56, 27. Okt. 2006 (CEST)Beantworten
[6] Fri wurde eingestellt --chrislb 问题 00:41, 29. Mär. 2007 (CEST)Beantworten
Weitere Inkonsistenz ist Jiddisch yid: [7] vs. [8] --chrislb 问题 14:01, 27. Okt. 2006 (CEST)Beantworten

Bihari

Laut en:ISO 639-2 nimmt Bihari eine Sonderrolle ein, da sie eine kollektive Sprache ist, aber auch einen ISO 639-1 Code hat. Vielleicht weiß jemand etwas mehr dazu, so dass ich das in den Artikel packen kann. --chrislb 问题 23:23, 26. Okt. 2006 (CEST)Beantworten

Da scheint die Norm tatsächlich etwas unsauber zu sein. Schau dir mal [9] an. --jpp ?! 08:34, 27. Okt. 2006 (CEST)Beantworten
Danke für den Link. Klar scheint es da aber auch nicht zu sein. Es ähnelt doch sehr [10]. Generell werden also auch Sprachgruppen auf ISO 639-1 Ebene aufgenommen, (siehe auch die Tabelle im Artikel). Den Satz Vorlage:"-en verstehe ich auch nicht. Da scheint eher jemand ohne Ahnung mal etwas reingeschrieben zu haben − einen Code der einzelnen Sprache für ISO 639-1 finde ich nicht. --chrislb 问题 11:06, 27. Okt. 2006 (CEST)Beantworten

Ethnologue 15 = ISO 639-3

Schon mehrfach gelesen -> 15. Ethnologue = ISO 639-3 (naja zumindest so verstanden). Aber das scheint Schwachfug zu sein: Vergleiche [11] (ISO 639-3) und [12] (Ethnologue 15th). Sprachen auf Makroebene gibt es scheinbar nicht. --chrislb 问题 11:06, 27. Okt. 2006 (CEST)Beantworten

Wie schon nebenan gesagt, ist die SIL diejenige Organisation, die die ISO-639-3 Codes verwaltet. Die SIL verwaltet auch Ethnologue, daher werden dort praktischerweise direkt die ISO-3 Dingers verwendet. Da Ethnologue aber nur lebende oder erst kürzlich ausgestorbene Einzelsprachen enthält und keine Makrosprachen und auch keine "alten" Sprachen, findest du in Ethnologue nicht alle Codes. Dafür gibt es von der SIL eine vollständige Liste: [13]. VG --Thogo (Disk./Bew.) 12:40, 27. Okt. 2006 (CEST)Beantworten
Die Zusammenhänge in der SIL kenne ich. Allerdings war mir entfallen, dass der Ethnologue nur moderne Sprachen führt, bzw. ich war (bin) mir nicht sicher, dass er dies auch beibehält. --chrislb 问题 13:25, 27. Okt. 2006 (CEST)Beantworten

Makrosprache

Was ist eigentlich eine Makrosprache? Makrosprache hilft in diesem Kontext nicht weiter. Hat jemand eine Definition zur Hand? --jpp ?! 20:12, 29. Okt. 2006 (CET)Beantworten

Ich werde das die nächsten Tage mal in Angriff nehmen. Nach der Spezifikation fallen darunter Einzelsprachen, die sehr enge Beziehungen zueinander haben, so dass in einem Kontext die Nennung zusammen als eine Sprache gegeben sein kann. Dies ist etwas schwamming definiert, gibt aber Beispiele wie Chinesisch (alle "Sub-"Sprachen verwenden die chinesische Schrift, die einjeder Sprecher der verschiedenen Sprachen lesen und größtenteils auch verstehen kann) oder Serbokroatisch, dass man nun wohl aus politischen Gründen nicht mehr so nennt, sondern in Bosnisch, Kroatisch, Serbisch... zerfallen ist. Ich werde das die Tage in den Artikel geben. --chrislb 问题 21:47, 29. Okt. 2006 (CET)Beantworten
Prima. Anschließend werde ich dann die bisher nach Makro weiterleitende Seite Makrosprache in eine Begriffsklärung umbauen, die auch hierhin leitet. Ist sonst etwas verwirrend für Suchende. --jpp ?! 09:11, 30. Okt. 2006 (CET)Beantworten
Wow, endlich. Nach 5 Monaten, hab ich's mal geschafft :) --chrislb 问题 00:32, 29. Mär. 2007 (CEST)Beantworten

Anzahl der Codes

Ich kann die "mehr als 200" nach ISO 639-1 vergebenen Kennungen nicht validieren. Nach meiner Zählung sind es 185. Und 26*26 ist auch etwas anderes als im Artikel stand:

$ wget -q http://www.loc.gov/standards/iso639-2/ISO-639-2_values_8bits.txt
$ awk -F'|' '$3 {print $3}' ISO-639-2_values_8bits.txt | wc -l 
185
$ echo $((25*25))
625

Mal wieder ein Beispiel wieviel Müll in Wikipedia steht, wenn die Fakten nicht anhand von Originalquellen überprüft werden sondern Artikel per GCP entstehen. -- Nichtich 15:07, 25. Jan. 2007 (CET)Beantworten

Schön, du hast eine falsche Zahl gefunden, die nicht mit einer Quelle belegt worden ist. --chrislb 问题 18:33, 25. Jan. 2007 (CET)Beantworten
Ich schließe mich chrislb an. Nichtich, hilf mit, den "Müll" zu beseitigen, aber das solltest du als Vorstand eigentlich wissen! Grüße, --Timohummel 11:04, 26. Jan. 2007 (CET)Beantworten

Änderung für Vorlage:Infobox Sprache

Da das Problem auf Vorlage:Infobox Sprache mit dem Thema ISO 639 verwandt ist, möchte ich hier darauf hinweisen: Die Sprachvorlage in mehr als 600 Artikeln ist ungenügend bei der Bezeichnung der Sprachcodes. Ich habe deshalb dort um Mithilfe gebeten (Vorlage Diskussion:Infobox Sprache#Erweiterte Kennzeichnung von Sprachcodes) --chrislb 问题 14:26, 31. Mär. 2007 (CEST)Beantworten

22 oder 23 B/T-Fälle ?

" Diese Unterscheidung wird für 23 Einträge gemacht [7] und rührt weitestgehend ... " Nach Beleg [7] sollen es 22 sein. Tippfehler?- Habe selber leider zu wenig Ahnung von diesem Gebiet. --888344

Die Quelle sagt 23, die Datenbank zum Download 22:
mysql> select Part2B, Part2T, Ref_Name_EN from ISO_639_2 where Part2T != '';
+--------+--------+-----------------------+
| Part2B | Part2T | Ref_Name_EN           |
+--------+--------+-----------------------+
| alb    | sqi    | Albanian              |
| arm    | hye    | Armenian              |
| baq    | eus    | Basque                |
| bur    | mya    | Burmese               |
| chi    | zho    | Chinese               |
| cze    | ces    | Czech                 |
| dut    | nld    | Dutch; Flemish        |
| fre    | fra    | French                |
| geo    | kat    | Georgian              |
| ger    | deu    | German                |
| gre    | ell    | Greek, Modern (1453-) |
| ice    | isl    | Icelandic             |
| mac    | mkd    | Macedonian            |
| mao    | mri    | Maori                 |
| may    | msa    | Malay                 |
| per    | fas    | Persian               |
| rum    | ron    | Romanian              |
| scc    | srp    | Serbian               |
| scr    | hrv    | Croatian              |
| slo    | slk    | Slovak                |
| tib    | bod    | Tibetan               |
| wel    | cym    | Welsh                 |
+--------+--------+-----------------------+
22 rows in set (0.00 sec)
Evtl. wurde ein Code mittlerweile geloescht. Werde das anpassen. Danke fuer den Hinweis --chrislb 问题 12:49, 8. Nov. 2007 (CET)Beantworten