„Common Locale Data Repository“ – Versionsunterschied
[gesichtete Version] | [gesichtete Version] |
erg. tk k |
K form |
||
(11 dazwischenliegende Versionen von 8 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
Das '''Common Locale Data Repository''' (kurz '''CLDR''') ist ein Projekt des [[Unicode-Konsortium]]s um [[Locale]]-Informationen für [[Anwendungssoftware|Anwendungsprogramme]] zur Verfügung zu stellen |
Das '''Common Locale Data Repository''' (kurz '''CLDR''') ist ein Projekt des [[Unicode-Konsortium]]s, um [[Locale]]-Informationen für [[Anwendungssoftware|Anwendungsprogramme]] zur Verfügung zu stellen. Es unterstützt damit die [[Internationalisierung (Softwareentwicklung)|Internationalisierung]] und [[Lokalisierung (Softwareentwicklung)|Lokalisierung]]. Die Daten liegen in der [[Extensible Markup Language|XML]]-basierten Sprache LDML (''Locale Data Markup Language'') vor. |
||
== Geschichte == |
== Geschichte == |
||
Ursprünglich wurde das CLDR von einer Arbeitsgruppe der [[Free Standards Group]] entwickelt, die von [[IBM]], [[Sun Microsystems]] und [[OpenOffice.org]] gegründet wurde. Die erste Version wurde Anfang 2004 veröffentlicht.<ref>[ |
Ursprünglich wurde das CLDR von einer Arbeitsgruppe der [[Free Standards Group]] entwickelt, die von [[IBM]], [[Sun Microsystems]] und [[OpenOffice.org]] gegründet wurde. Die erste Version wurde Anfang 2004 veröffentlicht.<ref>[https://cldr.unicode.org/index/acknowledgments ''Acknowledgments.''] Unicode CLDR Project; abgerufen am 13. November 2013.</ref> Anschließend wurde das Projekt unter Leitung des Unicode-Konsortiums weitergeführt. Neue Versionen mit erweiterten und verbesserten Daten werden normalerweise zwei Mal im Jahr veröffentlicht, aktuell ist seit Juni 2023 die Version 43.1.<ref>''[https://cldr.unicode.org/index/downloads/cldr-43 CLDR 43.1 Release Note.]'' Unicode CLDR Project; abgerufen am 30. Juni 2023.</ref> |
||
== Daten == |
== Daten == |
||
Die Daten liegen als XML-Dateien in der Sprache LDML (''Locale Data Markup Language'') vor.<ref>[ |
Die Daten liegen als XML-Dateien in der Sprache LDML (''Locale Data Markup Language'') vor.<ref>[https://www.unicode.org/reports/tr35/ Unicode Technical Standard #35] – ''Unicode Locale Data Markup Language (LDML).'' In: ''unicode.org,'' abgerufen am 13. November 2013.</ref> |
||
Als Beispiel für das Format kann der folgende kleine Ausschnitt aus einer der Dateien für Deutsch dienen: |
Als Beispiel für das Format kann der folgende kleine Ausschnitt aus einer der Dateien für Deutsch dienen: |
||
Zeile 76: | Zeile 76: | ||
* Regeln für [[Transliteration]]en |
* Regeln für [[Transliteration]]en |
||
Die Daten sind für mehr als 740 Locales verfügbar, die über 200 verschiedene Sprachen umfassen, für viele aber nicht vollständig.<ref name="cldr24"> |
Die Daten sind für mehr als 740 Locales verfügbar, die über 200 verschiedene Sprachen umfassen, für viele aber nicht vollständig.<ref name="cldr24">{{Webarchiv |url=http://cldr.unicode.org/index/downloads/cldr-24 |text=''CLDR 24 Release Note.'' |wayback=20131203000654}} Unicode CLDR Project; abgerufen am 13. November 2013.</ref> |
||
== Verwendung == |
== Verwendung == |
||
Zur Nutzung der Daten des CLDR stehen für alle gängigen [[Programmiersprache]]n Bibliotheken zur Verfügung, darunter auch die des [[International Components for Unicode|ICU]]-Projekts. |
Zur Nutzung der Daten des CLDR stehen für alle gängigen [[Programmiersprache]]n Bibliotheken zur Verfügung, darunter auch die des [[International Components for Unicode|ICU]]-Projekts. |
||
CLDR wird in zahlreichen Softwareprodukten eingesetzt, Apple verwendet es beispielsweise in seinen Betriebssystemen [[Mac OS X]] und [[Apple iOS|iOS]], [[Google Inc.]] in seinen [[Webanwendung]]en und dem Browser [[Google Chrome]].<ref>[ |
CLDR wird in zahlreichen Softwareprodukten eingesetzt, Apple verwendet es beispielsweise in seinen Betriebssystemen [[Mac OS X]] und [[Apple iOS|iOS]], [[Google Inc.]] in seinen [[Webanwendung]]en und dem Browser [[Google Chrome]].<ref>[https://cldr.unicode.org/#TOC-Who-uses-CLDR ''Who uses CLDR?''] Unicode CLDR Project; abgerufen am 13. November 2013.</ref> [[MediaWiki]], die Software, mit der unter anderem Wikipedia betrieben wird, nutzt CLDR ebenfalls für seine vielfältigen Sprachversionen.<ref>[[mw:Extension:CLDR]].</ref> |
||
CLDR enthält auch Konversionswerkzeuge, um aus den Daten [[POSIX]]-Locales zu erhalten.<ref>[ |
CLDR enthält auch Konversionswerkzeuge, um aus den Daten [[POSIX]]-Locales zu erhalten.<ref>[https://cldr.unicode.org/index/downloads#POSIX_Data ''POSIX Data.''] Unicode CLDR Project; abgerufen am 13. November 2013.</ref> |
||
== Weblinks == |
== Weblinks == |
||
* [ |
* [https://cldr.unicode.org/ Common Locale Data Repository] |
||
* [http://demo.icu-project.org/icu-bin/locexp Locale Explorer] des ICU-Projekts |
|||
== Einzelnachweise == |
== Einzelnachweise == |
Aktuelle Version vom 10. Juli 2024, 15:21 Uhr
Das Common Locale Data Repository (kurz CLDR) ist ein Projekt des Unicode-Konsortiums, um Locale-Informationen für Anwendungsprogramme zur Verfügung zu stellen. Es unterstützt damit die Internationalisierung und Lokalisierung. Die Daten liegen in der XML-basierten Sprache LDML (Locale Data Markup Language) vor.
Geschichte
[Bearbeiten | Quelltext bearbeiten]Ursprünglich wurde das CLDR von einer Arbeitsgruppe der Free Standards Group entwickelt, die von IBM, Sun Microsystems und OpenOffice.org gegründet wurde. Die erste Version wurde Anfang 2004 veröffentlicht.[1] Anschließend wurde das Projekt unter Leitung des Unicode-Konsortiums weitergeführt. Neue Versionen mit erweiterten und verbesserten Daten werden normalerweise zwei Mal im Jahr veröffentlicht, aktuell ist seit Juni 2023 die Version 43.1.[2]
Daten
[Bearbeiten | Quelltext bearbeiten]Die Daten liegen als XML-Dateien in der Sprache LDML (Locale Data Markup Language) vor.[3]
Als Beispiel für das Format kann der folgende kleine Ausschnitt aus einer der Dateien für Deutsch dienen:
<ldml>
<localeDisplayNames>
<languages>
<language type="en">Englisch</language>
<language type="fr">Französisch</language>
</languages>
<territories>
<territory type="AT">Österreich</territory>
<territory type="CH">Schweiz</territory>
<territory type="CI">Côte d’Ivoire</territory>
<territory type="CI" alt="variant">Elfenbeinküste</territory>
<territory type="DE">Deutschland</territory>
</territories>
</localeDisplayNames>
<delimiters>
<quotationStart>„</quotationStart>
<quotationEnd>“</quotationEnd>
</delimiters>
<dates>
<calenders>
<calender type="generic">
<dateFormats>
<dateFormatLenght type="long">
<dateFormat>
<pattern>d. MMMM y G</pattern>
</dateFormat>
</dateFormatLenght>
</dateFormats>
</calender>
</calenders>
<timeZoneNames>
<zone type="Europe/Vienna">
<exemplarCity>Wien</exemplarCity>
</zone>
</timeZoneNames>
</dates>
</ldml>
Das Beispiel zeigt Lokalisierungen für die Namen von Sprachen und Ländern, Anführungszeichen und verschiedene Informationen zu Datums- und Zeitangaben, hier das Muster für lange Datumsangaben und die Angabe einer Zeitzone.
Die Werte für ein Locale können an Unter-Locales weitervererbt werden, sodass die Daten nicht unnötig dupliziert werden müssen. Entsprechend werden für de-CH
, also Schweizerdeutsch, nur wenige Daten angeführt, der größte Teil wird von de
, also Standarddeutsch, übernommen. Ausgangspunkt für die Vererbung ist für alle Locales root
, nach dem englischen Wort für „Wurzel“.
Das Projekt umfasst unter anderem folgende Daten:
- Übersetzungen für
- Sprachen
- Schriftsysteme
- Länder
- Datum und Uhrzeit
- Namen von Kalendern
- Formate für Zeitpunkte und Zeitintervalle
- Namen von Zeitzonen
- Zahlen
- Zeichen für Tausendertrenner, Dezimaltrennzeichen, Vorzeichen und weitere
- verschiedene Zahlenformate
- Regeln zur Darstellung von Zahlen in Wörtern
- Namen und Symbole für Währungen
- Pluralregeln
- Namen von Einheiten
- Formate für Postleitzahlen
- Anpassungen der Unicode-Segmentierungsalgorithmen (etwa Angaben von Abkürzungen, deren Punkt kein Satzende darstellt)
- Sortierregeln, die im Unicode Collation Algorithm und dessen Erweiterungen Anwendung finden
- Sprachspezifische Regeln für die Unicode-Casing-Algorithmen
- Regeln für Transliterationen
Die Daten sind für mehr als 740 Locales verfügbar, die über 200 verschiedene Sprachen umfassen, für viele aber nicht vollständig.[4]
Verwendung
[Bearbeiten | Quelltext bearbeiten]Zur Nutzung der Daten des CLDR stehen für alle gängigen Programmiersprachen Bibliotheken zur Verfügung, darunter auch die des ICU-Projekts.
CLDR wird in zahlreichen Softwareprodukten eingesetzt, Apple verwendet es beispielsweise in seinen Betriebssystemen Mac OS X und iOS, Google Inc. in seinen Webanwendungen und dem Browser Google Chrome.[5] MediaWiki, die Software, mit der unter anderem Wikipedia betrieben wird, nutzt CLDR ebenfalls für seine vielfältigen Sprachversionen.[6]
CLDR enthält auch Konversionswerkzeuge, um aus den Daten POSIX-Locales zu erhalten.[7]
Weblinks
[Bearbeiten | Quelltext bearbeiten]Einzelnachweise
[Bearbeiten | Quelltext bearbeiten]- ↑ Acknowledgments. Unicode CLDR Project; abgerufen am 13. November 2013.
- ↑ CLDR 43.1 Release Note. Unicode CLDR Project; abgerufen am 30. Juni 2023.
- ↑ Unicode Technical Standard #35 – Unicode Locale Data Markup Language (LDML). In: unicode.org, abgerufen am 13. November 2013.
- ↑ CLDR 24 Release Note. ( vom 3. Dezember 2013 im Internet Archive) Unicode CLDR Project; abgerufen am 13. November 2013.
- ↑ Who uses CLDR? Unicode CLDR Project; abgerufen am 13. November 2013.
- ↑ mw:Extension:CLDR.
- ↑ POSIX Data. Unicode CLDR Project; abgerufen am 13. November 2013.