Zum Inhalt springen

„Lateinische Zeichen in Unicode“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K Falsch verschachtelter Inhalt was auch immer man damit Spezial:Diff/235950686/253701552 anfangen soll
Zu 1D00 bis 1D7F siehe Unicodeblock Phonetische Erweiterungen, zu anderen Blöcken analog die entsprechenden Seiten. Die Zeichen müssen daher nicht hier abgebildet werden.
 
Zeile 28: Zeile 28:
=== Symbole ===
=== Symbole ===
Unicode kodiert auch eine Reihe von Symbolen, die aus lateinischen Buchstaben abgeleitet sind. Diese liegen in den Blöcken [[Unicodeblock Buchstabenähnliche Symbole|Buchstabenähnliche Symbole]], [[Unicodeblock Umschlossene alphanumerische Zeichen|Umschlossene alphanumerische Zeichen]] und [[Unicodeblock Mathematische alphanumerische Symbole|Mathematische alphanumerische Symbole]]. Vor allem letztere sind zur Verwendung mit den weiteren [[Mathematische Zeichen in Unicode|mathematischen Zeichen in Unicode]] vorgesehen. Auch die Zeichen für [[römische Zahlen]] im [[Unicodeblock Zahlzeichen]] gelten als lateinische Zeichen.
Unicode kodiert auch eine Reihe von Symbolen, die aus lateinischen Buchstaben abgeleitet sind. Diese liegen in den Blöcken [[Unicodeblock Buchstabenähnliche Symbole|Buchstabenähnliche Symbole]], [[Unicodeblock Umschlossene alphanumerische Zeichen|Umschlossene alphanumerische Zeichen]] und [[Unicodeblock Mathematische alphanumerische Symbole|Mathematische alphanumerische Symbole]]. Vor allem letztere sind zur Verwendung mit den weiteren [[Mathematische Zeichen in Unicode|mathematischen Zeichen in Unicode]] vorgesehen. Auch die Zeichen für [[römische Zahlen]] im [[Unicodeblock Zahlzeichen]] gelten als lateinische Zeichen.
{| class="hintergrundfarbe1" style="font-family:Noto Sans; font-size:1.4em; border: 1px; border solid; border-collapse:collapse;"
|-
|
1D00 ᴀ ᴁ ᴂ ᴃ ᴄ ᴅ ᴆ ᴇ ᴈ ᴉ ᴊ ᴋ ᴌ ᴍ ᴎ ᴏ Phonetic Extensions
1D00–1D7F 111
1D10 ᴐ ᴑ ᴒ ᴓ ᴔ ᴕ ᴖ ᴗ ᴘ ᴙ ᴚ ᴛ ᴜ ᴝ ᴞ ᴟ
1D20 ᴠ ᴡ ᴢ ᴣ ᴤ ᴥ ᴦ ᴧ ᴨ ᴩ ᴪ ᴫ ᴬ ᴭ ᴮ ᴯ
1D30 ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ
1D40 ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵎ ᵏ
1D50 ᵐ ᵑ ᵒ ᵓ ᵔ ᵕ ᵖ ᵗ ᵘ ᵙ ᵚ ᵛ ᵜ ᵝ ᵞ ᵟ
1D60 ᵠ ᵡ ᵢ ᵣ ᵤ ᵥ ᵦ ᵧ ᵨ ᵩ ᵪ ᵫ ᵬ ᵭ ᵮ ᵯ
1D70 ᵰ ᵱ ᵲ ᵳ ᵴ ᵵ ᵶ ᵷ ᵸ ᵹ ᵺ ᵻ ᵼ ᵽ ᵾ ᵿ
|-
|
1D80 ᶀ ᶁ ᶂ ᶃ ᶄ ᶅ ᶆ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶏ Phonetic Extensions Supplement
1D80–1DBF 63
1D90 ᶐ ᶑ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶙ ᶚ ᶛ ᶜ ᶝ ᶞ ᶟ
1DA0 ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ
1DB0 ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ ᶿ
|-
|
1E00 Ḁ ḁ Ḃ ḃ Ḅ ḅ Ḇ ḇ Ḉ ḉ Ḋ ḋ Ḍ ḍ Ḏ ḏ Latin Extended Additional
1E00–1EFF 256
1E10 Ḑ ḑ Ḓ ḓ Ḕ ḕ Ḗ ḗ Ḙ ḙ Ḛ ḛ Ḝ ḝ Ḟ ḟ
1E20 Ḡ ḡ Ḣ ḣ Ḥ ḥ Ḧ ḧ Ḩ ḩ Ḫ ḫ Ḭ ḭ Ḯ ḯ
1E30 Ḱ ḱ Ḳ ḳ Ḵ ḵ Ḷ ḷ Ḹ ḹ Ḻ ḻ Ḽ ḽ Ḿ ḿ
1E40 Ṁ ṁ Ṃ ṃ Ṅ ṅ Ṇ ṇ Ṉ ṉ Ṋ ṋ Ṍ ṍ Ṏ ṏ
1E50 Ṑ ṑ Ṓ ṓ Ṕ ṕ Ṗ ṗ Ṙ ṙ Ṛ ṛ Ṝ ṝ Ṟ ṟ
1E60 Ṡ ṡ Ṣ ṣ Ṥ ṥ Ṧ ṧ Ṩ ṩ Ṫ ṫ Ṭ ṭ Ṯ ṯ
1E70 Ṱ ṱ Ṳ ṳ Ṵ ṵ Ṷ ṷ Ṹ ṹ Ṻ ṻ Ṽ ṽ Ṿ ṿ
1E80 Ẁ ẁ Ẃ ẃ Ẅ ẅ Ẇ ẇ Ẉ ẉ Ẋ ẋ Ẍ ẍ Ẏ ẏ
1E90 Ẑ ẑ Ẓ ẓ Ẕ ẕ ẖ ẗ ẘ ẙ ẚ ẛ ẜ ẝ ẞ ẟ
1EA0 Ạ ạ Ả ả Ấ ấ Ầ ầ Ẩ ẩ Ẫ ẫ Ậ ậ Ắ ắ
1EB0 Ằ ằ Ẳ ẳ Ẵ ẵ Ặ ặ Ẹ ẹ Ẻ ẻ Ẽ ẽ Ế ế
1EC0 Ề ề Ể ể Ễ ễ Ệ ệ Ỉ ỉ Ị ị Ọ ọ Ỏ ỏ
1ED0 Ố ố Ồ ồ Ổ ổ Ỗ ỗ Ộ ộ Ớ ớ Ờ ờ Ở ở
1EE0 Ỡ ỡ Ợ ợ Ụ ụ Ủ ủ Ứ ứ Ừ ừ Ử ử Ữ ữ
1EF0 Ự ự Ỳ ỳ Ỵ ỵ Ỷ ỷ Ỹ ỹ Ỻ ỻ Ỽ ỽ Ỿ ỿ
|-
|
2070 ⁰ ⁱ ⁴ ⁵ ⁶ ⁷ ⁸ ⁹ ⁺ ⁻ ⁼ ⁽ ⁾ ⁿ Superscripts and Subscripts
2070–209F 15
|-
|
2090 ₐ ₑ ₒ ₓ ₔ ₕ ₖ ₗ ₘ ₙ ₚ ₛ ₜ
2120 ℠ ℡ ™ ℣ ℤ ℥ Ω ℧ ℨ ℩ K Å ℬ ℭ ℮ ℯ Letterlike symbols
2100–214F 4
2130 ℰ ℱ Ⅎ ℳ ℴ ℵ ℶ ℷ ℸ ℹ ℺ ℻ ℼ ℽ ℾ ℿ
2140 ⅀ ⅁ ⅂ ⅃ ⅄ ⅅ ⅆ ⅇ ⅈ ⅉ ⅊ ⅋ ⅌ ⅍ ⅎ ⅏
|-
|
2160 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ Ⅼ Ⅽ Ⅾ Ⅿ Number Forms
2150–218F 41
2170 ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ ⅺ ⅻ ⅼ ⅽ ⅾ ⅿ
2180 ↀ ↁ ↂ Ↄ ↄ ↅ ↆ ↇ ↈ ↉ ↊ ↋
|-
|
2C60 Ⱡ ⱡ Ɫ Ᵽ Ɽ ⱥ ⱦ Ⱨ ⱨ Ⱪ ⱪ Ⱬ ⱬ Ɑ Ɱ Ɐ Latin Extended-C
2C60–2C7F 32
2C70 Ɒ ⱱ Ⱳ ⱳ ⱴ Ⱶ ⱶ ⱷ ⱸ ⱹ ⱺ ⱻ ⱼ ⱽ Ȿ Ɀ
|-
|
A720 ꜠ ꜡ Ꜣ ꜣ Ꜥ ꜥ Ꜧ ꜧ Ꜩ ꜩ Ꜫ ꜫ Ꜭ ꜭ Ꜯ ꜯ Latin Extended-D
A720–A7FF 194
A730 ꜰ ꜱ Ꜳ ꜳ Ꜵ ꜵ Ꜷ ꜷ Ꜹ ꜹ Ꜻ ꜻ Ꜽ ꜽ Ꜿ ꜿ
A740 Ꝁ ꝁ Ꝃ ꝃ Ꝅ ꝅ Ꝇ ꝇ Ꝉ ꝉ Ꝋ ꝋ Ꝍ ꝍ Ꝏ ꝏ
A750 Ꝑ ꝑ Ꝓ ꝓ Ꝕ ꝕ Ꝗ ꝗ Ꝙ ꝙ Ꝛ ꝛ Ꝝ ꝝ Ꝟ ꝟ
A760 Ꝡ ꝡ Ꝣ ꝣ Ꝥ ꝥ Ꝧ ꝧ Ꝩ ꝩ Ꝫ ꝫ Ꝭ ꝭ Ꝯ ꝯ
A770 ꝰ ꝱ ꝲ ꝳ ꝴ ꝵ ꝶ ꝷ ꝸ Ꝺ ꝺ Ꝼ ꝼ Ᵹ Ꝿ ꝿ
A780 Ꞁ ꞁ Ꞃ ꞃ Ꞅ ꞅ Ꞇ ꞇ ꞈ ꞉ ꞊ Ꞌ ꞌ Ɥ ꞎ ꞏ
A790 Ꞑ ꞑ Ꞓ ꞓ ꞔ ꞕ Ꞗ ꞗ Ꞙ ꞙ Ꞛ ꞛ Ꞝ ꞝ Ꞟ ꞟ
A7A0 Ꞡ ꞡ Ꞣ ꞣ Ꞥ ꞥ Ꞧ ꞧ Ꞩ ꞩ Ɦ Ɜ Ɡ Ɬ Ɪ ꞯ
A7B0 Ʞ Ʇ Ʝ Ꭓ Ꞵ ꞵ Ꞷ ꞷ Ꞹ ꞹ Ꞻ ꞻ Ꞽ ꞽ Ꞿ ꞿ
A7C0 Ꟁ ꟁ Ꟃ ꟃ Ꞔ Ʂ Ᶎ Ꟈ ꟈ Ꟊ ꟊ Ɤ Ꟍ ꟍ
A7D0 Ꟑ ꟑ ꟓ ꟕ Ꟗ ꟗ Ꟙ ꟙ Ꟛ ꟛ Ƛ
A7E0
A7F0 ꟲ ꟳ ꟴ Ꟶ ꟶ ꟷ ꟸ ꟹ ꟺ ꟻ ꟼ ꟽ ꟾ ꟿ
|-
|
AB30 ꬰ ꬱ ꬲ ꬳ ꬴ ꬵ ꬶ ꬷ ꬸ ꬹ ꬺ ꬻ ꬼ ꬽ ꬾ ꬿ Latin Extended-E
AB30–AB6F 56
AB40 ꭀ ꭁ ꭂ ꭃ ꭄ ꭅ ꭆ ꭇ ꭈ ꭉ ꭊ ꭋ ꭌ ꭍ ꭎ ꭏ
AB50 ꭐ ꭑ ꭒ ꭓ ꭔ ꭕ ꭖ ꭗ ꭘ ꭙ ꭚ ꭛ ꭜ ꭝ ꭞ ꭟ
AB60 ꭠ ꭡ ꭢ ꭣ ꭤ ꭥ ꭦ ꭧ ꭨ ꭩ ꭪ ꭫
|-
|
FB00 ff fi fl ffi ffl ſt st Alphabetic Presentation Forms 7
|-
|
FF20 @ A B C D E F G H I J K L M N O Halfwidth and Fullwidth Forms
(fullwidth Latin letters)
FF00–FFEF 52
FF30 P Q R S T U V W X Y Z [ \ ] ^ _
FF40 ` a b c d e f g h i j k l m n o
FF50 p q r s t u v w x y z { | } ~ ⦅
|-
|
10780 𐞀 𐞁 𐞂 𐞃 𐞄 𐞅 𐞇 𐞈 𐞉 𐞊 𐞋 𐞌 𐞍 𐞎 𐞏 Latin Extended-F
10780–107BF 57
10790 𐞐 𐞑 𐞒 𐞓 𐞔 𐞕 𐞖 𐞗 𐞘 𐞙 𐞚 𐞛 𐞜 𐞝 𐞞 𐞟
107A0 𐞠 𐞡 𐞢 𐞣 𐞤 𐞥 𐞦 𐞧 𐞨 𐞩 𐞪 𐞫 𐞬 𐞭 𐞮 𐞯
107B0 𐞰 𐞲 𐞳 𐞴 𐞵 𐞶 𐞷 𐞸 𐞹 𐞺
|-
|
1DF00 𝼀 𝼁 𝼂 𝼃 𝼄 𝼅 𝼆 𝼇 𝼈 𝼉 𝼊 𝼋 𝼌 𝼍 𝼎 𝼏 Latin Extended-G
1DF00–1DFFF 37
1DF10 𝼐 𝼑 𝼒 𝼓 𝼔 𝼕 𝼖 𝼗 𝼘 𝼙 𝼚 𝼛 𝼜 𝼝 𝼞
1DF20 𝼥 𝼦 𝼧 𝼨 𝼩 𝼪
|}


== Quellen ==
== Quellen ==
Zeile 142: Zeile 33:


== Weblinks ==
== Weblinks ==
* {{Internetquelle |autor=Koordinierungsstelle für IT-Standards (KoSIT) |url=https://www.xoev.de/downloads-2316#StringLatin |titel=String.Latin+ 1.2: eine kommentierte und erweiterte Fassung der DIN SPEC 91379. Inklusive einer umfangreichen Liste häufig gestellter Fragen |hrsg=Herausgegeben von der Fachgruppe String.Latin |abruf=2023-03-31}}
* {{Internetquelle
|autor=Koordinierungsstelle für IT-Standards (KoSIT)
|url=https://www.xoev.de/downloads-2316#StringLatin
|titel=String.Latin+ 1.2: eine kommentierte und erweiterte Fassung der DIN SPEC 91379. Inklusive einer umfangreichen Liste häufig gestellter Fragen. Herausgegeben von der Fachgruppe String.Latin. (zip, 1.7 MB)
|abruf=2023-03-31}}
* Projektgruppe der deutschen Innenministerkonferenz: [http://xoev.de/latinchars/1_1/supplement/identverfahren.pdf Umstellung auf Lateinische Zeichen in Unicode – Vorgaben für Identifikationsverfahren] (PDF; 2,6 MB), 17. Januar 2012
* Projektgruppe der deutschen Innenministerkonferenz: [http://xoev.de/latinchars/1_1/supplement/identverfahren.pdf Umstellung auf Lateinische Zeichen in Unicode – Vorgaben für Identifikationsverfahren] (PDF; 2,6 MB), 17. Januar 2012
* [[DIN 91379]] „DIN 91379 Zeichen und definierte Zeichensequenzen in Unicode für die elektronische Verarbeitung von Namen und den Datenaustausch in Europa, mit CD-ROM“
* [[DIN 91379]] „DIN 91379 Zeichen und definierte Zeichensequenzen in Unicode für die elektronische Verarbeitung von Namen und den Datenaustausch in Europa, mit CD-ROM“

Aktuelle Version vom 27. Februar 2025, 10:26 Uhr

Lateinische Buchstaben, also Schriftzeichen, die auf dem lateinischen Alphabet aufgebaut sind, sind in Unicode in verschiedenen Blöcken enthalten.

Die 26 Grundbuchstaben befinden sich – neben Ziffern, Satzzeichen und Steuerzeichen – im Unicodeblock Basis-Lateinisch, während die anderen Blöcke Erweiterungen des Grundalphabets enthalten:

  • abgewandelte Buchstabenformen wie ð, ə oder ŋ
  • Ligaturen wie æ, œ oder ƕ
  • aus anderen Schriften entlehnte, aber in lateinischen Orthographien benutzte Zusatzbuchstaben wie þ oder ɛ
  • diakritische Zeichen, die mit Grundbuchstaben kombiniert werden können
  • aus Gründen der Kompatibilität mit älteren Codepages eine große Menge fertiger Kombinationen aus Grundbuchstabe und diakritischem Zeichen wie ä, ç, č oder
  • ebenfalls aus Gründen der Kompatibilität einzelne Digraphe wie ij, nj oder dz
  • Darstellung der lateinischen Buchstaben für die CJK-Schriften (vollbreit und halbbreit)
  • Zier- und Kalligraphische Varianten wie Ⓐ, ⒜,⒈, ℋ, ℳ,
  • auf der Lateinschrift aufgebaute Symbole wie $, , ,

Kodierte Zeichen

[Bearbeiten | Quelltext bearbeiten]

Bis zum Codepunkt U+00FF folgt Unicode der Latin-1-Zeichenkodierung, und damit auch ASCII. Somit liegen die Grundbuchstaben des lateinischen Alphabets zusammen mit weiteren Zeichen im Unicodeblock Basis-Lateinisch, der folgende Block Lateinisch-1, Ergänzung enthält neben anderen Zeichen Buchstaben mit Diakritika und einige Sonderbuchstaben, insbesondere das deutsche ß. Im nächsten Block Lateinisch, erweitert-A befinden sich die weiteren lateinischen Buchstaben aus den ISO/IEC-8859-Kodierungen 2, 3, 4 und 9, sowie in ISO 6937 kodierte Buchstaben. Dieser Block enthält auch das lange s. Der Unicodeblock Lateinisch, erweitert-B enthält vor allem phonetische und außereuropäische Erweiterungen des lateinischen Alphabets, darunter die meisten noch fehlenden Zeichen des Afrika-Alphabets. Seit Unicode 3.0 sind auch die rumänischen Buchstaben Ș und Ț in diesem Block kodiert. Der Block Lateinisch, weiterer Zusatz enthält weitere lateinische Buchstaben, darunter die des vietnamesischen Alphabets sowie das große ß. Der Unicodeblock Lateinisch, erweitert-C deckt das Uighurische Alphabet und eine Erweiterung des lateinischen Alphabets durch Claudius ab. Weitere historische Buchstaben finden sich in den Unicodeblöcken Lateinisch, erweitert-D und Lateinisch, erweitert-E.

Der Unicodeblock Alphabetische Präsentationsformen kodiert zur Kompatibilität mit anderen Standards einige Ligaturen lateinischer Buchstaben.

Um Buchstaben mit diakritischen Zeichen darzustellen, die nicht in Unicode kodiert sind, können sie als Kombination eines Grundbuchstaben mit einem kombinierenden Zeichen geschrieben werden. Diese befinden sich in den Blöcken Kombinierende diakritische Zeichen, Kombinierende diakritische Zeichen, Ergänzung, Kombinierende halbe diakritische Zeichen und Kombinierende diakritische Zeichen, erweitert.

Lautschriften wie das Internationale Phonetische Alphabet und das Uralische Phonetische Alphabet verwenden lateinische und griechische Buchstaben sowie einige eigene Erweiterungen. Diese Erweiterungen gelten in Unicode meist ebenfalls als lateinische Buchstaben. Diese Zeichen finden sich in den Blöcken IPA-Erweiterungen, Spacing Modifier Letters, Phonetische Erweiterungen, Phonetische Erweiterungen, Ergänzung und Hoch- und tiefgestellte Zeichen.

Vollbreite Zeichen

[Bearbeiten | Quelltext bearbeiten]

Der Unicodeblock Halbbreite und vollbreite Formen enthält die lateinischen Grundbuchstaben in einer breiten Form, in der sie zusammen mit ostasiatischen Schriften in Unicode verwendet werden.

Unicode kodiert auch eine Reihe von Symbolen, die aus lateinischen Buchstaben abgeleitet sind. Diese liegen in den Blöcken Buchstabenähnliche Symbole, Umschlossene alphanumerische Zeichen und Mathematische alphanumerische Symbole. Vor allem letztere sind zur Verwendung mit den weiteren mathematischen Zeichen in Unicode vorgesehen. Auch die Zeichen für römische Zahlen im Unicodeblock Zahlzeichen gelten als lateinische Zeichen.

  • Julie D. Allen et al.: The Unicode Standard. Version 6.2 – Core Specification. The Unicode Consortium, Mountain View, CA, 2012. ISBN 978-1-936213-07-8. Chapter 7.1: Latin. (online, PDF)