„Indian Script Code for Information Interchange“ – Versionsunterschied

Versionsgeschichte interaktiv durchsuchen

[gesichtete Version]

← Zum vorherigen Versionsunterschied Zum nächsten Versionsunterschied →

Inhalt gelöscht Inhalt hinzugefügt

Inline

Version vom 2. Juni 2019, 11:58 Uhr

Indian Script Code for Information Interchange (ISCII) ist die indische nationale Norm für die Kodierung der Zeichen der verschiedenen indischen Schriften, die sämtlich Abkömmlinge der Brahmi-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer Auszeichnungssprache oder einer Schrifttechnik wie OpenType vorgenommen wird.

ISCII umfasst die folgenden Schriften: Bengali, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamilisch und Telugu.

Wird ein Text auf eine andere Schrift umgestellt, erfolgt eine automatische Transliteration.

ISCII ist ein 8-Bit Zeichensatz, bei dem, wie bei den ISO 8859 und vielen anderen Zeichensätzen, die unteren 128 Zeichen dem ASCII-Standard entsprechen.

In Unicode ist die Kodierungsart von ISCII weitgehend beibehalten worden. Hier aber sind die unterschiedlichen Schriften in separaten jeweils 128 Byte großen Codeblöcken im Bereich U+0900 bis U+0DFF kodiert.

Code	…0	…1	…2	…3	…4	…5	…6	…7	…8	…9	…A	…B	…C	…D	…E	…F
A…		ँ	ं	ः	अ	आ	इ	ई	उ	ऊ	ऋ	ऎ	ए	ऐ	ऍ	ऒ
B…	ओ	औ	ऑ	क	ख	ग	घ	ङ	च	छ	ज	झ	ञ	ट	ठ	ड
C…	ढ	ण	त	थ	द	ध	न	ऩ	प	फ	ब	भ	म	य	य़	र
D…	ऱ	ल	ळ	ऴ	व	श	ष	स	ह	INV	ा	ि	ी	ु	ू	ृ
E…	ॆ	े	ै	ॅ	ॊ	ो	ौ	ॉ	्	़	।					ATR
F…	EXT	०	१	२	३	४	५	६	७	८	९

D9_hex: INV: Unsichtbares (invisible) Zeichen, mit dem in Verbindung mit Halant (siehe unten) sogenannte Halbformen kombinierender Zeichen isoliert dargestellt werden können, z. B. क (ka) + ् (Halant) + INV = क्‍ In Unicode folgt auf das Halant U+094D stattdessen das Zeichen ZERO WIDTH JOINER U+200D.; INV wird auch als (leeres) Basiszeichen zur Darstellung kombinierender Vokalzeichen verwendet. In Unicode wird stattdessen NBSP U+00A0 oder der gepunktete Kreis ◌ U+25CC verwendet.

EF_hex: ATR: Schalter zur Auswahl eines bestimmten Skripts bis sum Zeilenende. Steht dazu vor einem Bytecode.

F0_hex: EXT: Vedischer Akzent. Auswahl durch folgendes Byte.

E8_hex: Halant (Virama): Entfernt den vorhergehenden inhärenten Vokal, bzw. verbindet Konsonanten zu Clustern, z. B. क (ka) + ् (Halant) + त (ta) = क्त (kta). Die Sequenz ् (Halant) + ् (Halant) erzeugt ein explizites Halant, z. B. क (ka) + ् (Halant) + ् (Halant) + त (ta) = क्‌त. Die Sequenz ् (Halant) + ़ (Nukta) erzeugt Halbkonsonanten, wenn möglich, z. B. क (ka) + ् (Halant) + ़ (Nukta) + त (ta) = क्‍त.

ISCII	Unicode
Halant	Halant
Halant + Halant	Halant + ZWNJ
Halant + Nukta	Halant + ZWJ

E9_hex: Nukta: Erzeugt nachgestellt seltenere Zeichen ohne eigenen Code, z. B. क (ka) + ़ (Nukta) = क़ (qa).

Siehe auch

Devanagari
TSCII (alternative Norm für Tamilisch)

Weblinks

The ISCII standard (PDF, engl., 258 kB)
Weiterführende Informationen der indischen Regierung

@@ Zeile 1: / Zeile 1: @@
-'''Indian Script Code for Information Interchange''' ('''ISCII''') ist die indische nationale [[Normung|Norm]] für die Kodierung der Zeichen der verschiedenen [[Indischer Schriftenkreis|indischen Schriften]], die sämtlich Abkömmlinge der [[Brahmi-Schrift|Brahmi]]-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer [[Auszeichnungssprache]] (engl.: Markup) oder einer Schrifttechnik wie [[OpenType]] vorgenommen wird.
+'''Indian Script Code for Information Interchange''' ('''ISCII''') ist die indische nationale [[Normung|Norm]] für die Kodierung der Zeichen der verschiedenen [[Indischer Schriftenkreis|indischen Schriften]], die sämtlich Abkömmlinge der [[Brahmi-Schrift|Brahmi]]-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer [[Auszeichnungssprache]] oder einer Schrifttechnik wie [[OpenType]] vorgenommen wird.
 ISCII umfasst die folgenden Schriften: [[Bengalische Schrift|Bengali]], [[Devanagari]], [[Gujarati-Schrift|Gujarati]], [[Gurmukhi-Schrift|Gurmukhi]], [[Kannada-Schrift|Kannada]], [[Malayalam-Schrift|Malayalam]], [[Oriya-Schrift|Oriya]], [[Tamilische Schrift|Tamilisch]] und [[Telugu-Schrift|Telugu]].
@@ Zeile 9: / Zeile 9: @@
 In [[Unicode]] ist die Kodierungsart von ISCII weitgehend beibehalten worden. Hier aber sind die unterschiedlichen Schriften in separaten jeweils 128 Byte großen [[Unicode#Gliederung in Ebenen und Blöcke|Codeblöcken]] im Bereich U+0900 bis U+0DFF kodiert.
-{| class="wikitable" style="text-align:center;"
+{| class="wikitable" style="text-align:center; font-size:larger; font-family:monospace;"
 |-- class="hintergrundfarbe6"
 ![[Hexadezimalsystem|Code]]
@@ Zeile 15: / Zeile 15: @@
 |-
 !class="hintergrundfarbe6"|A…
-|''NBSP''||''[[Chandrabindu|CB]]''||''[[Anusvara|AV]]''||''[[Visarga|VSG]]''||A||title="Aa"|Ā||I||title="Ii"|Ī||U||title="Uu"|Ū||title="R vokalisch"|R||title="E kurz"|E||title="E"|Ē||Ai||title="E candra"|Ẽ||title="O kurz"|O
+| class="hintergrundfarbe5"| ||[[Chandrabindu|ँ]]||[[Anusvara|ं]]||[[Visarga|ः]]||अ|| title="Aa" |आ||इ|| title="Ii" |ई||उ|| title="Uu" |ऊ
+| title="R vokalisch" |ऋ
+| title="E kurz" |ऎ
+| title="E" |ए
+|ऐ
+| title="E candra" |ऍ
+| title="O kurz" |ऒ
 |-
 !class="hintergrundfarbe6"|B…
+|ओ
-|O||Au||title="O candra"|Õ||Ka||Kha||Ga||Gha||Nga||Ca||Cha||Ja||Jha||Nya||Tta||Ttha||Dda
+|औ
+| title="O candra" |ऑ
+|क
+|ख
+|ग
+|घ
+|ङ
+|च
+|छ
+|ज
+|झ
+|ञ
+|ट
+|ठ
+|ड
 |-
 !class="hintergrundfarbe6"|C…
+|ढ
-|Ddha||Nna||Ta||Tha||Da||Dha||Na||Nnna||Pa||Pha||Ba||Bha||Ma||Ya||Yya||Ra
+|ण
+|त
+|थ
+|द
+|ध
+|न
+|ऩ
+|प
+|फ
+|ब
+|भ
+|म
+|य
+|य़
+|र
 |-
 !class="hintergrundfarbe6"|D…
+|ऱ
-|Rra||La||Lla||Llla||Va||Sha||Ssa||Sa||Ha||''INV''||title="aa"|ā||i||title="ii"|ī||u||title="uu"|ū||title="r vokalisch"|r
+|ल
+|ळ||ऴ
+|व
+|श
+|ष
+|स
+|ह
+|''INV''||title="aa"|ा
+|ि
+| title="ii" |ी
+|ु
+| title="uu" |ू
+| title="r vokalisch" |ृ
 |-
 !class="hintergrundfarbe6"|E…
+|title="e kurz"|ॆ
-|title="e kurz"|e||title="e"|ē||ai||title="e candra"|ẽ||title="o kurz"|o||title="o"|ō||au||title="o candra"|õ||''[[Halant]]''||''[[Nukta]]''||''[[Danda (Satzzeichen)|Danda]]''||||||||||''ATR''
+| title="e" |े
+|ै
+| title="e candra" |ॅ
+| title="o kurz" |ॊ
+| title="o" |ो
+|ौ
+| title="o candra" |ॉ
+|[[Halant|्]]||[[Nukta|़]]||[[Danda (Satzzeichen)|।]]|| colspan="4" class="hintergrundfarbe5" style="border-bottom-style:hidden;" | ||''ATR''
 |-
 !class="hintergrundfarbe6"|F…
-|''EXT''||0||1||2||3||4||5||6||7||8||9||||||||||
+|''EXT''||०
+|१
+|२
+|३
+|४
+|५
+|६
+|७
+|८
+|९
+| colspan="5" class="hintergrundfarbe5" |
 |}
+; D9<sub>hex</sub><nowiki>: INV</nowiki>
-; INV
 :Unsichtbares (''invisible'') Zeichen, mit dem in Verbindung mit Halant (siehe unten) sogenannte Halbformen kombinierender Zeichen isoliert dargestellt werden können, z.&nbsp;B. क (ka) + ् (Halant) + INV = &#x915;&#x94d;&#x200d; In Unicode folgt auf das Halant U+094D stattdessen das Zeichen ZERO WIDTH JOINER U+200D.
 :INV wird auch als (leeres) Basiszeichen zur Darstellung kombinierender Vokalzeichen verwendet. In Unicode wird stattdessen [[NBSP]] U+00A0 oder der gepunktete Kreis &#x25CC; U+25CC verwendet.
+; EF<sub>hex</sub><nowiki>: ATR</nowiki>
-; ATR
 :Schalter zur Auswahl eines bestimmten Skripts bis sum Zeilenende. Steht dazu vor einem Bytecode.
+; F0<sub>hex</sub><nowiki>: EXT</nowiki>
-; EXT
 :Vedischer Akzent. Auswahl durch folgendes Byte.
-; Halant (Virama)
+; E8<sub>hex</sub><nowiki>: Halant (Virama)</nowiki>
 :Entfernt den vorhergehenden inhärenten Vokal, bzw. verbindet Konsonanten zu Clustern, z.&nbsp;B. क (ka) + ् (Halant) + त (ta) = क्त (kta).  Die Sequenz ् (Halant) + ् (Halant) erzeugt ein explizites Halant, z.&nbsp;B. क (ka) + ् (Halant) + ् (Halant) + त (ta) = क्‌त.  Die Sequenz ् (Halant) + ़ (Nukta) erzeugt Halbkonsonanten, wenn möglich, z.&nbsp;B.  क (ka) + ् (Halant) + ़ (Nukta) + त (ta) = क्‍त.
@@ Zeile 55: / Zeile 122: @@
 | Halant + Nukta || Halant + [[Breitenloser Verbinder|ZWJ]]
 |}
-; Nukta: Erzeugt nachgestellt seltenere Zeichen ohne eigenen Code, z.&nbsp;B. क (ka) + ़ (Nukta) = क़ (qa).
+; E9<sub>hex</sub><nowiki>: Nukta</nowiki>: Erzeugt nachgestellt seltenere Zeichen ohne eigenen Code, z.&nbsp;B. क (ka) + ़ (Nukta) = क़ (qa).
 == Siehe auch ==