„Indian Script Code for Information Interchange“ – Versionsunterschied
[gesichtete Version] | [gesichtete Version] |
Aka (Diskussion | Beiträge) K Abkürzung korrigiert |
Mps (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
Zeile 1: | Zeile 1: | ||
'''Indian Script Code for Information Interchange''' ('''ISCII''') ist die indische nationale [[Normung|Norm]] für die Kodierung der Zeichen der verschiedenen [[Indischer Schriftenkreis|indischen Schriften]], die sämtlich Abkömmlinge der [[Brahmi-Schrift|Brahmi]]-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer [[Auszeichnungssprache]] |
'''Indian Script Code for Information Interchange''' ('''ISCII''') ist die indische nationale [[Normung|Norm]] für die Kodierung der Zeichen der verschiedenen [[Indischer Schriftenkreis|indischen Schriften]], die sämtlich Abkömmlinge der [[Brahmi-Schrift|Brahmi]]-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer [[Auszeichnungssprache]] oder einer Schrifttechnik wie [[OpenType]] vorgenommen wird. |
||
ISCII umfasst die folgenden Schriften: [[Bengalische Schrift|Bengali]], [[Devanagari]], [[Gujarati-Schrift|Gujarati]], [[Gurmukhi-Schrift|Gurmukhi]], [[Kannada-Schrift|Kannada]], [[Malayalam-Schrift|Malayalam]], [[Oriya-Schrift|Oriya]], [[Tamilische Schrift|Tamilisch]] und [[Telugu-Schrift|Telugu]]. |
ISCII umfasst die folgenden Schriften: [[Bengalische Schrift|Bengali]], [[Devanagari]], [[Gujarati-Schrift|Gujarati]], [[Gurmukhi-Schrift|Gurmukhi]], [[Kannada-Schrift|Kannada]], [[Malayalam-Schrift|Malayalam]], [[Oriya-Schrift|Oriya]], [[Tamilische Schrift|Tamilisch]] und [[Telugu-Schrift|Telugu]]. |
||
Zeile 9: | Zeile 9: | ||
In [[Unicode]] ist die Kodierungsart von ISCII weitgehend beibehalten worden. Hier aber sind die unterschiedlichen Schriften in separaten jeweils 128 Byte großen [[Unicode#Gliederung in Ebenen und Blöcke|Codeblöcken]] im Bereich U+0900 bis U+0DFF kodiert. |
In [[Unicode]] ist die Kodierungsart von ISCII weitgehend beibehalten worden. Hier aber sind die unterschiedlichen Schriften in separaten jeweils 128 Byte großen [[Unicode#Gliederung in Ebenen und Blöcke|Codeblöcken]] im Bereich U+0900 bis U+0DFF kodiert. |
||
{| class="wikitable" style="text-align:center;" |
{| class="wikitable" style="text-align:center; font-size:larger; font-family:monospace;" |
||
|-- class="hintergrundfarbe6" |
|-- class="hintergrundfarbe6" |
||
![[Hexadezimalsystem|Code]] |
![[Hexadezimalsystem|Code]] |
||
Zeile 15: | Zeile 15: | ||
|- |
|- |
||
!class="hintergrundfarbe6"|A… |
!class="hintergrundfarbe6"|A… |
||
| |
| class="hintergrundfarbe5"| ||[[Chandrabindu|ँ]]||[[Anusvara|ं]]||[[Visarga|ः]]||अ|| title="Aa" |आ||इ|| title="Ii" |ई||उ|| title="Uu" |ऊ |
||
| title="R vokalisch" |ऋ |
|||
| title="E kurz" |ऎ |
|||
| title="E" |ए |
|||
|ऐ |
|||
| title="E candra" |ऍ |
|||
| title="O kurz" |ऒ |
|||
|- |
|- |
||
!class="hintergrundfarbe6"|B… |
!class="hintergrundfarbe6"|B… |
||
|ओ |
|||
|O||Au||title="O candra"|Õ||Ka||Kha||Ga||Gha||Nga||Ca||Cha||Ja||Jha||Nya||Tta||Ttha||Dda |
|||
|औ |
|||
| title="O candra" |ऑ |
|||
|क |
|||
|ख |
|||
|ग |
|||
|घ |
|||
|ङ |
|||
|च |
|||
|छ |
|||
|ज |
|||
|झ |
|||
|ञ |
|||
|ट |
|||
|ठ |
|||
|ड |
|||
|- |
|- |
||
!class="hintergrundfarbe6"|C… |
!class="hintergrundfarbe6"|C… |
||
|ढ |
|||
|Ddha||Nna||Ta||Tha||Da||Dha||Na||Nnna||Pa||Pha||Ba||Bha||Ma||Ya||Yya||Ra |
|||
|ण |
|||
|त |
|||
|थ |
|||
|द |
|||
|ध |
|||
|न |
|||
|ऩ |
|||
|प |
|||
|फ |
|||
|ब |
|||
|भ |
|||
|म |
|||
|य |
|||
|य़ |
|||
|र |
|||
|- |
|- |
||
!class="hintergrundfarbe6"|D… |
!class="hintergrundfarbe6"|D… |
||
|ऱ |
|||
|Rra||La||Lla||Llla||Va||Sha||Ssa||Sa||Ha||''INV''||title="aa"|ā||i||title="ii"|ī||u||title="uu"|ū||title="r vokalisch"|r |
|||
|ल |
|||
|ळ||ऴ |
|||
|व |
|||
|श |
|||
|ष |
|||
|स |
|||
|ह |
|||
|''INV''||title="aa"|ा |
|||
|ि |
|||
| title="ii" |ी |
|||
|ु |
|||
| title="uu" |ू |
|||
| title="r vokalisch" |ृ |
|||
|- |
|- |
||
!class="hintergrundfarbe6"|E… |
!class="hintergrundfarbe6"|E… |
||
|title="e kurz"|ॆ |
|||
|title="e kurz"|e||title="e"|ē||ai||title="e candra"|ẽ||title="o kurz"|o||title="o"|ō||au||title="o candra"|õ||''[[Halant]]''||''[[Nukta]]''||''[[Danda (Satzzeichen)|Danda]]''||||||||||''ATR'' |
|||
| title="e" |े |
|||
|ै |
|||
| title="e candra" |ॅ |
|||
| title="o kurz" |ॊ |
|||
| title="o" |ो |
|||
|ौ |
|||
| title="o candra" |ॉ |
|||
|[[Halant|्]]||[[Nukta|़]]||[[Danda (Satzzeichen)|।]]|| colspan="4" class="hintergrundfarbe5" style="border-bottom-style:hidden;" | ||''ATR'' |
|||
|- |
|- |
||
!class="hintergrundfarbe6"|F… |
!class="hintergrundfarbe6"|F… |
||
|''EXT''|| |
|''EXT''||० |
||
|१ |
|||
|२ |
|||
|३ |
|||
|४ |
|||
|५ |
|||
|६ |
|||
|७ |
|||
|८ |
|||
|९ |
|||
| colspan="5" class="hintergrundfarbe5" | |
|||
|} |
|} |
||
; D9<sub>hex</sub><nowiki>: INV</nowiki> |
|||
; INV |
|||
:Unsichtbares (''invisible'') Zeichen, mit dem in Verbindung mit Halant (siehe unten) sogenannte Halbformen kombinierender Zeichen isoliert dargestellt werden können, z. B. क (ka) + ् (Halant) + INV = क्‍ In Unicode folgt auf das Halant U+094D stattdessen das Zeichen ZERO WIDTH JOINER U+200D. |
:Unsichtbares (''invisible'') Zeichen, mit dem in Verbindung mit Halant (siehe unten) sogenannte Halbformen kombinierender Zeichen isoliert dargestellt werden können, z. B. क (ka) + ् (Halant) + INV = क्‍ In Unicode folgt auf das Halant U+094D stattdessen das Zeichen ZERO WIDTH JOINER U+200D. |
||
:INV wird auch als (leeres) Basiszeichen zur Darstellung kombinierender Vokalzeichen verwendet. In Unicode wird stattdessen [[NBSP]] U+00A0 oder der gepunktete Kreis ◌ U+25CC verwendet. |
:INV wird auch als (leeres) Basiszeichen zur Darstellung kombinierender Vokalzeichen verwendet. In Unicode wird stattdessen [[NBSP]] U+00A0 oder der gepunktete Kreis ◌ U+25CC verwendet. |
||
; EF<sub>hex</sub><nowiki>: ATR</nowiki> |
|||
; ATR |
|||
:Schalter zur Auswahl eines bestimmten Skripts bis sum Zeilenende. Steht dazu vor einem Bytecode. |
:Schalter zur Auswahl eines bestimmten Skripts bis sum Zeilenende. Steht dazu vor einem Bytecode. |
||
; F0<sub>hex</sub><nowiki>: EXT</nowiki> |
|||
; EXT |
|||
:Vedischer Akzent. Auswahl durch folgendes Byte. |
:Vedischer Akzent. Auswahl durch folgendes Byte. |
||
; Halant (Virama) |
; E8<sub>hex</sub><nowiki>: Halant (Virama)</nowiki> |
||
:Entfernt den vorhergehenden inhärenten Vokal, bzw. verbindet Konsonanten zu Clustern, z. B. क (ka) + ् (Halant) + त (ta) = क्त (kta). Die Sequenz ् (Halant) + ् (Halant) erzeugt ein explizites Halant, z. B. क (ka) + ् (Halant) + ् (Halant) + त (ta) = क्त. Die Sequenz ् (Halant) + ़ (Nukta) erzeugt Halbkonsonanten, wenn möglich, z. B. क (ka) + ् (Halant) + ़ (Nukta) + त (ta) = क्त. |
:Entfernt den vorhergehenden inhärenten Vokal, bzw. verbindet Konsonanten zu Clustern, z. B. क (ka) + ् (Halant) + त (ta) = क्त (kta). Die Sequenz ् (Halant) + ् (Halant) erzeugt ein explizites Halant, z. B. क (ka) + ् (Halant) + ् (Halant) + त (ta) = क्त. Die Sequenz ् (Halant) + ़ (Nukta) erzeugt Halbkonsonanten, wenn möglich, z. B. क (ka) + ् (Halant) + ़ (Nukta) + त (ta) = क्त. |
||
Zeile 55: | Zeile 122: | ||
| Halant + Nukta || Halant + [[Breitenloser Verbinder|ZWJ]] |
| Halant + Nukta || Halant + [[Breitenloser Verbinder|ZWJ]] |
||
|} |
|} |
||
; Nukta: Erzeugt nachgestellt seltenere Zeichen ohne eigenen Code, z. B. क (ka) + ़ (Nukta) = क़ (qa). |
; E9<sub>hex</sub><nowiki>: Nukta</nowiki>: Erzeugt nachgestellt seltenere Zeichen ohne eigenen Code, z. B. क (ka) + ़ (Nukta) = क़ (qa). |
||
== Siehe auch == |
== Siehe auch == |
Version vom 2. Juni 2019, 11:58 Uhr
Indian Script Code for Information Interchange (ISCII) ist die indische nationale Norm für die Kodierung der Zeichen der verschiedenen indischen Schriften, die sämtlich Abkömmlinge der Brahmi-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer Auszeichnungssprache oder einer Schrifttechnik wie OpenType vorgenommen wird.
ISCII umfasst die folgenden Schriften: Bengali, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamilisch und Telugu.
Wird ein Text auf eine andere Schrift umgestellt, erfolgt eine automatische Transliteration.
ISCII ist ein 8-Bit Zeichensatz, bei dem, wie bei den ISO 8859 und vielen anderen Zeichensätzen, die unteren 128 Zeichen dem ASCII-Standard entsprechen.
In Unicode ist die Kodierungsart von ISCII weitgehend beibehalten worden. Hier aber sind die unterschiedlichen Schriften in separaten jeweils 128 Byte großen Codeblöcken im Bereich U+0900 bis U+0DFF kodiert.
Code | …0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A… | ँ | ं | ः | अ | आ | इ | ई | उ | ऊ | ऋ | ऎ | ए | ऐ | ऍ | ऒ | |
B… | ओ | औ | ऑ | क | ख | ग | घ | ङ | च | छ | ज | झ | ञ | ट | ठ | ड |
C… | ढ | ण | त | थ | द | ध | न | ऩ | प | फ | ब | भ | म | य | य़ | र |
D… | ऱ | ल | ळ | ऴ | व | श | ष | स | ह | INV | ा | ि | ी | ु | ू | ृ |
E… | ॆ | े | ै | ॅ | ॊ | ो | ौ | ॉ | ् | ़ | । | ATR | ||||
F… | EXT | ० | १ | २ | ३ | ४ | ५ | ६ | ७ | ८ | ९ |
- D9hex: INV
- Unsichtbares (invisible) Zeichen, mit dem in Verbindung mit Halant (siehe unten) sogenannte Halbformen kombinierender Zeichen isoliert dargestellt werden können, z. B. क (ka) + ् (Halant) + INV = क् In Unicode folgt auf das Halant U+094D stattdessen das Zeichen ZERO WIDTH JOINER U+200D.
- INV wird auch als (leeres) Basiszeichen zur Darstellung kombinierender Vokalzeichen verwendet. In Unicode wird stattdessen NBSP U+00A0 oder der gepunktete Kreis ◌ U+25CC verwendet.
- EFhex: ATR
- Schalter zur Auswahl eines bestimmten Skripts bis sum Zeilenende. Steht dazu vor einem Bytecode.
- F0hex: EXT
- Vedischer Akzent. Auswahl durch folgendes Byte.
- E8hex: Halant (Virama)
- Entfernt den vorhergehenden inhärenten Vokal, bzw. verbindet Konsonanten zu Clustern, z. B. क (ka) + ् (Halant) + त (ta) = क्त (kta). Die Sequenz ् (Halant) + ् (Halant) erzeugt ein explizites Halant, z. B. क (ka) + ् (Halant) + ् (Halant) + त (ta) = क्त. Die Sequenz ् (Halant) + ़ (Nukta) erzeugt Halbkonsonanten, wenn möglich, z. B. क (ka) + ् (Halant) + ़ (Nukta) + त (ta) = क्त.
ISCII | Unicode |
---|---|
Halant | Halant |
Halant + Halant | Halant + ZWNJ |
Halant + Nukta | Halant + ZWJ |
- E9hex: Nukta
- Erzeugt nachgestellt seltenere Zeichen ohne eigenen Code, z. B. क (ka) + ़ (Nukta) = क़ (qa).
Siehe auch
- Devanagari
- TSCII (alternative Norm für Tamilisch)
Weblinks
- The ISCII standard (PDF, engl., 258 kB)
- Weiterführende Informationen der indischen Regierung