Zum Inhalt springen

Tamil Script Code for Information Interchange

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 5. September 2004 um 19:14 Uhr durch Pjacobi (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

TSCII (Tamil Script Code for Information Interchange) ist eine Zeichenkodierung für a coding scheme for representing the Tamil script. The lower 128 codepoints are plain ASCII, the upper 128 codepoints are TSCII-specific.

TSCII encodes the characters in visual (written) order, paralleling the use of the Tamil Typewriter.

Unicode has used the logical order encoding strategy for Tamil, following ISCII, in contrast to the case of Thai, where the visual order encoding grandfathered by TIS620 was adopted.

The government of Tamil Nadu endorses its own TAB/TAM standards for 8-bit encoding and other, older encoding schemes can still be found on the WWW.

The free etext collection at Project Madurai uses the TSCII encoding, but has already started to provide Unicode versions.

Table

 x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
8x ஸ்ரீ க்ஷ ஜ்‌ ஷ்‌ ஸ்‌ ஹ்‌ க்ஷ்‌
9x ஙு ஞு ஙூ ஞூ
Ax NBSP  ா  ி  ீ  ு  ூ  ெ  ே  ை ©  ௗ  
Bx
Cx டி டீ கு சு டு ணு
Dx து நு பு மு யு ரு லு வு ழு ளு று னு கூ சூ டூ ணூ
Ex தூ நூ பூ மூ யூ ரூ லூ வூ ழூ ளூ றூ னூ க்‌ ங்‌ ச்‌ ஞ்‌
Fx ட்‌ ண்‌ த்‌ ந்‌ ப்‌ ம்‌ ய்‌ ர்‌ ல்‌ வ்‌ ழ்‌ ள்‌ ற்‌ ன்‌  
You need a Tamil Unicode font to see this table.

In the table above 80 is U+0BE6 TAMIL DIGIT ZERO, which is still in the Unicode pipeline, and A0 is the NO-BREAK SPACE. The codes AD and FF are unassigned.