Zum Inhalt springen

American Standard Code for Information Interchange

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 1. September 2002 um 00:30 Uhr durch Maveric149 (Diskussion | Beiträge) (en:ASCII). Sie kann sich erheblich von der aktuellen Version unterscheiden.

ASCII ist ein Akronym für "American Standard Code for Information Interchange" (dt.: Amerikanischer Standard-Code für den Informationsaustausch), der als ANSI-Standard X3.4 im Jahr 1968 eingeführt wurde. Er beschreibt einen Zeichensatz, der auf dem Romanischen Alphabet basiert, wie es im modernen Englisch vorkommt und von Computern und anderen Kommunikationseinrichtungen, die Text darstellen, verwendet wird. Wie andere Codes auch (etwa IBMs EBCDIC ), spezifiziert er eine Korrespondenz zwischen Ganzzahlen(Integer), wie sie in digitaler Form dargestellt werden und den in der normalen Schriftsprache geschriebenen Zeichen. Auf diese Weise können solche Geräte durch den Austausch von binären Zeichen derart codierte Informationsinhalte miteinander austauschen und verarbeiten.


   Schriftzeichen   <->     Binärzeichen  
   A    (Hex 41)        (0) 1 0 0 0 0 0 1 
   B    (Hex 42)        (0) 1 0 0 0 0 1 0
   C    (Hex 43)        (0) 1 0 0 0 0 1 1
          ..                    ..
Die Buchstaben A,B und C als Sieben-Bit-Code


ASCII ist ein Sieben-Bit-Code, was bedeutet, dass er binäre Ganzzahlen verwendet, die mit sieben binären Ziffern dargestellt werden (entspricht 0 bis 127), um Informationen darzustellen. Selbst zu damaliger Zeit haben allerdings Computer bereits acht-bit Zahlenworte verwendet, nur wurde das achte bit meistens für Fehlerkorrekturzwecke auf den Kommunkationsleitungen oder für andere Steuerungsaufgaben verwendet. Fortschritte in der Technologie und die internationale Verbreitung erzeugten eine Reihe von Variationen und Erweiterungen des Codes, die nicht alle untereinander kompatibel waren und auch nicht für alle Systeme gleichermaßen verwendet werden können.


32   40 ( 48 0 56 8 64 @ 72 H 80 P 88 X  96 ` 104 h 112 p 120 x 
33 ! 41 ) 49 1 57 9 65 A 73 I 81 Q 89 Y  97 a 105 i 113 q 121 y 
34 " 42 * 50 2 58 : 66 B 74 J 82 R 90 Z  98 b 106 j 114 r 122 z 
35 # 43 + 51 3 59 ; 67 C 75 K 83 S 91 [  99 c 107 k 115 s 123 { 
36 $ 44 , 52 4 60 < 68 D 76 L 84 T 92 \ 100 d 108 l 116 t 124 | 
37 % 45 - 53 5 61 = 69 E 77 M 85 U 93 ] 101 e 109 m 117 u 125 } 
38 & 46 . 54 6 62 > 70 F 78 N 86 V 94 ^ 102 f 110 n 118 v 126 ~ 
39 ' 47 / 55 7 63 ? 71 G 79 O 87 W 95 _ 103 g 111 o 119 w

Tabelle: ASCII Zeichensatz (druckbare Zeichen)

Die ersten 32 Zeichencodes in ASCII sind reserviert für Zeichen, die Steuerzeichen (control character) genannt werden - Zeichen, die eigentlich keine Schriftzeichen darstellen, sondern die zur Steuerung von solchen Geräten dienen (oder dienten), die ASCII verwenden (etwa Drucker). Darin sind solche Dinge enthalten wie Wagenrücklauf oder Bell (die Glocke) - Relikte aus der Steinzeit der Computertechnik.

Code 32 ist das Leerzeichen, engl. space oder blank, welches ein Leerzeichen zwischen den Wörtern angibt und auf der Tastatur durch die große breite Leertaste erzeugt wird. Die Codes 33 bis 126 sind alle 'druckbaren' Zeichen, die sowohl Buchstaben, Ziffern und Satzzeichen (siehe Tabelle) beinhalten. Code 127 (mit allen Bits eins gesetzt) ist ein Sonderzeichen, welches auch als "Löschzeichen" bezeichnet wird. Obwohl es ähnlich wie ein Steuerzeichen eingesetzt wird/wurde, wurde diese Stelle im Zeichensatz verwendet, um auf den früheren Papierstreifen oder Lochmaschinen ein Möglichkeit zu haben, ein geschriebenes Zeichen durch Löschen aller Bits - d.h. durch Auslochen aller sieben Markierungen - löschen zu können.

ASCII beinhaltet keine Zeichen um die vielen Sprachen darstellen zu können, die alle das Romanische Alphabet als Basis haben.

Der internationale Standard ISO646 (1972) war der erste Versuch, dieses Problem anzugehen. Leider wurden hierdurch wiederum auch andere Kompatibilitätsprobleme geschaffen. Er ist immer noch ein sieben-bit Code und weil keine anderen Codes erhältlich waren, wurden einige Codes in immer neuen Varianten verwendet. So ist etwa der ASCII Code 93 für die rechte eckige Klammer (]) in der deutschen Zeichensatz-Variante ISO 646-DE für den Großbuchstaben U als Umlaut (Ü) und in der dänischen Varianten ISO 646-DK für den Grossbuchstaben A mit oben angebrachtem Kreis (Å) vorgesehen.

Spätere Standards wie ISO 8859 und insbesondere auf Unicode basierende wie ISO 10646 rufen wohl weniger derartige Probleme hervor, so dass diese sieben-bit Varianten auch nicht mehr verwendet werden müssen. Unicode verwendet bis zu 32-bit pro Zeichen, sodass praktisch keine Konflikte auftreten sollen und fast alle von Menschen verwendeten alphabetischen Schriftzeichen vereinbart werden können.

ASCII enthält fast keine Vereinbarungen oder Zeichen, die in irgendeiner Weise zur Textformatierung oder zur Textstrukturierung verwendet werden (es gibt jedoch besagte Steuerzeichen, die auch zur Textformatierung verwendet werden, darunter Linefeed, Carriage Return, horizontaler Tabulator, Form Feed, vertikaler Tabulator). Dazu werden andere Kodierformen verwendet: etwa Markup. Kodierung ist allgemein die Kunst des Angebens von Zeichen durch ein andere und zur offenen Kommunkation verwendet wird (?). In der Kryptographie werden Codes und komplexere Beziehungen zwischen Zeichen verwendet, um solche Information nur bestimmten Empfängern zugänglich zu machen.

Siehe auch

Erweiterter ASCII, Unicode
Wikipedia Sonderzeichen
Code, Kryptographie

Kompatible Kodierungen: