Byte
Das Byte [Maßeinheit in der Digitaltechnik und Informatik. Ein Byte entspricht in der modernen IT heute (fast immer) acht Bit. Um ausdrücklich auf eine Anzahl von 8 Bit hinzuweisen, wird auch der Begriff Oktett verwendet.
] ist eineDefinitionen
Was genau ein Byte bezeichnet, wird je nach Anwendungsgebiet etwas unterschiedlich definiert. Der Begriff kann stehen für:
- eine Maßeinheit für eine Datenmenge von 8 Bit mit dem Einheitenzeichen „B“, [1] wobei es nicht auf die Ordnung der einzelnen Bits ankommt.
- eine geordnete Zusammenstellung (n-Tupel) von 8 Bit, deren formale ISO-konforme Bezeichnung Oktett ist (1 Byte = 8 Bit). Ein Oktett wird manchmal in zwei Hälften zu je 4 Bit (Nibble) zerlegt, wobei jedes Nibble durch eine hexadezimale Ziffer (0-9, A-F) darstellbar ist. Ein Oktett kann also durch zwei Hexadezimalziffern dargestellt werden.
- eine adressierbare Speichereinheit, die groß genug ist, um ein beliebiges Zeichen aus dem Basis-Zeichensatz aufzunehmen.
- bei Telex: 1 Zeichen = 5 Bits = 1 Byte
- bei ASCII: 1 Zeichen = 7 Bits = 1 Byte
- bei IBM-PC: 1 Zeichen = 8 Bits = 1 Byte
- bei Rechnersystemen der Typen Unisys UNIVAC 1100/2200 und OS2200 Series: 1 Zeichen = 9 Bits = 1 Byte
- einen Datentyp in Programmiersprachen. Die Anzahl Bits pro Byte kann je nach Programmiersprache und Plattform variieren (meistens 8 Bits).
Bei den meisten heutigen Rechnern fallen alle diese Definitionen in eins zusammen.
Der Begriff Byte wird auf Grund der großen Verbreitung von Systemen, die auf acht Bit (beziehungsweise Zweierpotenzvielfache davon) basieren, für die Bezeichnung einer acht Bit breiten Größe verwendet, die in formaler Sprache (entsprechend ISO-Normen) aber korrekt Oktett (engl. octet) heißt. Als Maßeinheit bei Größenangaben wird in der deutschen Sprache der Begriff Byte (im Sinne von 8 Bit) verwendet. Bei der Übertragung kann ein Byte parallel (alle Bits gleichzeitig) oder seriell (alle Bits nacheinander) übertragen werden. Zur Sicherung der Richtigkeit werden oft Prüfbits angefügt. Bei der Übertragung größerer Mengen sind weitere Übertragungsprotokolle möglich. So werden bei 32-Bit-Rechnern oft 32 Bit (vier Byte) gemeinsam in einem Schritt übertragen, auch wenn nur ein 8-Bit-Tupel übertragen werden muss. Das ermöglicht eine Vereinfachung der zur Berechnung erforderlichen Algorithmen und einen kleineren Befehlssatz des Computers.
Praktische Verwendung
In der elektronischen Datenverarbeitung nennt sich die kleinstmögliche Speichereinheit Bit. Ein Bit kann zwei mögliche Zustände annehmen, die meist als „Null“ und „Eins“ bezeichnet werden.
Acht solcher Bits werden zu einer Einheit – sozusagen einem Datenpäckchen – zusammengefasst und allgemein Byte genannt. Die offizielle ISO-konforme Bezeichnung lautet dagegen Oktett: 1 Oktett = 1 Byte = 8 Bit.
Das Byte ist die Standardeinheit, um Speicherkapazitäten oder Datenmengen zu bezeichnen. Dazu gehören Dateigrößen, die Kapazität von permanenten Speichermedien (Festplatten, CDs, DVDs, Disketten, USB-Massenspeichergeräte usw.) und die Kapazität von vielen flüchtigen Speichern (z. B. Arbeitsspeicher (RAM)). Übertragungsraten (z. B. die maximale Geschwindigkeit eines Internet-Anschlusses) gibt man dagegen üblicherweise auf der Basis von Bits an.
Einheiten für große Mengen Bytes
Das Byte ist eine relativ kleine Einheit. Ein Byte entspricht in vielen Fällen dem zum Speichern eines einzelnen Buchstabens nötigen Platz. Die Kapazität moderner Speichermedien liegt im Bereich einiger Milliarden Bytes. Deshalb werden größere Datenmengen üblicherweise zu übergeordneten Einheiten zusammengefasst, indem man der Grundeinheit Byte Einheitenvorsätze voranstellt. Eingebürgert haben sich dafür die Namen der SI-Präfixe (besonders Kilo, Mega, Giga), da die Binärpräfixe erst viel später eingeführt wurden. Man spricht dann von Kilobyte, Megabyte oder Gigabyte. Bezeichnungen wie Kilo-Oktett und Mega-Oktett sind im Deutschen ungebräuchlich, finden sich aber z. B. im Französischen. Eine Übersicht über die möglichen Einheitenvorsätze und deren Bedeutungen bietet die folgende Tabelle.
SI-Präfixe | Binärpräfixe | |||||
---|---|---|---|---|---|---|
Name (Symbol) |
SI- konforme Bedeutung |
häufig gemeinte Bedeutung |
% Unterschied |
Name (Symbol) |
Bedeutung | |
Kilobyte (kB) | 103 Byte | 210 Byte | 2,4 % | Kibibyte (KiB)1) | 210 Byte | |
Megabyte (MB) | 106 Byte | 220 Byte | 4,9 % | Mebibyte (MiB) | 220 Byte | |
Gigabyte (GB) | 109 Byte | 230 Byte | 7,4 % | Gibibyte (GiB) | 230 Byte | |
Terabyte (TB) | 1012 Byte | 240 Byte | 10,0 % | Tebibyte (TiB) | 240 Byte | |
Petabyte (PB) | 1015 Byte | 250 Byte | 12,6 % | Pebibyte (PiB) | 250 Byte | |
Exabyte (EB) | 1018 Byte | 260 Byte | 15,3 % | Exbibyte (EiB) | 260 Byte | |
Zettabyte (ZB) | 1021 Byte | 270 Byte | 18,1 % | Zebibyte (ZiB) | 270 Byte | |
Yottabyte (YB) | 1024 Byte | 280 Byte | 20,9 % | Yobibyte (YiB) | 280 Byte |
1) wird häufig auch mit KB abgekürzt.
Die SI-Präfixe werden häufig in einer von der SI-Definition abweichenden Bedeutung verwendet, nämlich in der Bedeutung der Binärpräfixe als Zweierpotenz.
- SI-konform: 1 Kilo = 1.000 Einheiten, 1 Mega = 1.000.000 Einheiten, 1 Giga = 1.000.000.000 Einheiten, usw.
- Häufige Verwendung für Bytes: 1 Kilo = 1.024 Einheiten, 1 Mega = 1.048.576 Einheiten, 1 Giga = 1.073.741.824 Einheiten, usw.
Zu dieser abweichenden Verwendung kam es dadurch, dass aus technischen Gründen Halbleiterspeicher üblicherweise in Größen von Zweierpotenzen hergestellt werden, die Binärpräfixe jedoch erst relativ spät eingeführt wurden und daher die SI-Präfixe mangels Alternative in etwas ungenauer Weise für Zweierpotenzvielfache von Byte verwendet wurden. Für 1024 Byte wird auch die Schreibweise „1 KB = 1024 Byte“ (gesprochen: "kah-bait" oder kurz "kah") zur Unterscheidung von „1 kB = 1000 Byte“ verwendet; diese Darstellung ist aber nicht standardisiert. Für höherwertige Präfixe ist diese Differenzierung jedoch nicht möglich, außerdem wird der Unterschied zwischen dezimalen und binären Präfixen immer größer; beispielsweise beträgt der Unterschied zwischen TB und TiB bereits 10 %. Das für die SI-Präfixe zuständige Internationale Büro für Maß und Gewicht (BIPM) rät von dieser nicht standardkonformen Verwendung der SI-Präfixe ausdrücklich ab und empfiehlt für die Bezeichnung von Zweierpotenzen die Binärpräfixe gemäß IEC 60027-2.[2] Trotzdem werden die SI-Präfixe besonders im nichtwissenschaftlichen Bereich häufig weiterhin in der Bedeutung der Binärpräfixe verwendet.
Jedoch verwenden die Hersteller von Festplatten und DVD-Rohlingen die SI-Präfixe standardkonform, um die Kapazität ihrer Produkte anzugeben. Daraus ergibt sich beispielsweise das Problem, dass ein mit „4,7 GB“ gekennzeichneter DVD-Rohling vom Betriebssystem mit dem formal unterschiedlichen Wert von „4,38 GB“ oder eine mit „500 GB“ spezifizierte Festplatte mit dem scheinbar deutlich kleineren Wert von „466 GB“ erkannt wird (vom Speicherplatz für das Dateisystem abgesehen). Auch zur Angabe von Datenübertragungsraten werden die SI-Präfixe üblicherweise standardkonform verwendet, da auch dort die Zweierpotenzen keine besondere Bedeutung haben.
Geschichte des Begriffs Byte
Das Wort Byte ist künstlich und stammt von englisch bit (deutsch: bisschen) und bite (deutsch: Happen). Verwendet wurde es, um eine Speichermenge oder Datenmenge zu kennzeichnen, die ausreicht, um ein Zeichen darzustellen. Der Begriff wurde 1956 von Werner Buchholz geprägt in einer frühen Designphase eines IBM-Computers.[3] Im Original beschrieb er eine Breite von 6 Bit und stellte die kleinste direkt adressierbare Speichereinheit eines Computers dar. Die Schreibweise Bite wurde zu Byte geändert, um versehentliche Verwechslungen mit Bit zu vermeiden.
Byte wird als Abkürzung gedeutet für:
- Binary tuple
- Binary term
- Bit asynchronous transmission entity
- Binary yoked transfer element
- Binary digits unite
Bit ist die Abkürzung für Binary digit, d. h. „zweiwertige Ziffer“ – Null oder Eins (von lat. „digitus“ (Finger), den bzw. die man seit der Antike zum Zählen verwendet (vgl. Plautus: „computare digitis“) und lat. (neulat.) „binarius“ (zweifach), vgl. lat. „bis“ (zweimal)).
Eine weitere Erklärung des Begriffes liegt in der Kurzform „by eight“, übersetzt „mal acht“.
Zur Unterscheidung der ursprünglichen Bedeutung als kleinste adressierbare Einheit und der Bedeutung als 8-Bit-Tupel wird in der Fachliteratur (abhängig vom Fachgebiet) korrekterweise auch der Begriff Oktett für letzteres benutzt, um eine klare Trennung zu erzielen.
Weitere Bedeutung
Byte (Byte Magazin) war auch der Titel einer US-amerikanischen Computerzeitschrift.
Siehe auch
Weblinks
Quellen
- ↑ IEC 60027-2, Ed. 3.0, (2005-08): Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics.
- ↑ BIPM – SI-Broschüre, 8. Auflage, März 2006, Abschnitt 3.1: SI-Präfixe. Randnotiz. [1]
- ↑ Byte definition (englisch)