Byte

Das Byte [baɪt] ist eine Maßeinheit in der Digitaltechnik und Informatik. Ein Byte entspricht in der modernen IT heute (fast immer) acht Bit. Um ausdrücklich auf eine Anzahl von 8 Bit hinzuweisen, wird auch der Begriff Oktett verwendet.

Definitionen

Was genau ein Byte bezeichnet, wird je nach Anwendungsgebiet etwas unterschiedlich definiert. Der Begriff kann stehen für:

eine Maßeinheit für eine Datenmenge von 8 Bit mit dem Einheitenzeichen „B“, ^[1] wobei es nicht auf die Ordnung der einzelnen Bits ankommt.
eine geordnete Zusammenstellung (n-Tupel) von 8 Bit, deren formale ISO-konforme Bezeichnung Oktett ist (1 Byte = 8 Bit). Ein Oktett wird manchmal in zwei Hälften zu je 4 Bit (Nibble) zerlegt, wobei jedes Nibble durch eine hexadezimale Ziffer (0-9, A-F) darstellbar ist. Ein Oktett kann also durch zwei Hexadezimalziffern dargestellt werden.
eine adressierbare Speichereinheit, die groß genug ist, um ein beliebiges Zeichen aus dem Basis-Zeichensatz aufzunehmen.
- bei Telex: 1 Zeichen = 5 Bits = 1 Byte
- bei ASCII: 1 Zeichen = 7 Bits = 1 Byte
- bei IBM-PC: 1 Zeichen = 8 Bits = 1 Byte
- bei Rechnersystemen der Typen Unisys UNIVAC 1100/2200 und OS2200 Series: 1 Zeichen = 9 Bits = 1 Byte
einen Datentyp in Programmiersprachen. Die Anzahl Bits pro Byte kann je nach Programmiersprache und Plattform variieren (meistens 8 Bits).

Bei den meisten heutigen Rechnern fallen alle diese Definitionen in eins zusammen.

Der Begriff Byte wird auf Grund der großen Verbreitung von Systemen, die auf acht Bit (beziehungsweise Zweierpotenzvielfache davon) basieren, für die Bezeichnung einer acht Bit breiten Größe verwendet, die in formaler Sprache (entsprechend ISO-Normen) aber korrekt Oktett (engl. octet) heißt. Als Maßeinheit bei Größenangaben wird in der deutschen Sprache der Begriff Byte (im Sinne von 8 Bit) verwendet. Bei der Übertragung kann ein Byte parallel (alle Bits gleichzeitig) oder seriell (alle Bits nacheinander) übertragen werden. Zur Sicherung der Richtigkeit werden oft Prüfbits angefügt. Bei der Übertragung größerer Mengen sind weitere Übertragungsprotokolle möglich. So werden bei 32-Bit-Rechnern oft 32 Bit (vier Byte) gemeinsam in einem Schritt übertragen, auch wenn nur ein 8-Bit-Tupel übertragen werden muss. Das ermöglicht eine Vereinfachung der zur Berechnung erforderlichen Algorithmen und einen kleineren Befehlssatz des Computers.

Praktische Verwendung

In der elektronischen Datenverarbeitung nennt sich die kleinstmögliche Speichereinheit Bit. Ein Bit kann zwei mögliche Zustände annehmen, die meist als „Null“ und „Eins“ bezeichnet werden.

Acht solcher Bits werden zu einer Einheit – sozusagen einem Datenpäckchen – zusammengefasst und allgemein Byte genannt. Die offizielle ISO-konforme Bezeichnung lautet dagegen Oktett: 1 Oktett = 1 Byte = 8 Bit.

Das Byte ist die Standardeinheit, um Speicherkapazitäten oder Datenmengen zu bezeichnen. Dazu gehören Dateigrößen, die Kapazität von permanenten Speichermedien (Festplatten, CDs, DVDs, Disketten, USB-Massenspeichergeräte usw.) und die Kapazität von vielen flüchtigen Speichern (z. B. Arbeitsspeicher (RAM)). Übertragungsraten (z. B. die maximale Geschwindigkeit eines Internet-Anschlusses) gibt man dagegen üblicherweise auf der Basis von Bits an.

Einheiten für große Mengen Bytes

Das Byte ist eine relativ kleine Einheit. Ein Byte entspricht in vielen Fällen dem zum Speichern eines einzelnen Buchstabens nötigen Platz. Die Kapazität moderner Speichermedien liegt im Bereich einiger Milliarden Bytes. Deshalb werden größere Datenmengen üblicherweise zu übergeordneten Einheiten zusammengefasst, indem man der Grundeinheit Byte Einheitenvorsätze voranstellt. Eingebürgert haben sich dafür die Namen der SI-Präfixe (besonders Kilo, Mega, Giga), da die Binärpräfixe erst viel später eingeführt wurden. Man spricht dann von Kilobyte, Megabyte oder Gigabyte. Bezeichnungen wie Kilo-Oktett und Mega-Oktett sind im Deutschen ungebräuchlich, finden sich aber z. B. im Französischen. Eine Übersicht über die möglichen Einheitenvorsätze und deren Bedeutungen bietet die folgende Tabelle.

SI-Präfixe				Binärpräfixe
Name (Symbol)	SI- konforme Bedeutung	häufig gemeinte Bedeutung	% Unterschied	Name (Symbol)	Bedeutung
Kilobyte (kB)	10³ Byte	2¹⁰ Byte	2,4 %	Kibibyte (KiB)¹⁾	2¹⁰ Byte
Megabyte (MB)	10⁶ Byte	2²⁰ Byte	4,9 %	Mebibyte (MiB)	2²⁰ Byte
Gigabyte (GB)	10⁹ Byte	2³⁰ Byte	7,4 %	Gibibyte (GiB)	2³⁰ Byte
Terabyte (TB)	10¹² Byte	2⁴⁰ Byte	10,0 %	Tebibyte (TiB)	2⁴⁰ Byte
Petabyte (PB)	10¹⁵ Byte	2⁵⁰ Byte	12,6 %	Pebibyte (PiB)	2⁵⁰ Byte
Exabyte (EB)	10¹⁸ Byte	2⁶⁰ Byte	15,3 %	Exbibyte (EiB)	2⁶⁰ Byte
Zettabyte (ZB)	10²¹ Byte	2⁷⁰ Byte	18,1 %	Zebibyte (ZiB)	2⁷⁰ Byte
Yottabyte (YB)	10²⁴ Byte	2⁸⁰ Byte	20,9 %	Yobibyte (YiB)	2⁸⁰ Byte

¹⁾ wird häufig auch mit KB abgekürzt.

Die SI-Präfixe werden häufig in einer von der SI-Definition abweichenden Bedeutung verwendet, nämlich in der Bedeutung der Binärpräfixe als Zweierpotenz.

SI-konform: 1 Kilo = 1.000 Einheiten, 1 Mega = 1.000.000 Einheiten, 1 Giga = 1.000.000.000 Einheiten, usw.
Häufige Verwendung für Bytes: 1 Kilo = 1.024 Einheiten, 1 Mega = 1.048.576 Einheiten, 1 Giga = 1.073.741.824 Einheiten, usw.

Zu dieser abweichenden Verwendung kam es dadurch, dass aus technischen Gründen Halbleiterspeicher üblicherweise in Größen von Zweierpotenzen hergestellt werden, die Binärpräfixe jedoch erst relativ spät eingeführt wurden und daher die SI-Präfixe mangels Alternative in etwas ungenauer Weise für Zweierpotenzvielfache von Byte verwendet wurden. Für 1024 Byte wird auch die Schreibweise „1 KB = 1024 Byte“ (gesprochen: "kah-bait" oder kurz "kah") zur Unterscheidung von „1 kB = 1000 Byte“ verwendet; diese Darstellung ist aber nicht standardisiert. Für höherwertige Präfixe ist diese Differenzierung jedoch nicht möglich, außerdem wird der Unterschied zwischen dezimalen und binären Präfixen immer größer; beispielsweise beträgt der Unterschied zwischen TB und TiB bereits 10 %. Das für die SI-Präfixe zuständige Internationale Büro für Maß und Gewicht (BIPM) rät von dieser nicht standardkonformen Verwendung der SI-Präfixe ausdrücklich ab und empfiehlt für die Bezeichnung von Zweierpotenzen die Binärpräfixe gemäß IEC 60027-2.^[2] Trotzdem werden die SI-Präfixe besonders im nichtwissenschaftlichen Bereich häufig weiterhin in der Bedeutung der Binärpräfixe verwendet.

Jedoch verwenden die Hersteller von Festplatten und DVD-Rohlingen die SI-Präfixe standardkonform, um die Kapazität ihrer Produkte anzugeben. Daraus ergibt sich beispielsweise das Problem, dass ein mit „4,7 GB“ gekennzeichneter DVD-Rohling vom Betriebssystem mit dem formal unterschiedlichen Wert von „4,38 GB“ oder eine mit „500 GB“ spezifizierte Festplatte mit dem scheinbar deutlich kleineren Wert von „466 GB“ erkannt wird (vom Speicherplatz für das Dateisystem abgesehen). Auch zur Angabe von Datenübertragungsraten werden die SI-Präfixe üblicherweise standardkonform verwendet, da auch dort die Zweierpotenzen keine besondere Bedeutung haben.

Geschichte des Begriffs Byte

Das Wort Byte ist künstlich und stammt von englisch bit (deutsch: bisschen) und bite (deutsch: Happen). Verwendet wurde es, um eine Speichermenge oder Datenmenge zu kennzeichnen, die ausreicht, um ein Zeichen darzustellen. Der Begriff wurde 1956 von Werner Buchholz geprägt in einer frühen Designphase eines IBM-Computers.^[3] Im Original beschrieb er eine Breite von 6 Bit und stellte die kleinste direkt adressierbare Speichereinheit eines Computers dar. Die Schreibweise Bite wurde zu Byte geändert, um versehentliche Verwechslungen mit Bit zu vermeiden.

Byte wird als Abkürzung gedeutet für:

Binary tuple
Binary term
Bit asynchronous transmission entity
Binary yoked transfer element
Binary digits unite

Bit ist die Abkürzung für Binary digit, d. h. „zweiwertige Ziffer“ – Null oder Eins (von lat. „digitus“ (Finger), den bzw. die man seit der Antike zum Zählen verwendet (vgl. Plautus: „computare digitis“) und lat. (neulat.) „binarius“ (zweifach), vgl. lat. „bis“ (zweimal)).

Eine weitere Erklärung des Begriffes liegt in der Kurzform „by eight“, übersetzt „mal acht“.

Zur Unterscheidung der ursprünglichen Bedeutung als kleinste adressierbare Einheit und der Bedeutung als 8-Bit-Tupel wird in der Fachliteratur (abhängig vom Fachgebiet) korrekterweise auch der Begriff Oktett für letzteres benutzt, um eine klare Trennung zu erzielen.

Weitere Bedeutung

Byte (Byte Magazin) war auch der Titel einer US-amerikanischen Computerzeitschrift.

Siehe auch

Weblinks

Wiktionary: Byte – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Quellen

↑ IEC 60027-2, Ed. 3.0, (2005-08): Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics.
↑ BIPM – SI-Broschüre, 8. Auflage, März 2006, Abschnitt 3.1: SI-Präfixe. Randnotiz. [1]
↑ Byte definition (englisch)

[1] IEC 60027-2, Ed. 3.0, (2005-08): Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics.

[2] BIPM – SI-Broschüre, 8. Auflage, März 2006, Abschnitt 3.1: SI-Präfixe. Randnotiz. [1]

[3] Byte definition (englisch)

[1]

[2]

[3]