Byte

Vorlage:Infobox Einheit

Das Byte [baɪt] ist ein Mengenbegriff in der Digitaltechnik und der Informatik, der für eine Zusammenstellung von mehreren (heute fast immer 8) Bit steht. Um ausdrücklich auf eine Anzahl von 8 Bit hinzuweisen, wird auch die Bezeichnung Oktett verwendet.

Definitionen

Was genau ein Byte bezeichnet, wird je nach Anwendungsgebiet etwas unterschiedlich definiert. Der Begriff kann stehen für:

eine Maßeinheit für eine Datenmenge von 8 Bit mit dem Einheitenzeichen „B“^[1], wobei es nicht auf die Ordnung der einzelnen Bit ankommt.
eine geordnete Zusammenstellung (n-Tupel) von 8 Bit, deren formale ISO-konforme Bezeichnung Oktett ist (1 Byte = 8 Bit). Ein Oktett wird manchmal in zwei Hälften zu je 4 Bit (Nibble) zerlegt, wobei jedes Nibble durch eine hexadezimale Ziffer (0–9, A–F) darstellbar ist. Ein Oktett kann also durch zwei Hexadezimalziffern dargestellt werden.
die kleinste adressierbare Datenmenge eines bestimmten technischen Systems, z.B.:
- bei Telex: 1 Zeichen = 5 Bit
- bei Sixbit: 1 Zeichen = 6 Bit
- bei ASCII: 1 Zeichen = 7 Bit
- bei IBM-PC: 1 Zeichen = 8 Bit = 1 Byte = 1 Oktett
- bei Nixdorf 820 12 Bit
- bei Rechnersystemen der Typen UNIVAC 1100/2200 und OS2200 Series: 1 Zeichen = 9 Bit = 1 Byte
- bei Radix-50: 1 Zeichen = $\log _{2}(50_{8}){\text{Bit}}=\log _{2}(40_{10}){\text{Bit}}\approx 5,32{\text{Bit}}$
einen Datentyp in Programmiersprachen. Die Anzahl Bit pro Byte kann je nach Programmiersprache und Plattform variieren (meistens 8 Bit).
ANSI-C99 definiert 1 Byte als eine zusammenhängende Folge von mindestens 8 Bit.^[2]

Bei den meisten heutigen Rechnern fallen alle diese Definitionen in eine zusammen.

Der Begriff Byte wird aufgrund der großen Verbreitung von Systemen, die auf acht Bit (beziehungsweise Zweierpotenzvielfache davon) basieren, für die Bezeichnung einer acht Bit breiten Größe verwendet, die in formaler Sprache (entsprechend ISO-Normen) aber korrekt Oktett (engl.: octet) heißt. Als Maßeinheit bei Größenangaben wird in der deutschen Sprache der Begriff Byte (im Sinne von 8 Bit) verwendet. Bei der Übertragung kann ein Byte parallel (alle Bit gleichzeitig) oder seriell (alle Bit nacheinander) übertragen werden. Zur Sicherung der Richtigkeit werden oft Prüfbits angefügt. Bei der Übertragung größerer Mengen sind weitere Übertragungsprotokolle möglich. So werden bei 32-Bit-Rechnern oft 32 Bit (vier Byte) gemeinsam in einem Schritt übertragen, auch wenn nur ein 8-Bit-Tupel übertragen werden muss. Das ermöglicht eine Vereinfachung der zur Berechnung erforderlichen Algorithmen und einen kleineren Befehlssatz des Computers.

Geschichte des Begriffs

Bit ist ein Kofferwort aus Binary und digit, heißt also zweiwertige Ziffer – Null oder Eins. Dessen Bestandteile lassen sich auf die lateinischen Wörter digitus (Finger), den bzw. die man seit der Antike zum Zählen verwendet (vgl. Plautus: „computare digitis“) und lat. (genauer neulat.) binarius (zweifach), vgl. lat. bis (zweimal), zurückführen.

Das Wort Byte ist künstlich und stammt von englisch bit (deutsch: bisschen) und bite (deutsch: Bissen). Verwendet wurde es, um eine Speichermenge oder Datenmenge zu kennzeichnen, die ausreicht, um ein Zeichen darzustellen. Der Begriff wurde 1956 von Werner Buchholz geprägt in einer frühen Designphase eines IBM-Computers.^[3] Im Original beschrieb er eine Breite von 6 Bit und stellte die kleinste direkt adressierbare Speichereinheit eines Computers dar. Die Schreibweise Bite wurde zu Byte geändert, um versehentliche Verwechslungen mit Bit zu vermeiden.

Zur Unterscheidung der ursprünglichen Bedeutung als kleinste adressierbare Informationseinheit und der Bedeutung als 8-Bit-Tupel wird in der Fachliteratur (abhängig vom Fachgebiet) korrekterweise auch der Begriff Oktett für letzteres benutzt, um eine klare Trennung zu erzielen.

Praktische Verwendung

In der elektronischen Datenverarbeitung nennt sich die kleinstmögliche Speichereinheit Bit. Ein Bit kann zwei mögliche Zustände annehmen, die meist als „Null“ und „Eins“ bezeichnet werden.

Acht solcher Bits werden zu einer Einheit – sozusagen einem Datenpäckchen – zusammengefasst und allgemein Byte genannt. Die offizielle ISO-konforme Bezeichnung lautet dagegen Oktett: 1 Oktett = 1 Byte = 8 Bit.

Das Byte ist die Standardeinheit, um Speicherkapazitäten oder Datenmengen zu bezeichnen. Dazu gehören Dateigrößen, die Kapazität von permanenten Speichermedien (Festplatten, CDs, DVDs, Blu-Ray Discs, Disketten, USB-Massenspeichergeräte usw.) und die Kapazität von vielen flüchtigen Speichern (z. B. Arbeitsspeicher). Übertragungsraten (z. B. die maximale Geschwindigkeit eines Internet-Anschlusses) gibt man dagegen üblicherweise auf der Basis von Bits an.

Präfixe für große Anzahlen von Bytes

SI-Präfixe zur Basis 10

Für Datenspeicher mit binärer Adressierung ergeben sich Speicherkapazitäten von 2ⁿ Byte, d. h. Zweierpotenzen. Da es bis 1996 keine speziellen Einheitenvorsätze für Zweierpotenzen gab, hat es sich verbreitet, die SI-Präfixe im Zusammenhang mit Speicherkapazitäten zur Bezeichnung von Zweierpotenzen zu verwenden (mit Faktor 2¹⁰ = 1024 statt 1000), z. B.:

1 Kilobyte (kB) = 1024 Byte, 1 Megabyte (MB) = 1024 Kilobyte = 1024 · 1024 Byte = 1.048.576 Byte usw.

Diese binäre Verwendung der SI-Präfixe wurde 1986 von der IEEE auch in einem Glossar dokumentiert.^[4]

Vereinzelt kommen auch Mischformen vor, z. B. bei der Speicherkapazität einer 3,5″-Diskette: 1,44 MB = 1440 kB = 1440 × 1024 Byte.

IEC-Präfixe zur Basis 2

Um Mehrdeutigkeiten zu vermeiden, schlug die IEC 1996 neue Einheitenvorsätze vor, die nur in der binären Bedeutung verwendet werden sollten.^[5]

Beispiele für die Anwendung dieser Binärpräfixe sind:

1 Kibibyte (KiB) = 1024 Byte, 1 Mebibyte (MiB) = 1024 · 1024 Byte.

Außerdem wurde empfohlen, die SI-Präfixe nur noch in der dezimalen Bedeutung zu benutzen, damit sich sowohl für Zweierpotenzen als auch für Zehnerpotenzen eindeutige Bezeichnungen ergeben, z. B.:

1 Kilobyte (kB) = 1000 Byte, 1 Megabyte (MB) = 1.000.000 Byte.

Viele Standardisierungsorganisationen schlossen sich dieser Empfehlung an. Darunter sind zu nennen das BIPM (1998), die IEEE (2002) und speziell in Deutschland die Physikalisch-Technische Bundesanstalt (2007)^[6].

Das für die SI-Präfixe zuständige Internationale Büro für Maß und Gewicht (BIPM) rät von der binären Verwendung der SI-Präfixe ausdrücklich ab und empfiehlt für die Bezeichnung von Zweierpotenzen die Binärpräfixe gemäß IEC 60027–2.^[7]

Größenunterschiede zwischen Dezimalpräfix und Binärpräfix

Eine Übersicht über die möglichen Einheitenvorsätze und deren Bedeutungen bietet die folgende Tabelle:

Name (Symbol)	Bedeutung analog zu SI-Präfixen^{[G 1]}	Unterschied	IEC-Name (IEC-Symbol)	Tradierte Bedeutungsauffassung
Dezimalpräfixe			Binärpräfixe
Kilobyte (kB)^{[G 2]}	10³ Byte = 1.000 Byte	2,4 %	Kibibyte (KiB)^{[G 3]}	2¹⁰ Byte = 1.024 Byte
Megabyte (MB)	10⁶ Byte = 1.000.000 Byte	4,9 %	Mebibyte (MiB)	2²⁰ Byte = 1.048.576 Byte
Gigabyte (GB)	10⁹ Byte = 1.000.000.000 Byte	7,4 %	Gibibyte (GiB)	2³⁰ Byte = 1.073.741.824 Byte
Terabyte (TB)	10¹² Byte = 1.000.000.000.000 Byte	10,0 %	Tebibyte (TiB)	2⁴⁰ Byte = 1.099.511.627.776 Byte
Petabyte (PB)	10¹⁵ Byte = 1.000.000.000.000.000 Byte	12,6 %	Pebibyte (PiB)	2⁵⁰ Byte = 1.125.899.906.842.624 Byte
Exabyte (EB)	10¹⁸ Byte = 1.000.000.000.000.000.000 Byte	15,3 %	Exbibyte (EiB)	2⁶⁰ Byte = 1.152.921.504.606.846.976 Byte
Zettabyte (ZB)	10²¹ Byte = 1.000.000.000.000.000.000.000 Byte	18,1 %	Zebibyte (ZiB)	2⁷⁰ Byte = 1.180.591.620.717.411.303.424 Byte
Yottabyte (YB)	10²⁴ Byte = 1.000.000.000.000.000.000.000.000 Byte	20,9 %	Yobibyte (YiB)	2⁸⁰ Byte = 1.208.925.819.614.629.174.706.176 Byte
↑ SI-Präfixe sind nur für SI-Einheiten standardisiert; Byte ist keine SI-Einheit. ↑ wird gelegentlich inkorrekt mit „KB“ abgekürzt. ↑ wird häufig inkorrekt mit „KB“ abgekürzt.

Für höherwertige Präfixe wird die Unterscheidung von Dezimal- und Binärpräfixen zunehmend wichtiger, da der nominelle Unterschied immer größer wird. So beträgt der Unterschied zwischen kB und KiB nur 2,4 %, der von TB und TiB hingegen bereits 10 %.

Kapazitätsangaben bei Speichermedien

Die Hersteller von Massenspeichermedien, wie Festplatten, DVD-Rohlingen und USB-Speicher-Sticks, verwenden die Dezimal-Präfixe wie es bei internationalen Maßeinheiten üblich ist, um die Speicherkapazität ihrer Produkte anzugeben. Daraus ergibt sich beispielsweise das Problem, dass ein mit „4,7 GB“ gekennzeichneter DVD-Rohling von Software, welche die Dezimalpräfixe zur Bezeichnung von Zweierpotenzen verwendet (wie z. B. der Windows Explorer), mit dem formal unterschiedlichen Wert von „4,38 GB“ angezeigt wird, obwohl in beiden Fällen rund 4,7 Gigabyte (4.700.000.000 Byte) gemeint sind. Ebenso wird in solchen Fällen eine mit „1 TB“ spezifizierte Festplatte mit der scheinbar deutlich kleineren Kapazität von etwa „931 GB“ oder „0,9 TB“ erkannt, obwohl in allen drei Fällen jeweils rund 1,0 Terabyte (1.000.000.000.000 Bytes) gemeint sind.

Apples Mac OS X ab Version 10.6 ist das einzige Betriebssystem, das mit Dezimalpräfixen rechnet.^[8]

Siehe auch

Weblinks

Wiktionary: Byte – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Prefixes for binary multiples (englisch)
„Byte.“ From MathWorld (englisch)
Maßeinheiten – Warum Festplatten plötzlich schrumpfen in der Reihe „Technikärgernis“ auf Spiegel Online
UnitJuggler Konvertieren zwischen den verschiedenen Bytegrössen

Quellen

↑ IEC 60027-2, Ed. 3.0, (2005–08): Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics.
↑ Rationale for International Standard— Programming Languages— C. April 2003, S. 217, abgerufen am 28. November 2009.
↑ Byte definition (englisch)
↑ ANSI/IEEE Std 1084-1986 IEEE Standard Glossary of Mathematics of Computing Terminology, 30. Oktober 1986. Zitat: kilo (K). (1) A prefix indicating 1000. (2) In statements involving size of computer storage, a prefix indicating 2¹⁰, or 1024. mega (M). (1) A prefix indicating one million. (2) In statements involving size of computer storage, a prefix indicating 2²⁰, or 1,048,576.
↑ Vgl. internationale Norm IEC 60027-2: 2005, 3. Auflage, Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics veröffentlicht.
↑ Physikalisch-Technische Bundesanstalt: PTB-Mitteilungen 117 (2007), Heft 2, S. 22. „Das Internationale Einheitensystem”
↑ BIPM – SI-Broschüre, 8. Auflage, März 2006, Abschnitt 3.1: SI-Präfixe. Randnotiz. Siehe auch: BIPM – SI prefixes
↑ Eric Schäfer: Dateigrößen: Snow Leopard zählt anders, Mac Life, 28. August 2009

[8] SI-Präfixe sind nur für SI-Einheiten standardisiert; Byte ist keine SI-Einheit.

[9] wird gelegentlich inkorrekt mit „KB“ abgekürzt.

[10] wird häufig inkorrekt mit „KB“ abgekürzt.

[1] IEC 60027-2, Ed. 3.0, (2005–08): Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics.

[2] Rationale for International Standard— Programming Languages— C. April 2003, S. 217, abgerufen am 28. November 2009.

[3] Byte definition (englisch)

[IEEE1084-4] ANSI/IEEE Std 1084-1986 IEEE Standard Glossary of Mathematics of Computing Terminology, 30. Oktober 1986. Zitat: kilo (K). (1) A prefix indicating 1000. (2) In statements involving size of computer storage, a prefix indicating 2¹⁰, or 1024. mega (M). (1) A prefix indicating one million. (2) In statements involving size of computer storage, a prefix indicating 2²⁰, or 1,048,576.

[5] Vgl. internationale Norm IEC 60027-2: 2005, 3. Auflage, Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics veröffentlicht.

[6] Physikalisch-Technische Bundesanstalt: PTB-Mitteilungen 117 (2007), Heft 2, S. 22. „Das Internationale Einheitensystem”

[7] BIPM – SI-Broschüre, 8. Auflage, März 2006, Abschnitt 3.1: SI-Präfixe. Randnotiz. Siehe auch: BIPM – SI prefixes

[11] Eric Schäfer: Dateigrößen: Snow Leopard zählt anders, Mac Life, 28. August 2009

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[G 1]

[G 2]

[G 3]

[8]