Zum Inhalt springen

„Bencode“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Bencode 0: steht für eine leere Zeichenkette, nicht für -234
grundlegend überarbeitet, enzyklopädischer Stil, gekürzt. Viel mehr Belege gibt es nicht, bitte Baustein nur mit Disk wiedereinfügen.
 
Zeile 1: Zeile 1:
{{Infobox Dateiformat
{{Belege fehlen}}
| Name = Metainfo
'''Bencode''' ist ein [[Datenformat]]. Es wird durch das [[Filesharing]]-[[Netzwerkprotokoll|Protokoll]] [[BitTorrent]] verwendet, um Daten zu speichern und auszutauschen.<ref>[http://www.bittorrent.org/beps/bep_0003.html The BitTorrent Protocol Specification]. BitTorrent.org. Abgerufen am 8. Oktober 2018.</ref>
| Dateiendung = .torrent
| Entwickler = [[Bram Cohen]], [[BitTorrent]]-Entwickler
| Veröffentlicht = 2001
| Art = Tracker-Information zum Abruf von Dateien über das BitTorrent-Netzwerk
| Standard = BEP 3
| Website = https://www.bittorrent.org/beps/bep_0003.html
}}


'''Bencode''' bzw. als [[Verb]] '''bencoding''' ist ein [[Datenaustauschformat]], welches für das [[Filesharing]]-[[Netzwerkprotokoll|Protokoll]] [[BitTorrent]] entwickelt wurde.<ref>{{Internetquelle |autor=Bram Cohen |url=https://www.bittorrent.org/beps/bep_0003.html |titel=The BitTorrent Protocol Specification |werk=BitTorrent.org |abruf=2025-06-13}}</ref> Es verwendet eine effiziente, [[ASCII]]-basierte Kodierung, kann aber Binärdaten enthalten. Insofern ist Bencode anders als Formate wie [[XML]], [[JSON]] oder [[YAML]] nicht grundsätzlich menschenlesbar. Das Format unterstützt vier [[Datentyp]]en: [[Ganze Zahl]]en, [[Zeichenkette]]n variabler Länge, Listen und [[Assoziatives Datenfeld|assoziative Listen]].<ref>{{Internetquelle |url=https://wiki.theory.org/index.php/BitTorrentSpecification |titel=BitTorrentSpecification - TheoryOrg |sprache=en |archiv-url=http://web.archive.org/web/20220926063641/https://wiki.theory.org/index.php/BitTorrentSpecification |archiv-datum=2022-09-26 |abruf=2025-06-13}}</ref>
Das Format unterstützt vier [[Datentyp]]en.<ref>[https://wiki.theory.org/index.php/BitTorrentSpecification#Bencoding The BitTorrent Specification v1.0: Bencoding]. Theory.org. Abgerufen am 9. Oktober 2018.</ref>
* [[Ganze Zahl]]en.
* [[Zeichenkette]]n variabler Länge.
* Listen.
* [[Assoziatives Datenfeld|Assoziative Listen]].


Bencode wird unter anderem in <code>.torrent</code>-Dateien verwendet. Der [[BitTorrent]]-Standard spezifiziert dazu, dass diese Dateien, in der Spezifikation auch MetaInfo-Dateien genannt, bencodete assoziative Listen sein sollen.
Bencode wird unter anderem in <code>.torrent</code>-Dateien (offiziell ''Metainfo''-Dateien) verwendet.


Bencode ist ein recht einfaches Format mit einer strikten Definition. Für jeden Datensatz gibt es nur eine gültige Darstellung in Bencode. Dies vereinfacht das [[Parser|Parsing]] und die Implementierung. Allerdings wird zum Bearbeiten ein spezialisierter Editor benötigt, da [[Texteditor]]en wegen enthaltener Binärdaten im Allgemeinen nicht zur Bearbeitung geeignet sind.
Da es ein relativ simpel gehaltener Algorithmus ist, kann Bencode sehr leicht implementiert und [[Parser|geparst]] werden. Außerdem ist es immun gegen einige Probleme, die binäre Formate oft betreffen. So ist zum Beispiel die [[Byte-Reihenfolge]] irrelevant.


== Encoding ==
== Format ==

Bencode nutzt [[ASCII]]-Buchstaben als Separatoren.


=== Zahlen ===
=== Zahlen ===


Zahlen werden als <code>i<zahl>e</code> codiert. Dabei ist <code><zahl></code> die ASCII-Version der Zahl, zur Basis 10. Negative Zahlen werden mit einem vorangestellten Minus-Symbol ausgegeben. Bencode unterstützt keine [[Festkommazahl|Festkomma-]] oder [[Gleitkommazahl]]en.
Zahlen werden als <code>i<zahl>e</code> codiert. Dabei ist <code><zahl></code> die dezimale ASCII-Darstellung der Zahl. Negative Zahlen werden wie üblich mit einem vorangestellten [[Bindestrich]] (ASCII-Zeichen 45) ausgegeben. Bencode unterstützt nur [[Ganze Zahl|ganze Zahlen]].


{| class="wikitable"
{| class="wikitable"
Zeile 33: Zeile 34:
=== Zeichenketten ===
=== Zeichenketten ===


Zeichenketten werden als <code><länge>:<inhalt></code> ausgegeben. Dabei ist <code><länge></code> die Länge, zur Basis 10, und <code><inhalt></code> die Zeichenkette an sich. Leere Zeichenketten werden mit der Länge Null ausgegeben.
Zeichenketten werden als <code><länge>:<inhalt></code> ausgegeben. Dabei ist <code><länge></code> die Länge, zur Basis 10, und <code><inhalt></code> die Zeichenkette an sich. Leere Zeichenketten werden mit der Länge Null ausgegeben. Zeichenketten haben keinen definierten [[Zeichensatztabelle|Zeichensatz]] und können auch binäre Daten enthalten. In Metainfo-Dateien sind alle Texte [[UTF-8]]-kodiert.


{| class="wikitable"
{| class="wikitable"
Zeile 46: Zeile 47:
=== Listen ===
=== Listen ===


Listen werden als <code>l<inhalt>e</code> ausgegeben. Dabei ist <code><inhalt></code> die aneinandergereihten, bencodeten Elemente der Liste, in der Reihenfolge, in der sie vorkommen sollen. Eine Liste kann, eine Mischung unterschiedlicher Datentypen beinhalten (z.&nbsp;B. eine Mischung aus Zahlen und Zeichenketten). Eine leere Liste wird als <code>le</code> ausgegeben (also ohne Inhalt).
Listen werden als <code>l<inhalt>e</code> ausgegeben. <code><inhalt></code> besteht aus den aneinandergereihten, bencodeten Elementen der Liste. Eine Liste kann eine Mischung unterschiedlicher Datentypen beinhalten (z.&nbsp;B. sowohl Zahlen als auch Zeichenketten). Eine leere Liste hat die Darstellung <code>le</code>.


{| class="wikitable"
{| class="wikitable"
|-
|-
! Inhalt !! Bencode
! Liste !! Bencode
|-
|-
| [] || <code>le</code>
| [] || <code>le</code>
Zeile 61: Zeile 62:
|}
|}


=== Dictionaries ===
=== Assoziative Listen ===


Assoziative Listen, auf Englisch (und in der Spezifikation) auch ''dictionaries'' genannt, werden, ähnlich wie normale Listen, in der Form <code>d<inhalt>e</code> ausgegeben. Dabei besteht der Inhalt aus aneinandergektetteten Paaren von zwei Elementen, einem ''Schlüssel'' und einem ''Wert''. Die Reihenfolge der Paare muss in [[Lexikographische Ordnung|lexikographischer Ordnung]] erfolgen. Ein leeres Dictionary wird als <code>de</code> ausgegeben.
[[Assoziative Liste|Assoziative Listen]] (''dictionaries'') werden, ähnlich wie normale Listen, in der Form <code>d<inhalt>e</code> ausgegeben. Dabei besteht der Inhalt aus aneinandergereihten Schlüssel-Wert-Paaren. Die Paare müssen in [[Lexikographische Ordnung|lexikographischer Ordnung]] aufgeführt sein, womit die Darstellung jeder assoziativen Liste eindeutig ist. Eine leere assoziative Liste wird als <code>de</code> ausgegeben.


{| class="wikitable"
{| class="wikitable"
|-
|-
! Inhalt !! Bencode
! Assoziative Liste !! Bencode
|-
|-
| {} || <code>de</code>
| {} || <code>de</code>
Zeile 73: Zeile 74:
| {Name => Thomas, Alter => 34} || <code>d5:Alteri34e4:Name6:Thomase</code>
| {Name => Thomas, Alter => 34} || <code>d5:Alteri34e4:Name6:Thomase</code>
|}
|}

== Weblinks ==

* [https://www.bittorrent.org/beps/bep_0003.html Spezifikation von Bencode als Teil der BitTorrent-Spezifikation] (Abschnitt „bencoding“)
* [https://torrent-file-editor.github.io/ Torrent File Editor], ein Open-Source-Bearbeitungsprogramm für Bencode-Daten


== Einzelnachweise ==
== Einzelnachweise ==
Zeile 78: Zeile 84:


[[Kategorie:Datenserialisierungformat]]
[[Kategorie:Datenserialisierungformat]]
[[Kategorie:BitTorrent]]

Aktuelle Version vom 13. Juni 2025, 13:18 Uhr

Metainfo
Dateiendung: .torrent
Entwickelt von: Bram Cohen, BitTorrent-Entwickler
Erstveröffentlichung: 2001
Art: Tracker-Information zum Abruf von Dateien über das BitTorrent-Netzwerk
Standard(s): BEP 3
https://www.bittorrent.org/beps/bep_0003.html

Bencode bzw. als Verb bencoding ist ein Datenaustauschformat, welches für das Filesharing-Protokoll BitTorrent entwickelt wurde.[1] Es verwendet eine effiziente, ASCII-basierte Kodierung, kann aber Binärdaten enthalten. Insofern ist Bencode anders als Formate wie XML, JSON oder YAML nicht grundsätzlich menschenlesbar. Das Format unterstützt vier Datentypen: Ganze Zahlen, Zeichenketten variabler Länge, Listen und assoziative Listen.[2]

Bencode wird unter anderem in .torrent-Dateien (offiziell Metainfo-Dateien) verwendet.

Bencode ist ein recht einfaches Format mit einer strikten Definition. Für jeden Datensatz gibt es nur eine gültige Darstellung in Bencode. Dies vereinfacht das Parsing und die Implementierung. Allerdings wird zum Bearbeiten ein spezialisierter Editor benötigt, da Texteditoren wegen enthaltener Binärdaten im Allgemeinen nicht zur Bearbeitung geeignet sind.

Zahlen werden als i<zahl>e codiert. Dabei ist <zahl> die dezimale ASCII-Darstellung der Zahl. Negative Zahlen werden wie üblich mit einem vorangestellten Bindestrich (ASCII-Zeichen 45) ausgegeben. Bencode unterstützt nur ganze Zahlen.

Zahl Bencode
−234 i-234e
0 i0e
29410 i29410e

Zeichenketten werden als <länge>:<inhalt> ausgegeben. Dabei ist <länge> die Länge, zur Basis 10, und <inhalt> die Zeichenkette an sich. Leere Zeichenketten werden mit der Länge Null ausgegeben. Zeichenketten haben keinen definierten Zeichensatz und können auch binäre Daten enthalten. In Metainfo-Dateien sind alle Texte UTF-8-kodiert.

Zeichenkette Bencode
(leere Zeichenkette) 0:
Hallo Welt 10:Hallo Welt

Listen werden als l<inhalt>e ausgegeben. <inhalt> besteht aus den aneinandergereihten, bencodeten Elementen der Liste. Eine Liste kann eine Mischung unterschiedlicher Datentypen beinhalten (z. B. sowohl Zahlen als auch Zeichenketten). Eine leere Liste hat die Darstellung le.

Liste Bencode
[] le
[595] li595ee
[Hallo] l5:Halloe
[-343, Hallo, 555, [], [5]] li-343e5:Halloi555eleli5eee

Assoziative Listen

[Bearbeiten | Quelltext bearbeiten]

Assoziative Listen (dictionaries) werden, ähnlich wie normale Listen, in der Form d<inhalt>e ausgegeben. Dabei besteht der Inhalt aus aneinandergereihten Schlüssel-Wert-Paaren. Die Paare müssen in lexikographischer Ordnung aufgeführt sein, womit die Darstellung jeder assoziativen Liste eindeutig ist. Eine leere assoziative Liste wird als de ausgegeben.

Assoziative Liste Bencode
{} de
{Name => Thomas, Alter => 34} d5:Alteri34e4:Name6:Thomase

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Bram Cohen: The BitTorrent Protocol Specification. In: BitTorrent.org. Abgerufen am 13. Juni 2025.
  2. BitTorrentSpecification - TheoryOrg. Archiviert vom Original am 26. September 2022; abgerufen am 13. Juni 2025 (englisch).