Hamming-Abstand

Der Hamming-Abstand, die Hamming-Distanz oder das Hamming-Gewicht ist ein Maß für die Unterschiedlichkeit digitaler Daten und so ein grundlegender Begriff der Codierungstheorie, benannt nach dem Mathematiker Richard Wesley Hamming (1915–1998).

Der Hamming-Abstand zweier Blöcke von binären Daten mit fester Länge (so genannter Codewörter) kann ermittelt werden, indem man beide in binärer Form schreibt, diese Bit für Bit vergleicht und die Stellen zählt, die ungleich sind. Rechnerisch lässt sich der Vergleich durch eine XOR-Operation und das Abzählen der resultierenden Einsen realisieren.

Beispiel

x = 00110

y = 00101

Der Hamming-Abstand ist hier 2, da sich die beiden Wörter x und y an genau zwei Stellen (den beiden letzten Stellen) unterscheiden.

Hamming-Gewicht

Das Hamming-Gewicht ist der Hamming Abstand von einem leeren Wort -- gleichbedeutend mit der Anzahl der gesetzten Bits.

Beispiel:

x = 1011

Das Hamming-Gewicht ist hier 3.

Ermitteln des Gewichts

In einer Sprache wie C kann das Hamming-Gewicht wie folgt ermittelt werden:

 unsigned char hamming-weight(unsigned char word){
   unsigned char weight=0;
   int i;
   for( i = 0 ; i < 8 ; i++ ){
     if( word & ( 1 << i ) ){
       weight += 1;
     }
   }
   return weight;
 }

Neben der oben vorgestellten anschaulichen Loesung gibt es einen erheblich performanteren Algorithmus Vorlage:Ref.

 unsigned char hamming-weight(unsigned char word){
   unsigned char res = (word & 0x55) + ((word >> 1) & 0x55);
   res = (res & 0x33) + ((res >> 2) & 0x33;
   return (res & 0x0F) + ((res >> 4) & 0x0F;
 }

Hamming-Abstand eines Codes

Unter dem Hamming-Abstand eines kompletten Codes versteht man das Minimum aller Abstände zwischen Wörtern innerhalb des Codes.

Beispiel:

Ein Code besteht aus folgenden drei Wörtern:

x = 00110,

y = 00101,

z = 01110.

Der Hamming-Abstand zwischen x und y ist 2.

Der Hamming-Abstand zwischen x und z ist 1.

Der Hamming-Abstand zwischen y und z ist 3.

Der kleinste der drei Abstände ist 1, also ist der Hamming-Abstand des Codes ebenfalls gleich 1.

Wichtig ist die Hamming-Distanz, wenn man Codes entwickeln möchte, die Fehler erkennen (EDC) oder korrigieren (ECC) können. Bei Codes mit Hamming-Abstand h können (h-1)-Bit-Fehler erkannt werden. In dem Beispiel mit h=2 können somit alle 1-Bit-Fehler erkannt werden. Um die Fehler auch korrigieren zu können, muss die Hamming-Distanz auf mindestens 2r+1 vergrößert werden, wobei r für die Anzahl der korrigierbaren Bit-Fehler steht.

Bei h=3 können alle 1-Bit-Fehler erkannt und korrigiert werden. Treten 2-Bit-Fehler auf, werden diese unter Umständen falsch „korrigiert“, da das fehlerhafte Wort möglicherweise den Abstand 1 zu einem anderen gültigen Codewort hat.

Bei h=4 können ebenfalls alle 1-Bit-Fehler erkannt und korrigiert werden. Treten 2-Bit-Fehler auf, können diese zwar erkannt, aber nicht mehr korrigiert werden. Eine falsche „Korrektur“ ist ab 3-Bit-Fehlern möglich.

Der Hamming-Abstand eines Codes ist notwendigerweise eine natürliche Zahl. Ein Code mit Hamming-Abstand 0 ist nicht möglich, da sich in diesem Fall zwei Codewörter nicht unterscheiden ließen.

Erzeugung von Hamming-Codes

Hammingcodes kann man durch einen Algorithmus erzeugen, der ähnlich dem Sieb des Eratosthenes für Primzahlen funktioniert. Um etwa alle Hammingcodes in einem 16-Bit Wort zu finden, die mindestens den Abstand 5 zueinander haben, beginnt man mit dem Wort '0000 0000 0000 0000'. Danach wird aufsteigend das nächste Wort gesucht, das zu dem bisherigen den Abstand 5 hat. Dies ist '0000 0000 0001 1111'.

Nun sucht man weiter nach dem dritten Wort, das zu ersten beiden Einträgen den Abstand 5 hat, und findet '0000 0000 1110 0011'. Fährt man fort, erhält man alle 256 Codewörter, die mit 16 Bits und Abstand 5 möglich sind.

Bits	Distanz	Hammingcodes	Erkennbare Fehler	Korrigierbare Fehler
6	3	8	2-Bitfehler	1-Bitfehler
7	3	16	2-Bitfehler	1-Bitfehler
8	3	16	2-Bitfehler	1-Bitfehler
8	4	16	3-Bitfehler	1-Bitfehler
12	3	256	2-Bitfehler	1-Bitfehler
12	4	128	3-Bitfehler	1-Bitfehler
12	5	16	4-Bitfehler	2-Bitfehler
12	6	16	5-Bitfehler	2-Bitfehler
16	3	2048	2-Bitfehler	1-Bitfehler
16	4	2048	3-Bitfehler	1-Bitfehler
16	5	256	4-Bitfehler	2-Bitfehler
16	6	128	5-Bitfehler	2-Bitfehler
16	7	32	6-Bitfehler	3-Bitfehler
16	8	32	7-Bitfehler	3-Bitfehler

Repräsentation der Bit-Strings in einem Hyperwürfel

Die Idee der Hamming-Distanz kann gut mit Hilfe von Hyperwürfeln dargestellt werden. Ein Hyperwürfel ist die Generalisierung eines dreidimensionalen Würfels auf die Dimension d. Jeder Knoten der Figur entspricht einer Bitkombination, die auch als Koordinatenangabe im Raum verstanden werden kann. Die minimale Anzahl der Kanten, die traversiert werden müssen, um von einem gültigen Wort eines Codes zu einem anderen gültigen Wort des Codes zu gelangen, entspricht der Hamming-Distanz.

Beispiel

Wenn im nebenstehenden Würfel mit d=3 die beiden Worte {101, 010} für einen Code gewählt werden, so beträgt die minimale Hamming-Distanz 3. Damit können in einer Sphäre mit dem Abstand 1 um einen Punkt mit einem gültigen Wort (z.B. für das gültige Code-Wort 010) alle Fehler (1-Bit-Fehler) erkannt und korrigiert werden {000, 110, 011}.

Wird ein Code mit den Worten {000, 101, 110, 011} gewählt, so beträgt die minimale Hamming-Distanz 2. Mit einem Hamming-Abstand von 2 lassen sich 1-Bit-Fehler lediglich erkennen, aber nicht korrigieren (beispielsweise lässt sich zwar erkennen, dass 111 einen fehlerhaften Wert darstellt, jedoch nicht, ob er nach 110 oder 011 oder 101 korrigiert werden soll).

Mindestdistanz

Die Mindestdistanz zwischen 2 benachbarten Codewörtern ist für die Konstruktion eines Codes interessant, der bei m Bitstellen für Nutzinformation k Fehler korrigieren kann.

Es gilt für einen Code mit Hammingdistanz h, daß $k<{\frac {h}{2}}$ Fehler korrigierbar sind.

Beispiel

Soll mindestens ein Fehler korrigierbar sein, also k≥1, so folgt durch Einsetzen und Umstellen daß h≥3 sein muss.

Folgerung

Bei jedem Code muss die Hammingdistanz h somit mindestens 3 betragen, damit überhaupt Fehler korrigierbar sind.

Siehe auch: Hamming-Ähnlichkeit, Hamming-Code

Literatur

Richard W. Hamming: Error-detecting and error-correcting codes. Bell System Technical Journal 29(2): S. 147-160, 1950

Quellen

Vorlage:Fußnote