Hutter-Preis
Der seit dem 6. August 2006 vergebene Hutter-Preis belohnt Fortschritte in zwei Teilgebieten der Informatik: verlustfreie Datenkompression und künstliche Intelligenz. Er ist benannt nach Marcus Hutter, einem deutschen Informatiker, der zurzeit an der Australian National University lehrt.
Der Wettbewerb besteht darin, einen bestimmten Textkorpus – nämlich die ersten 100.000.000 Zeichen einer bestimmten Version der englischsprachigen Wikipedia – möglichst stark und verlustfrei zu komprimieren. Dieser Korpus besteht zu 75 % aus natürlicher, englischer Sprache. Marcus Hutter und die anderen Mitglieder des Preiskommittees gehen davon aus, dass verlustfreie Datenkompression und künstliche Intelligenz dasselbe Problem darstellen – es ginge nämlich um das Verhalten eines Agenten in einer ihm unbekannten, aber berechenbaren Umwelt. Sie argumentieren auch, dass die Voraussage des jeweils nächsten Satzbestandteils in einem Text Wissen und damit Intelligenz voraussetze. Einige Datenkompressionsverfahren stehen nämlich vor demselben Problem – gelingt es, in einer Zeichenkette das nächstfolgende Zeichen zu erraten, muss dieses nämlich nicht abgespeichert werden.
Regeln
- Das eingereichte Programm muss ein selbstextrahierendes Archiv mit Größe S sein. Andernfalls bildet S die Summe aus der Größe des Programms und jener der mitgelieferten komprimierten Datei.
- Das Programm muss eine Datei erzeugen, die identisch ist mit der unkomprimierten Referenzdatei ("enwik8").
- Das Programm muss auf Windows oder Linux laufen (x86, 32 Bit).
- Das Programm darf keine Informationen beziehen, so zum Beispiel aus anderen Dateien oder Computernetzwerken.
- Hardware: Das Programm darf während höchstens 10 Stunden auf einem Pentium-4-Rechner mit 2 GHz Taktrate laufen. Der Computer darf 1 GB RAM besitzen, und auf der Festplatte dürfen höchstens 10 GB temporäre Dateien abgespeichert werden.
Das eingereichte Programm muss nicht quelloffen sein (Open Source).
Um den Preis zu gewinnen, muss der bisherige Rekord (Größe S des selbstextrahierenden Archivs) um mindestens ein Prozent unterboten werden. Für jedes Prozent werden 500 € Preisgeld ausgelobt.
Geschichte
Die Startlinie markierte die Software PAQ8F mit einem Wert von S = 18.324.887 Bytes. PAQ8F benötigte zur Dekompression der Daten fünf Stunden. Der derzeitige Rekord wurde am 23. Mai 2009 von Alexander Rhatuschnjak aufgestellt. Sein Programm "decomp8" benötigte rund neun Stunden Laufzeit, und S betrug 15.949.688 Bytes.