Benfordsches Gesetz
Das benfordsche Gesetz zählt zu den universellen Verteilungsgesetzen der Stochastik. Es beschreibt eine fundamentale Gesetzmäßigkeit der Verteilung von Zahlen in Zahlenlisten in Abhängigkeit von ihren ersten Ziffern, seien es Einwohnerzahlen von Städten oder Geldbeträge in der Buchhaltung, Listen von Naturkonstanten oder Ergebnisse wissenschaftlicher Beobachtungen. Kurz gefasst besagt es: "Je niedriger die Anfangsziffer (1-9) einer Zahl ist, umso häufiger kommt diese Anfangsziffer vor: Zahlen des Zehnersystems mit der Anfangsziffer '1' sind etwa 6,5-mal häufiger als solche mit der Anfangsziffer '9'"
1881 wurde diese Gesetzmäßigkeit von dem Mathematiker Simon Newcomb entdeckt und im "American Journal of Mathematics" publiziert. Er soll bemerkt haben, dass in den benutzten Büchern mit Logarithmustabellen, die Seiten mit Tabellen mit Eins als erster Ziffer deutlich schmutziger waren als die anderen Seiten, weil sie offenbar öfter benutzt worden seien. Die Abhandlung Newcombs war schon in Vergessenheit geraten, als der Physiker Frank Benford (1883–1948) diese Gesetzmäßigkeit wiederentdeckte und über sie 1938 neu publizierte. Seither wird diese Gesetzmäßigkeit nach ihm benannt. Bis vor wenigen Jahren war sie nicht einmal allen Statistikern bekannt. Da sie schon bei der Lösung zahlreicher praktischer Probleme hilfreich war, wächst ihr Bekanntheitsgrad rasch.
Im Grunde ist das benfordsche Gesetz überhaupt nichts Neues. Es stellt vielmehr einen besonderen, früher nicht in seiner ganzen Tragweite erkannten, Aspekt der logarithmischen Funktion dar; das Phänomen kann daher ohne die logarithmische Funktion nicht erkärt werden, auch wenn dies immer wieder mit moderatem Erfolg versucht wird.
Der Begriff des benfordschen Gesetzes zieht einige verbreitete Irrtümer im Schlepptau:
- Wohl bedingt durch die verbreitete Darstellung des benfordschen Gesetzes als aus 9 Balken bestehendes Histogramm wird suggeriert, das benfordsche Gesetz mache eine Aussage über die Anfangsziffern von Zahlen aus dem dekadischen System (was als Teilaussage stimmen würde) und beruhe auf diskreten Funktionen. In Wahrheit macht das benfordsche Gesetz eine Aussage über beliebig lange Ziffernstrukturen in beliebigen Zahlensystemen und beruht ausschließlich auf stetigen Funktionen, wie z.B. der Dichtefunktion f(x) = 1/xlnB mit B als der Basis des Datensatzes.
- Induziert durch einen optisch ähnlichen Funktionsverlauf und durch die unter Punkt 1 beschriebenen präsentationsbedingten Suggestivwirkungen wurde bisweilen schon spekuliert, das NBL sei nichts als ein Spezialfall des Zipfschen Gesetzes. Diese unhaltbare Annahme ist durch drei Argumente leicht zu entkräften:
Erstens basiert das Zipfsche Gesetz auf diskreten Funktionen, das NBL ausschließlich auf stetigen.
Zweitens basiert die Verteilung des NBL auf der logarithmischen Funktion, die Verteilung des Zipfschen Gesetzes auf der Hyperbelfunktion. Von dem einen Phänomen zum anderen gelangt man bestenfalls über den Weg der Infinitesimalrechnung. Im Rahmen dieser Rechnungsart zeichnet sich nur die Funktion f(x)= exp(x) durch Identität mit ihrem Differential bzw. unbestimmten Integral aus. Da keines der beiden Phänomene explizit auf exp(x) beruht, kann das NBL kein Spezialfall des Zipfschen Gesetzes sein.
Drittens läßt sich die logarithmische Funktion läßt leicht als unendliche Summe von parabolischen Funktionen darstellen, aber nicht von hyperbolischen. Der Unterschied zwischen beiden Phänomenen ist daher selbst bei optischen Ähnlichkeiten und der Annäherung beider Funktionen aneinander im Unendlichen, enorm.
Benfordsche Verteilung
Ist d die erste Ziffer einer Dezimal-Zahl, so tritt sie nach dem benfordschen Gesetz mit der Wahrscheinlichkeit p(d) auf:
oder, wenn es sich nicht um eine Dezimal-Zahl, sondern um eine Zahl zur Basis B handelt:
So ist für Binärzahlen die Wahrscheinlichkeit, dass die erste Ziffer eine 1 ist, immer eins.
Die Summe p(d) für alle d=1, ...B-1 ist, wie es sein muss, 1, denn:
Unter der Annahme der logarithmischen Verteilung lassen sich auch die Wahrscheinlichkeiten für die folgenden Ziffern angeben. Während die erste Ziffer d das logarithmische Intervall von belegt, tritt die zweite Ziffer in allen Teilintervallen auf.
Beispiel: Lautet die zweite Ziffer e=5, dann belegt sie die Intervalle: log(1.6)-log(1.5), log(2.6)-log(2.5), ... log(9.6)-log(9.5). Die Wahrscheinlichkeit p1(5), dass die zweite Ziffer eine 5 ist, lautet (bezogen auf die Gesamtintervall-Länge von log(10)-log(1)=1):
Allgemein gilt für die Wahrscheinlichkeit des Auftretens der n-ten Ziffer d (n=0 für die erste Ziffer) zur Basis B:
Gültigkeit des benfordschen Gesetzes
Ein Datensatz ist eine Benford-Variable (d.h. das benfordsche Gesetz gilt für diesen Datensatz),
- wenn die Mantissen der Logarithmen des Datensatzes einer Gleichverteilung folgen. Da die Mantissen eindeutige Information über die Struktur der Zahlen sind, ist Gleichverteilung der Mantissen gleichbedeutend mit Gleichverteilung der Zahlenstrukturen innerhalb des Datensatzes. Das unbedingte Postulat der Gleichverteilung der Mantissen der Logarithmen der Daten erlaubt es nicht, dass die Daten selbst gleichverteilt sind.
- wenn die Varianz innerhalb des Datensatzes einen bestimmten Mindestwert nicht unterschreitet.
- wenn wie bei den Fibonacci-Zahlen (jede Fibonacci-Zahl ist die Summe ihrer beiden Vorgänger) ergeben schon die Anfangsziffern der ersten 30 Zahlen eine Benford-Verteilung, die verblüffend nahe an der theoretischen Erwartung liegt. Dies gilt übrigens auch für ähnliche Folgen mit geänderten Anfangszahlen (z.B. die Lucas-Folgen.). Viele Zahlenfolgen gehorchen dem benfordschen Gesetz, es gibt aber ebenso viele, die keine Benford-Variablen sind.
Skaleninvarianz
Mit einer Konstanten multiplizierte Datensätze mit benfordverteilten Anfangsziffern sind wiederum benfordverteilt. Die Multiplikation der Zahlen mit einer Konstanten entspricht der Addition einer Konstanten zu den Logarithmen, was deren Verteilung ebenso wenig ändert wie jene der Mantissen.
Baseninvarianz
Ein Datensatz, der zu einer Basis B1 dem benfordschen Gesetz genügt, genügt diesem auch zur Basis B2. Konkreter gesagt, ein dekadischer Datensatz, der das benfordsche Gesetz erfüllt, erfüllt das benfordsche Gesetz auch dann, wenn die dekadischen Zahlen in ein anderes Zahlensystem (z.B. ins binäre, ins oktale oder ins hexadezimale) umgerechnet werden.
Anschauliche Darstellung
Benfords Gesetz besagt in seiner einfachsten Konsequenz, dass die führenden Ziffern n (n = 1...9) mit folgenden Wahrscheinlichkeiten erscheinen: log10(n+1) - log10(n), oder

führende Ziffer | Wahrscheinlichkeit |
---|---|
1 | 30.1 % |
2 | 17.6 % |
3 | 12.5 % |
4 | 9.7 % |
5 | 7.9 % |
6 | 6.7 % |
7 | 5.8 % |
8 | 5.1 % |
9 | 4.6 % |
Allgemein macht das benfordsche Gesetz eine Aussage über die Häufigkeit jeder beliebig langen Ziffernsequenz in Zahlen eines Datensatzes. Das benfordsche Gesetz beruht deshalb auch nicht, wie vielfach irrtümlich angenommen, auf diskreten, sondern auf stetigen Funktionen. Zu der irrtümlichen Annahme, das benfordsche Gesetz beruhe auf diskreten Funktionen, dürfte die weit verbreitete Darstellung der Gesetzmäßigkeit durch das Histogramm der Häufigkeiten der ersten Ziffern beitragen.
Anwendungen
Entsprechen reale Datensätze dem benfordschen Gesetz insofern nicht, als die reale Anzahl von Ziffern bei einer Ziffer signifikant von der für diese Ziffer geltenden theoretischen Erwartung abweicht, dann wird ein Prüfer jene Datensätze, die mit dieser Ziffer beginnen, einer tiefergehenden Analyse unterziehen, um die Ursache(n) für diese Abweichungen zu finden. Dieses Schnellverfahren führt entweder zu tieferen Erkenntnissen über Besonderheiten des untersuchten Datensatzes oder zur Aufdeckung von Manipulationen bei der Datenerstellung.
Beispiel

Eine zufällig herausgegriffene Tabelle berichtet über die Ernteergebnisse aus dem Jahre 2002. Im Diagramm geben die blauen Balken die Häufigkeit der Anfangsziffern der 87 erfassten Zahlen an. Die Benford-Verteilung ist als rote Linie eingezeichnet. Sie spiegelt die Verteilung deutlich besser wieder, als eine Gleichverteilung (grüne Linie).
Trotz der kleinen Zahlenbasis ist auch die Bevorzugung kleiner Ziffern bei der zweiten Zahl erkennbar. Die Tabelle nennt in der ersten Spalte die Anfangsziffer. Die Spalte 1.Ziffer sagt aus, wie oft die Ziffer an erster Stelle beobachtet wird, die Spalte Benford, wie oft sie nach der Benford-Verteilung erwartet wird. Gleiches gilt für die zweite Ziffer unter Spalte 2.Ziffer. Mit zunehmender Stellenzahl nähert sich die oben angegebene Benford-Verteilung der Gleichverteilung der Ziffern.
Ziffer 1.Ziffer Benford 2.Ziffer Benford 0 - 9 10,41 1 27 26,19 17 9,91 2 15 15,32 9 9,47 3 7 10,87 11 9,08 4 17 8,43 5 8,73 5 4 6,89 9 8,41 6 5 5,82 7 8,12 7 4 5,05 8 7,86 8 5 4,45 7 7,62 9 3 3,98 5 7,39 Summe 87 87
In der Wirtschaft
Zur Aufdeckung von Betrug bei der Bilanzerstellung, der Fälschung in Abrechnungen, generell zum raschen Auffinden eklatanter Unregelmäßigkeiten im Rechnungswesen. Mit Hilfe des Benfordschen Gesetzes wurde das bemerkenswert "kreative" Rechnungswesen bei Enron und Worldcom aufgedeckt, durch welches das Management die Anleger um ihre Einlagen betrogen hatte (→ Wirtschaftskriminalität). Heute benutzen Wirtschaftsprüfer und Steuerfahnder Methoden, die auf dem Benfordschen Gesetz beruhen. Diese Methoden stellen einen wichtigen Teil der mathematisch-statistischen Methoden dar, die seit mehreren Jahren zur Aufdeckung von Bilanzfälschung, Steuer- und Investorenbetrug und allgemein Datenbetrug in Verwendung sind.
In der Forschung
Das benfordsche Gesetz ermöglicht die Aufdeckung konsequenter Datenfälschung auch in der Wissenschaft. Es waren schließlich Messwerte aus der Natur, die zum Wissen über die Existenz des benfordschen Gesetzes führten. Dessen ungeachtet ist das benfordsche Gesetz nicht allen Wissenschaftern bekannt, wie Wissenschaftsskandale mit gewisser Periodizität belegen.
Datenfälschung mit Benford?
Die Erstellung gefälschter Benford-adäquater, selbst großvolumiger, Datensätze ist an sich nicht schwierig (s. unten: Erzeugung Benford-verteilter Anfangsziffern); um sie jedoch gegen den Blick des geübten numerisch-statistischen Prüfers zu wappnen, muss man bedenken, dass für alle Daten das benfordsche Gesetz nicht nur für die Anfangsziffer, sondern auch für die Folgeziffern (nach modifizierten Regeln) gelten muss; ferner muss noch einer Reihe anderer stochastischer Gesetzmäßigkeiten Rechnung getragen werden. Trimmt der Datenfälscher die Daten allzu genau auf die theoretische Erwartung hin, besteht Gefahr, dass die Manipulationen eben daran erkannt werden (s.u. Test auf signifikante Abweichungen).
Größe der Städte in Deutschland

Die rechte Abbildung zeigt die Größenverteilung deutscher Städte. Es gibt viele kleine, aber nur wenig große Städte. Der Grafik hinterlegt sind die Einwohnerzahlen der 998 größten Städte (Quelle: [1]). Eine Benford-Analyse liefert folgende Häufigkeiten die Anfangsziffern:
Ziffer/gemessen/erwartet 1 340 300 2 320 176 3 133 125 4 87 97 5 50 80 6 24 67 7 20 58 8 12 51 9 12 46
Die Häufigkeit der Ziffern 3 und 4 entsprechen der Erwartung. Hingegen tritt die Zahl 1 vermehrt auf. Besonders ausgeprägt ist die Abweichung der Ziffer 2, auf Kosten der nur selten an erster Stelle beobachteten Ziffern 7, 8 und 9.
Dieses Beispiel zeigt, dass Datensätze dem NBL genügen, wenn sie bestimmte Voraussetzungen erfüllen; dies tut der vorliegende Datensatz nicht. (Siehe dazu: Diskussion).
Signifikanz
Wie groß die Abweichungen der beobachteten Verteilung von der theoretisch zu erwartenden Verteilung mindestens sein müssen, damit ein begründeter Verdacht auf Manipulation als erhärtet angesehen werden kann, wird mit Hilfe mathematisch-statistischer Methoden (z.B. dem Chi-Quadrat-Test oder dem Kolmogorow-Smirnow-Test, "KS-Test") bestimmt. Für den -Test sollte beim Test von überzufälligen Abweichungen bei der Anfangsziffer eine Stichprobe ab 109 Zahlen genügen ( ist erfüllt für alle ). Sind die Stichproben viel kleiner, sind die Ergebnisse des Chi-Quadrat-Tests anfechtbar und der KS-Test gegebenenfalls zu tolerant. In einem solchen Fall kann z.B. auf einen höchst unangenehmen, aber exakten Test auf Basis der Multinomialverteilung zurückgegriffen werden.
Dass sich gerade Saldenlisten, Rechnungslisten und ähnliche Aufstellungen gemäß dem benfordschen Gesetz verhalten, liegt an dem Umstand, dass es sich bei der Mehrzahl solcher Zahlenreihen um Sammlungen von Zahlen handelt, die die unterschiedlichsten arithmetischen Prozesse durchlaufen haben und sich daher wie Quasi-Zufallszahlen verhalten. Lässt man den geschäftlichen und buchungstechnischen Prozessen freien Lauf, dann wirken ab einer gewissen Geschäftsgröße die Gesetze des Zufalls und es gilt mithin auch das benfordsche Gesetz. Wird allerdings im Verlauf einer Rechnungsperiode konsequent Einfluss auf diese Zahlen genommen, indem man häufig welche schönt, bestimmte Zahlen verschwinden lässt oder welche hinzu erfindet, oder wegen gegebener Kompetenzbeschränkungen sogar Prozesse manipuliert, dann wird der Zufall merklich gestört. Diese Störungen manifestieren sich in signifikanten Abweichungen von der theoretisch zu erwartenden Ziffernverteilung.
Beispiel: Wenn ein Angestellter Bestellungen bis zu 1.000 EUR ohne Genehmigung der Geschäftsleitung durchführen darf und er bei Vorliegen von Angeboten höher als 1.000 EUR die Bestellungen häufig auf mehrere kleinere Posten aufteilt, um sich die Mühen der Genehmigung zu ersparen, dann finden sich in der Benford-Verteilung der Bestellbeträge signifikante Abweichungen von der theoretischen Erwartung.
Dieses Beispiel zeigt aber auch, dass statistische Methoden einzelne Unregelmäßigkeiten nicht aufdecken können. Eine gewisse Konsequenz der Manipulationen ist erforderlich. Je größer die Stichprobe ist, umso empfindlicher reagiert ein Signifikanztests im Allgemeinen auf Manipulationen.
Test auf signifikante Abweichungen
Benford-Analysen werden für die einfachsten Analysen der mathematischen Statistik gehalten. Das nachstehende Beispiel ist das Ergebnis der Auszählung der Anfangsziffern einer Stichprobe von 109 Summen aus einer Aufstellung. Die realen (beobachteten) Auszählungsergebnisse werden mit den bei 109 Anfangsziffern zu erwartenden Auszählungsergebnissen verglichen und mittels Chi-Quadrat-Test dahingehend untersucht, ob die gefundenen Abweichungen zufällig sein können oder durch Zufall allein nicht mehr zu erklären sind. Als Entscheidungskriterium wird in diesem Beispiel angenommen, dass von Überzufälligkeit ausgegangen wird, sobald die beobachtete Verteilung der Anfangsziffern zu jenen 4,99...9 % gehört, die diese oder noch höhere Abweichungen aufweisen (statistischer Test). Da in unserem Beispiel 52% aller Verteilungen diese oder höhere Abweichungen aufweisen, wird ein Prüfer die Hypothese, dass die Abweichungen durch Zufall entstanden sind, nicht verwerfen.
Tiefergehende Benford-Analysen
Liegen sehr lange Listen mit mehreren tausend Zahlen vor, ist ein Benford-Test nicht nur mit der Anfangsziffer durchführbar. Eine solche Datenfülle erlaubt es, auch die 2., die 3., die 1.+ 2., eventuell sogar die 1.+ 2.+ 3. Ziffer simultan zu überprüfen (für diese sollte man allerdings mindestens 11.500 Zahlen haben, da ansonsten der Chi-Quadrat-Test unsichere Ergebnisse bringen könnte). Für diese Prüfungen existieren ebenfalls Benford-Verteilungen, wenngleich sie auch etwas umfangreicher sind. So z.B. beträgt die theoretische Erwartung für das Erscheinen der Anfangsziffern 123... 0,35166%, wohingegen nur noch 0,13508% aller Zahlen die Anfangsziffern 321... aufweisen. Stets gilt die Regel, dass die Ziffern umso mehr einer Gleichverteilung folgen, je kleiner ihr Stellenwert ist. Cent-Beträge folgen nahezu exakt einer Gleichverteilung, wodurch sich bei Cent-Beträgen der logarithmische Ansatz im Allgemeinen erübrigt. Bei sehr kleinen Währungen werden Tests auf Gleichverteilung der Scheidemünzenbeträge (z.B. Kopeke-RUS, Heller-CZ, Fillér-H, Lipa-HR) unscharf, da in der Praxis sehr häufig gerundet wird. Große Währungen (US-Dollar, Pfund-Sterling, Euro) erlauben solche Tests aber zumeist schon.
Schätzung und Planung von Unternehmensumsätzen
Das benfordsche Gesetz lässt sich auch zur Schätzung von Umsatzziffern von Unternehmen heranziehen. Für die Größenordnungen der Fakturenbeträge wird angenommen, dass sie annähernd einer Normalverteilung folgen, die Anfangsziffern der Fakturenbeträge der Benford-Verteilung, wobei der Erwartungswert der Anfangsziffer etwa 3,91 (siehe oben: Ableitung des Erwartungswerts der Benfordverteilung) ist. Mit der Kenntnis des höchsten Fakturenbetrages und der Anzahl der gültigen Fakturen, aus welchen sich der zu schätzende Umsatz zusammensetzt, ist eine brauchbare Schätzung des Umsatzes möglich, wie nachstehendes Beispiel aus der Praxis zeigt. Der Stellenwert in der Tabelle bezeichnet die Ziffer vor dem Komma des Logarithmus. Der tatsächliche Umsatz lag bei 3,2 Mio Währungseinheiten. So nahe am tatsächlichen Ergebnis liegt man bei Umsatzschätzungen allerdings nicht immer. Wenn die Annahme der Normalverteilung für die Größenordnungen nicht zutrifft, muss man eine Schätzverteilung wählen, die der realen eher gleicht. Zumeist folgen die Größenordnungen der Fakturenbeträge dann einer Logarithmischen Normalverteilung.
Zwar wird die tatsächliche Verteilung der Fakturenbeträge immer nur zufällig mit jener der Schätzung übereinstimmen, die Summe aller Schätzfehler je Stellenwert kompensiert sich jedoch fast immer auf einen eher kleinen Betrag.
Auch im Rahmen der Planung von Unternehmensumsätzen kann dieses Verfahren zur Überprüfung der Plausibilität von Planumsätzen, die zumeist als Ergebnis von Schätzungen und Hochrechnungen von Erfahrungswerten verkaufsorientierter Abteilungen entstanden sind, eingesetzt werden, indem man eruiert, wie viele Fakturen zur Erreichung des angegebenen Umsatzes erwartet werden und wie hoch der höchste Fakturenbetrag sein wird. Oft zeigt diese Analyse, dass auf solche Schätzwerte, die der Planung zugrunde gelegt werden, kein all zu großer Verlass ist. Die Benford-Analyse gibt der Verkaufsabteilung dann das Feedback zur realitätsbezogenen Korrektur ihrer Erwartungen.
Unterstellt man, dass die Logarithmen der einzelnen Umsätze gleichverteilt sind, so sind die Umsätze quasi "logarithmisch gleichverteilt". Die Dichtefunktion der Umsätze hat dann ein Histogramm, das bei geeigneter Klasseneinteilung der Verteilung der Ziffernsequenzen (z.B. neun Klassen, verglichen mit First Digit) der Benford-Verteilung sehr ähnlich sieht.
Erzeugung benfordverteilter Anfangsziffern
Die Erzeugung von praktisch zufälligen Zahlen mit benfordverteilten Anfangsziffern ist mit dem PC recht einfach möglich.
Gleichverteilte Zahlen
Die Funktion erzeugt Zahlen mit benfordverteilten Anfangsziffern für , wobei r eine gleichverteilte zufällige positive ganze Zahl in einem Intervall (z. B. 1 ≤ r aus N ≤ 6) und s eine Zufallszahl zwischen 0 und 1 ist; log(r) ist der Logarithmus von r zur Basis 10. Die Größenordnungen von y sind dann annähernd gleichverteilt.
Normalverteilte Zahlen
Die Funktion erzeugt für , mit als gleichverteilter Zufallsvariablen, Zahlen mit etwa normalverteilten Größenordnungen von y und benfordverteilten Anfangsziffern. Für praktische Zwecke sollte r relativ hoch gewählt werden (r > 1000). Ist r < 1000, erkennt man mit sinkendem r, dass die Verteilung der Zahlen der Form einer Lognormalverteilung ähnelt. Ist r < 50, sind die erzeugten Anfangsziffern der Zahlen im Allgemeinen nicht mehr benfordverteilt. Für Anwendungen in der Praxis ist die breite Streuung der Größenordnungen von y, die das Quadrat der Tangensfunktion, noch dazu bei großen r, erzeugt, in vielen Fällen nicht optimal.
Ein Spiel
A und B wetten auf die Anfangsziffer einer gezogenen Zahl aus einer Publikation, die hauptsächlich aus einer Ansammlung von (aller Erwartung nach benford-verteilten) Zahlen besteht (z.B. eine Produktionsstatistik eines Landes o.ä.). A und B vereinbaren z.B., dass die Wette stets für die Anfangsziffer der letzten Zahl auf der zufällig aufgeschlagenen Seite mit ungerader Seitenzahl gilt. Wenn die so ermittelte Zahl die Anfangsziffern 1,2 oder 3 hat, gewinnt A einen Euro. Wenn eine andere Anfangsziffer (also 4,5,6,7,8 oder 9) vorliegt, gewinnt B. Wer wird das Spiel nach 100 Durchgängen gewonnen haben und wieviel? Antwort: Die Gewinnwahrscheinlichkeit für A beträgt ca. 30%+18%+12% = etwa 60%, jene für B etwa 40%; in ca. 60 von 100 Fällen gewinnt also A, daher wird A nach diesem Spiel um die 10 EUR mehr und B um die 10 EUR weniger besitzen.
Literatur
- Benford, F. (1938): The Law of Anomalous Numbers. Proc. Amer. Phil. Soc. 78, S. 551-572.
- Newcomb, S. (1881): Note on the Frequency of the Use of Digits in Natural Numbers. Amer. J. Math. 4, S. 39-40.
- Nigrini, M. J. (1992): The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies. Dissertation, Cincinnati, OH: University of Cincinnati.
- Peter N. Posch: Ziffernanalyse in Theorie und Praxis - Testverfahren zur Fälschungsaufspürung mit Benfords Gesetz - ISBN 3-8322-4492-1
- Peter N. Posch: A Survey on Sequences and Distribution Functions satisfying the First-Digit-Law; October 2004; www.mathematik.uni-ulm.de/dof/pnposch/paper/posch_benforddist.pdf
Übersichtsartikel:
- Stewart, I.: Das Gesetz der ersten Ziffer in Spektrum der Wissenschaft, April 1994, S. 16 ff. (Online)