Inhaltsangabe
Die vorliegende Arbeit handelt von Benfords Gesetz ¨ uber die Verteilung signifikanter
Ziffern von realen Zahlen und dessen Anwendung in der Marktforschung. Benfords Gesetz besagt kurzgefasst, dass die Anfangsziffern bestimmter Datenmengen nicht gleichverteilt sind, sondern einer logarithmischen Verteilung folgen.
Es werden ein Wahrscheinlichkeitsraum f¨ ur Benfords Gesetz und Formeln f¨ ur die Verteilung der ersten, zweiten und n-ten Ziffer sowie die gemeinsame Verteilung der ersten n Ziffern eingef¨ uhrt. Ferner werden die besonderen Eigenschaften der Benford-Verteilung wie die Skalen- und die Baseninvarianz betrachtet. Als Hauptresultat wird ein Grenzwertsatz f¨ ur signifikante Ziffern angegeben und bewiesen.
Als besondere Anwendungsm¨ oglichkeit wird die Aufdeckung von F¨ alschungen bei Interviews in der Marktforschung betrachtet. Dazu werden die Prozesse der Datenerhebung beleuchtet und Ergebnisse bisheriger Studien vorgestellt. Die verschiedenen in der Marktforschung auftauchenden Datentypen werden analysiert und ihre Eignung als Pr¨ ufgr¨ oßen untersucht. Darauf aufbauend wird ein Programm zum Test auf die Benford-Verteilung vorgestellt und eine m¨ ogliche Testfrage auf Tauglichkeit untersucht.
Danksagung
Die vorliegende Diplomarbeit entstand an der Technischen Universit¨ at Dresden in der Fachrichtung Mathematik am Institut f¨ ur Mathematische Stochastik unter der Betreuung von Prof. Dr. rer. nat. habil. Volker Nollau und Dr. rer. nat. Hans-Otfried M¨ uller. Sie wurde am 14. Februar 2007 eingereicht.
Ich danke allen, die mich bei der Arbeit, ihrer Betreuung, dem Korrekturlesen und ¨ uber
das ganze Studium hinweg unterst¨ utzt haben.
Mein besonderer Dank gilt Herrn Prof. Dr. Nollau und Herrn Dr. M¨ uller, die diese Arbeit fachlich betreut haben. Ferner danke ich Iris Keller, Dr. Hariet K¨ ostner und Uwe Rennschmied vom Marktforschungsinstitut ForschungsWerk GmbH in N¨ urnberg, die mir wertvolle Einblicke in die praktische Arbeit der Marktforschung gew¨ ahrt haben.
iii
Inhaltsverzeichnis
1 Einf uhrung 1
1.1 Geschichtlicher Abriss zu Benfords Gesetz 1
1.2 Erkl arungen f ur Benfords Gesetz 2
1.3 Aufbau der Arbeit 3
1.4 Mathematische Grundlagen 3
2 Benfords Gesetz 6
2.1 Mantissen und signifikante Ziffern 6
2.2 Wahrscheinlichkeitsraum 9
2.2.1 Grundraum Ω 9
2.2.2 Mantissen-σ Algebra M b 9
2.2.3 Wahrscheinlichkeitsmaß
P 12
2.3 Spezialf alle von Benfords Gesetz 16
2.3.1 Gesetz der ersten Ziffern 16
2.3.2 Gesetz der n-ten Ziffern 17
2.4 Allgemeine Eigenschaften der Benford-Verteilung 19
2.4.1 Konvergenz der Benford-Verteilung 19
2.4.2 Abh angigkeit der Ziffern 22
2.5 Strukturelle Eigenschaften der Benford-Verteilung 24
2.5.1 Skaleninvarianz 24
2.5.2 Baseninvarianz 27
2.6 Grenzwertsatz f ur signifikante Ziffern 33
2.7 Beispiele f ur benford-verteilte Datenmengen 43
2.7.1 Endpreise von Ebay-Auktionen 43
2.7.2 Fibonacci-Zahlen 43
2.7.3 Lucas-Zahlen 44
2.7.4 Hills Datenmengen 44
3 Anwendung von Benfords Gesetz in der Marktforschung 46
3.1 Verschiedene Anwendungsm oglichkeiten 46
3.1.1 Computeroptimierung 46
3.1.2 Plausibilit atstest bei mathematischen Modellen 46
iv
Inhaltsverzeichnis
3.1.3 Steuerfahndung 47
3.1.4 Marktforschung 48
3.2 Datenerhebung in der Marktforschung 48
3.2.1 Stichprobe 49
3.2.2 Pretest 49
3.2.3 Ablauf des Interviews 49
3.2.4 Durchf uhrungsobjektivit at 50
3.2.5 Dispositions 50
3.2.6 Kontaktphase 51
3.2.7 Filterfragen und unfertige Interviews 51
3.2.8 Abh oren und Monitoring 51
3.2.9 Interviewdauer 52
3.2.10 Ausreißer-Pr ufung 52
3.2.11 Telefonische Nachkontrollen 52
3.2.12 Falsche Angaben der Befragten 52
3.3 Datentypen in der Marktforschung 53
3.3.1 Nominal- und Ordinalskalen 53
3.3.2 Intervallskalen 54
3.4 Tests auf die Benford-Verteilung 55
3.4.1 Verschiedene in der Literatur erw ahnte Tests 55
3.4.2 Invarianz-Testverfahren 56
3.4.3 χ 2 Anpassungstest 58
3.4.4 Programm zum Test auf die Benford-Verteilung 59
3.4.5 Testbeispiele 60
3.4.6 Interpretation von Tests 61
3.5 Ergebnisse bisheriger Studien 62
3.5.1 Judge und Schechter 62
3.5.2 Swanson, Cho und Eltinge 63
3.5.3 Schr apler und Wagner 64
3.6 Tests bei Umfragedaten 65
3.6.1 Daten aus der Literatur 65
3.6.2 Reale Daten 67
4 Zusammenfassung und Ausblick 71
A Programm zur Ermittlung der Ziffernh aufigkeiten 73
B Teilstichproben aus Datensatz 3 79
Literaturverzeichnis 84
v
Kapitel 1
Einf¨ uhrung
1.1 Geschichtlicher Abriss zu Benfords Gesetz
Der Astronom Simon Newcomb ver¨ offentlichte 1881 einen Artikel mit dem Titel ” Note on the Frequency of Use of the Different Digits in Natural Numbers“ [Newcomb 1881]. In diesem Beitrag erl¨ auterte er seine Beobachtung, dass die ersten Seiten von Logarithmen-Tafeln wesentlich schneller abgenutzt sind als die letzten. Er schloss daraus, dass die 1 als erste Ziffer h¨ aufiger vorkomme als die 2, die 2 h¨ aufiger als die 3 und so fort. F¨ ur seine Beobachtung gab er folgende Beschreibung an:
1 P(erste signifikante Ziffer = d) = log 10 1 + , wobei d = 1, 2, ..., 9 ist d
und
9 log 10 (1+(10k +d) −1 ), wobei d = 0, 1, 2, ..., 9. P(zweite signifikante Ziffer = d) = k=1
Diese Entdeckung widerspricht der allgemeinen Ansicht, dass jede Ziffer mit der gleichen Wahrscheinlichkeit - beispielsweise 1 f¨ ur die erste Ziffer bei den Dezimalzahlen
9
- vorkommen sollte. Lange Zeit besch¨ aftigte sich niemand mit diesem Thema. Bekannt wurde es erst, als der Physiker Frank Benford dieselbe Beobachtung in den Logarithmen-Tafeln machte und 1938 fundiert durch eigenes Datenmaterial in dem Artikel ” The law of anomalous numbers“ ver¨ offentlichte [Benford 1938].
Das Gesetz ist heutzutage unter dem Namen ” Benfords Gesetz“ (Benford’s Law) bekannt. Einige Autoren nennen es auch ” Newcomb-Benford-Gesetz“ (Newcomb-Benford-Law), ” Gesetz der ersten Ziffern“ (First Digit Law), ” Gesetz der signifikanten Ziffern“
1
Kapitel 1 Einf¨ uhrung
(Significant Digit Law) oder ” logarithmisches Gesetz“ (Logarithmic Law).
Anl¨ asslich des 125. Jahrestages von Newcombs Artikel im Jahr 2006 hat Werner H¨ urlimann eine Bibliographie akademischer Arbeiten erstellt, die sich mit Benfords Gesetz besch¨ aftigen [H¨ urlimann 2006]. Allein in dieser nicht ganz vollst¨ andigen Auflistung finden sich ¨ uber 300 Artikel zum Thema.
1.2 Erkl¨ arungen f¨ ur Benfords Gesetz
Manche Datenmengen erf¨ ullen Benfords Gesetz, manche nicht. Selbst bei den von Ben-ford aufgef¨ uhrten Datenmengen gen¨ ugen laut Scott und Fasli [Scott und Fasli 2001] nur etwa die H¨ alfte tats¨ achlich seinem Gesetz. Es gibt eine Reihe von Erkl¨ arungsversuchen, warum und wann Benfords Gesetz gilt.
Eine recht philosophische Hypothese ist, dass die Menge aller Zahlen selbst Benfords Gesetz folgt, da es eine ” eingebaute Charakteristik unseres Zahlensystems“ sei [Wea- ver 1963].Die empirisch beobachteten ¨ Ubereinstimmungen ergeben sich also aus der
Tatsache, dass die untersuchten Zahlenmengen Repr¨ asentanten derselben zugrunde liegenden mystischen Menge aller Zahlen sind. Auch Benford vertrat diese Ansicht.
Raimi [Raimi 1976] gibt eine ¨ Ubersicht ¨ uber verschiedene andere Erkl¨ arungsversuche,
doch Hill [Hill 1995b] kritisiert all diese. Bei den meisten Theorien werden n¨ amlich keine geeigneten Wahrscheinlichkeitsr¨ aume definiert oder es wurden andere falsche Annahmen getroffen.
In Kapitel 2.2 wird deshalb ein geeigneter Wahrscheinlichkeitsraum eingef¨ uhrt, der eine korrekte Darstellung der Benford-H¨ aufigkeiten gestattet. In Kapitel 2.6 wird dann ein Grenzwertsatz angegeben, der besagt, dass eine Mischung aus Datenmengen mit verschiedenen Verteilungen unter bestimmten Voraussetzungen gegen die Benford-Verteilung konvergiert.
2
1.3 Aufbau der Arbeit
1.3 Aufbau der Arbeit
Die Arbeit ist in zwei Teile gegliedert: Der erste Teil (Kap. 2) besch¨ aftigt sich mit der Theorie rund um Benfords Gesetz, der zweite (Kap. 3) bezieht sich auf die Anwendungsm¨ oglichkeiten in der Marktforschung, insbesondere auf die Aufdeckung von F¨ alschungen bei Interviews.
In Kapitel 2.2 wird ein geeigneter Wahrscheinlichkeitsraum eingef¨ uhrt. Darauf aufbauend werden S¨ atze ¨ uber die gemeinsame Verteilung der ersten n Ziffern (Kap. 2.2.3)
sowie f¨ ur die Verteilung der ersten (Kap. 2.3.1), zweiten und n-ten Ziffern (Kap. 2.3.2) angegeben. Zu den besonderen Eigenschaften der Benford-Verteilung geh¨ oren die Abh¨ angigkeit der Ziffern (Kap. 2.4.2), die Konvergenz der Benford-Verteilung gegen die Gleichverteilung (Kap. 2.4.1), die Skalen- und die Baseninvarianz (Kap. 2.5.1 und 2.5.2). In Kapitel 2.6 wird ein Satz hergeleitet, der dem Zentralen Grenzwertsatz ¨ ahnelt. Dieser trifft eine Aussage, unter welchen Bedingungen eine Mischung von Datenmengen benford-verteilt ist. Beispiele f¨ ur benford-verteilte Datenmengen werden in Kapitel 2.7 gegeben.
In Kapitel 3.1 werden verschiedene Anwendungsm¨ oglichkeiten von Benfords Gesetz vorgestellt, wobei n¨ aher auf die Anwendung in der Marktforschung eingegangen wird. Dazu werden zun¨ achst in Kapitel 3.2 die Prozesse bei der Erhebung von Umfragedaten beschrieben und in Kapitel 3.3 die verschiedenen Datentypen vorgestellt. In Kapitel 3.4 werden verschiedene Tests auf die Benford-Verteilung bewertet und ein Programm zum Test auf Benford-Verteilung eingef¨ uhrt (Kap. 3.4.4). Ergebnisse bisheriger Studien zum Thema werden in Kapitel 3.5 pr¨ asentiert. Die Auswertung eigener Tests erfolgt in Kapitel 3.6.
1.4 Mathematische Grundlagen
Folgende Definitionen werden als Grundlagen f¨ ur die eigentliche Arbeit ben¨ otigt.
Definition 1 (R + )
Die Menge der positiven reellen Zahlen ohne Null wird mit R + bezeichnet.
Definition 2 (σ-Algebra auf Ω)
Eine Familie F von Teilmengen einer Menge Ω mit
3
Kapitel 1 Einf¨ uhrung
• Ω ∈ F
• A ∈ F ⇒ ¯ A ∈ F ∞ • A 1 , A 2 , ... ∈ F ⇒ A i ∈ F i=1
heißt σ-Algebra auf Ω.
Definition 3 (Borel-σ-Algebra und Borel-Mengen auf R + ) [M¨ uller 1991] Die kleinste σ-Algebra von Teilmengen der positiven reellen Zahlen R + , die alle offenen, halboffenen und abgeschlossenen Teilmengen von R + enth¨ alt, heißt Borel-σ-Algebra B des R + . Die Elemente dieser Algebra heißen Borel-Mengen des R + .
Definition 4 (messbarer Raum) [M¨ uller 1991]
Sei Ω eine nichtleere Menge und F eine σ-Algebra von Teilmengen von Ω. Dann heißt das Paar (Ω,F) messbarer Raum.
Definition 5 (Wahrscheinlichkeitsmaß auf R + )
Sei (Ω, F) ein messbarer Raum. Eine auf F definierte Funktion P : A ∈ F → P(A) ∈ [0, 1] mit
• P(Ω) = 1
• A 1 , A 2 , ... ∈ F und A i ∩ A i = ∅ f¨ ur i = i ∞ ∞ ⇒ P( A i ) = P(A i ) (σ-Additivit¨ at)
i=1 i=1
heißt Wahrscheinlichkeitsmaß (oder Wahrscheinlichkeit) auf Ω.
Definition 6 (Diskretes Wahrscheinlichkeitsmaß)
Sei {ω i } i∈I mit Ω = i∈I {ω i } und I ⊆ N eine Menge von endlich oder abz¨ ahlbar
vielen Elementarereignissen mit Wahrscheinlichkeiten P ({ω i }) = p i . Ein Wahrscheinlichkeitsmaß mit
p i = 1 i∈I
heißt diskretes Wahrscheinlichkeitsmaß.
Definition 7 (Borel-Wahrscheinlichkeitsmaß)
Sei B die Borel-σ-Algebra. Ein Wahrscheinlichkeitsmaß P B : A ∈ B → P(A) ∈ [0, 1] heißt Borel-Wahrscheinlichkeitsmaß auf Ω.
4
1.4 Mathematische Grundlagen
Definition 8 (atomlos)
Ein Wahrscheinlichkeitsmaß P, f¨ ur das f¨ ur alle messbaren Mengen A mit P(A) > 0 eine messbare Teilmenge B ⊂ A existiert, so dass
P(A) > P(B) > 0 ist,
heißt atomlos.
Definition 9 (Wahrscheinlichkeitsraum) [M¨ uller 1991]
Sei Ω eine nichtleere Menge, F eine σ-Algebra von Teilmengen von Ω und P ein zugeh¨ origes Wahrscheinlichkeitsmaß. Dann heißt das Tripel (Ω, F, P) Wahrscheinlichkeitsraum.
Definition 10 (messbare Funktion) [M¨ uller 1991]
Seien (Ω, F) und (Ω , F ) messbare R¨ aume. Eine Funktion f : Ω → Ω , f¨ ur die gilt, dass das Urbild f −1 (A ) f¨ ur alle A ∈ F in F liegt, heißt (F, F )-messbar.
Definition 11 (Zufallsvariable) [M¨ uller 1991]
Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und (R, B) ein messbarer Raum. Eine Funktion X : Ω → R, f¨ ur die gilt, dass
X −1 (A) = {ω ∈ Ω|X(ω) ∈ A} ∈ F ist f¨ ur alle A ∈ B, (1.1)
heißt Zufallsvariable, kurz ZV.
Definition 12 (i.i.d.)
Eine Folge von Zufallsvariablen {X i } i∈N , die stochastisch unabh¨ angig und identisch verteilt ist, wird als i.i.d. (independent identically distributed) bezeichnet. Dies wird i.i.d. ∼ dargestellt. auch mit dem Symbol
Definition 13 (mathematische Stichprobe)
Sei {X i } i∈N i.i.d.. Dann heißt der Vektor X := (X 1 , X 2 , ..., X n ) mathematische Stichprobe vom Umfang n.
Definition 14
Sei a ∈ R und E ⊂ R + . Es gelten folgende Bezeichnungen:
(i) aE := {ae|e ∈ E}
(ii) a + E := {a + e|e ∈ E}
(iii) E a := {e a |e ∈ E}.
5
Kapitel 2
Benfords Gesetz
2.1 Mantissen und signifikante Ziffern
Benfords Gesetz ist eine Aussage ¨ uber eine Wahrscheinlichkeitsverteilung auf den signifikanten Ziffern von Zahlen. Die tats¨ achliche Gr¨ oße dieser Zahlen spielt bei Benfords Gesetz im Gegensatz zu vielen anderen Verteilungsgesetzen keine Rolle - es geht lediglich um deren Ziffern.
Beispiel 1
Die Zahlen 1902, 19,02 und 0,01902 sind im Sinne von Benfords Gesetz gleich. Die erste signifikante Ziffer ist 1, die zweite 9, die dritte 0 und die vierte 2. Eine Null als f¨ uhrende Ziffer wird ignoriert. Betrachtet man nur die ersten Ziffern, sind die Zahlen 1902, 0,01 und 1,99 in diesem Sinne ebenfalls gleich.
Um mit den signifikanten Ziffern arbeiten zu k¨ onnen, werden die folgenden Definitionen eingef¨ uhrt:
Definition 15 (Mantisse, Basis) [Hill 1995a]
Jede positive reelle Zahl x ∈ R + kann dargestellt werden als
x = m b · b e , wobei e ∈ Z ist.
Dabei heißt die nat¨ urliche Zahl b ∈ N\{1} Basis und die positive reelle Zahl m b ∈ [1, b) Mantisse zur Basis b einer positiven reellen Zahl x.
Bemerkung 1
Die Mantisse m 10 zur Basis 10 wird auch als m bezeichnet.
6
2.1 Mantissen und signifikante Ziffern
Beispiel 2
Die Mantisse f¨ ur x = 1902 = 1, 902 · 10 3 , f¨ ur y = 19, 02 = 1, 902 · 10 1 und f¨ ur z = 0, 01902 = 1, 902 · 10 −2 ist also m = 1, 902.
Bemerkung 2
Eine negative reelle Zahl −x kann auf die gleiche Weise dargestellt werden:
−x = −m b · b e , wobei e ∈ Z ist.
Im Folgenden werden also als Mantissen m b nur positive reelle Zahlen betrachtet.
Bemerkung 3
Da die Mantisse m b auf dem Intervall [1, b) definiert ist, ist die Null als f¨ uhrende Ziffer automatisch ausgeschlossen. Erst ab der zweiten Ziffer kann die Null vorkommen.
Bemerkung 4
Die Darstellung einer positiven reellen Zahl mit unendlicher Ziffernfolge ist nicht notwendig eindeutig. Beispielsweise die Zahl 1, 999.... ˆ =2, 000.... Im Folgenden werden deshalb nur endliche Ziffernfolgen betrachtet.
Definition 16 (Mantissenfunktion) [Hill 1995a]
Sei b ∈ N \ {1} eine Basis. Die Funktion
M b : R + → [1, b)
x → m b ,
die jeder Zahl x ∈ R + ihre Mantisse M b (x) = m b ∈ [1, b) zuordnet, heißt Mantissenfunktion zur Basis b.
Bemerkung 5
Die Mantissenfunktion M 10 zur Basis 10 wird auch als M bezeichnet.
Beispiel 3
M (1902) = M (19, 02) = M (0, 01902) = 1, 902.
Definition 17 (Funktion der signifikanten Ziffern) [Posch 2004] Sei b ∈ N \ {1} eine Basis. Die Funktion
D (b) n : R + → {0, 1, 2, ..., b − 1}
Kapitel 2 Benfords Gesetz
(b) (b) 1 ∈ {1, 2, ..., b − 1}, wobei (d n ) n∈N die eindeutig bestimmte Folge bezeichnet, f¨ ur die d
n
(b)
n
∈ {0,
1, 2,
..., b
−
1}
f¨ ur
n
∈
N
\ {1}
und
M
b
(x) =
d
b i−1 ist, heißt Funktion der
signifikanten Ziffern zur Basis b.
Die Funktion D Bemerkung 6 n (10)
der signifikanten Ziffern zur Basis 10 wird auch als D n bezeichnet.
D n (x) heißt n-te signifikante Ziffer von x zur Basis b ∈ N \ {1}, kurz D (b) Definition 18 (n-te signifikante Ziffer) [Posch 2004] (b)
n .
Bemerkung 7
D n (x) steht f¨ ur die n-te signifikante Ziffer von x zur Basis 10.
Beispiel 4
Angewendet auf das obige Beispiel, erh¨ alt man also
D 1 (1902) = D 1 (19, 02) = D 1 (0, 01902) = 1,
D 2 (1902) = D 2 (19, 02) = D 2 (0, 01902) = 9,
D 3 (1902) = D 3 (19, 02) = D 3 (0, 01902) = 0,
D 4 (1902) = D 4 (19, 02) = D 4 (0, 01902) = 2
und
D 1 (1902) = D 1 (0, 01) = D 1 (1, 99) = 1
2.2 Wahrscheinlichkeitsraum
2.2 Wahrscheinlichkeitsraum
F¨ ur das weitere Vorgehen wird ein Wahrscheinlichkeitsraum eingef¨ uhrt.
2.2.1 Grundraum Ω
Als Grundraum wird Ω = R + gew¨ ahlt. R − l¨ asst sich mit Bemerkung 2 in R + ¨ uberf¨ uh-ren.
2.2.2 Mantissen-σ-Algebra M b
Die σ-Algebra ist so zu w¨ ahlen, dass sie alle im Zusammenhang mit signifikanten Zif-fern relevanten Ereignisse enth¨ alt. Als σ-Algebra wird oftmals die Borel-σ-Algebra B
auf dem Grundraum - in diesem Fall R + - gew¨ ahlt. Diese erweist sich jedoch als zu
reichhaltig“. Es muss also eine andere σ-Algebra gefunden werden.
”
Im Folgenden sei b ∈ N \ {1} eine feste Basis. Die Menge der Zahlen, deren erste
signifikante Ziffer 1 ist, kann mit Definition 14 folgendermaßen dargestellt werden:
∞
(b) (b) {x ∈ R + |D e=−∞ 1 (x) = 1} =: {D 1 = 1} =
[1, 2) · b e .
b (B) =
Allgemein erh¨ alt man die Menge M −1
∞
e=−∞
n i=1 i Da sich M b (x) = (b) b i−1 mit Hilfe von {D B · b e mit Borelmenge B ⊆ [1, b), d
in der alle reellen Zahlen enthalten sind, deren Mantisse in B liegt.
(b)
n } n∈N , den Funktionen der signifikanten
Ziffern, darstellen l¨ asst, besteht die M¨ oglichkeit, die interessierenden Ereignisse unter
Verwendung dieser Funktionen zu beschreiben. Außerdem k¨ onnen Wahrscheinlichkeiten
Kapitel 2 Benfords Gesetz
Definition 19 (Mantissen-σ-Algebra) [Hill 1995a]
(b) Die von M b beziehungsweise der Menge der Funktionen der signifikanten Ziffern {D n } n∈N
auf R + erzeugte σ-Algebra ∞
M b =
B · b e f¨ ur alle Borelmengen B ⊆ [1, b)
heißt Mantissen-σ-Algebra zur Basis b.
Bemerkung 8
Als Urbild der Borelmengen B bez¨ uglich der Mantissenfunktionen M b ist M b eine
σ-Algebra.
Bemerkung 9
F¨ ur die Dezimalbasis b = 10 schreibt man statt M 10 kurz M. Bemerkung 10
∞
e=−∞ B · b e erzeugt ganz M b . Deshalb l¨ asst sich auf allen Mengen von M b eindeutig
ein Maß definieren. Die Mantissen-σ-Algebra M b ist eine Sub-σ-Algebra der Borelmengen und es gilt
∞ Bemerkung 11 [Hill 1996] S ∈ M b ⇔ S =
e=−∞
B · b e f¨ ur beliebige Borelmengen B ⊆ [1, b).
M b enth¨ alt tats¨ achlich nicht alle Borelmengen, ist also eine echte Teil-σ-Algebra der
Borelmengen: Beispielsweise das finite Intervall [1, 2) liegt nicht in M b . Diese Borel-
menge l¨ asst sich n¨ amlich nicht eindeutig als Teilmenge von M b darstellen. Bei den
signifikanten Ziffern gibt es schließlich keinen Unterschied zwischen den Zahlen 1 und
10 und somit auch nicht zwischen den Intervallen [1, 2) und [10, 20).
Satz 1 (Eigenschaften von M b ) [Hill 1996]
Die Mantissen-σ-Algebra M b besitzt folgende Eigenschaften:
(i) Jede nichtleere Teilmenge von M b ist unendlich mit den H¨ aufungspunkten 0 und
∞.
(ii) M b ist bez¨ uglich der Skalarmultiplikation im R + abgeschlossen, d.h. f¨ ur ein s > 0
2.2 Wahrscheinlichkeitsraum
1 n ∈ M b ), nicht aber bez¨ uglich der Potenzen. S
(iv) M b ist selbst-¨ ahnlich, d.h. f¨ ur eine Menge S ∈ M b gilt, dass b n S = S f¨ ur alle
n ∈ N ist.
Beweis
(i) Aus Bemerkung 11 folgt, dass die Mengen S ∈ M b unendlich viele disjunkte
Intervalle und somit unendliche viele Elemente enthalten. F¨ ur e → −∞ und
e → ∞ ergeben sich f¨ ur B · b e die H¨ aufungspunkte 0 beziehungsweise ∞.
∞ e=−∞ B · b e f¨ ur alle (ii) Da S ∈ M b ist, gilt wegen Bemerkung 11, dass S =
Borelmengen B ⊆ [1, b) ist. Es gilt also, dass
sS =
Mit Bemerkung 11 folgt somit, dass sS in M b liegt.
Teilen“ bestehen. ¨ (iii) Die Quadratwurzel einer Menge S ∈ M b kann aus zwei ” Ahnli-ches gilt f¨ ur h¨ ohere Wurzeln. Man betrachte beispielsweise die Menge der Zahlen
mit erster signifikanter Ziffer 1
S 1 = {D
e e 1 2 = b f und f¨ ur ungerade e gilt, dass b 2 = b f · b 2 mit f ∈ F¨ ur gerade e gilt b
(−∞, ∞) ist. Also gilt f¨ ur die Quadratwurzel der Menge S 1 ∈ M b :
S
F¨ ur das Quadrat der Menge S 1 ∈ M b gilt allerdings
S 2
∈ M b , da die Exponenten von b nur gerade Zahlen sind. Daher kann S 2
1 nicht wie in
Bemerkung 11 dargestellt werden und ist nicht in M b enthalten. Da die Selbst¨
Ahnlichkeit in (iv) nur f¨ ur ganzzahlige Potenzen von b, nicht aber f¨ ur Wurzeln gilt, kann die Menge S 2
e=−∞ B · b e f¨ ur alle (iv) Da S ∈ M b ist, gilt wegen Bemerkung 11, dass S = 1 auch nicht umgeformt werden.
∞
Kapitel 2 Benfords Gesetz
Borelmengen B ⊆ [1, b) ist. Es gilt also, dass
B · b n · b e f¨ ur alle Borelmengen B ⊆ [1, b) ist.
B · b e ist, folgt, dass b n S = S f¨ ur alle n ∈ N ist. Mit der Mantissen-σ-Algebra M b k¨ onnen alle signifikanten Ziffern eindeutig dargestellt
werden. Der n¨ achste Schritt besteht also darin, auf dem messbaren Raum (R + , M b ) das Benford-Wahrscheinlichkeitsmaß ˜
P zu definieren. 2.2.3 Wahrscheinlichkeitsmaß ˜ P Die folgende Definition gibt eine Verteilungsfunktion f¨ ur Mantissen an. Es wird die
Wahrscheinlichkeit f¨ ur alle x ∈ R + berechnet, deren Mantisse kleiner als m b ist - also f¨ ur die Menge {x ∈ R + |M b (x) < m b } = M −1
b ([1, m b )) ∈ M b f¨ ur alle m b ∈ [1, b). Definition 20 (Benford-Verteilungsfunktion) [Hill 1996, Posch 2004] Die Verteilungsfunktion
˜
F M b (m b ) := ˜
P(M b (x) < m b ) := log b (m b ) f¨ ur alle m b ∈ [1, b) und x ∈ R + heißt Benford-Verteilungsfunktion zur Basis b. Bemerkung 12 Durch ˜
Außerdem gilt F M b (m b ) ist tats¨ achlich eine Verteilungsfunktion definiert. Die Logarithmuslim funktion ist n¨ amlich monoton wachsend, stetig und hat ihre Nullstelle an der Stelle 1.
m b →b
2.2 Wahrscheinlichkeitsraum
Bemerkung 13
Zur Basis 10 gilt entsprechend ˜ F M (m) = ˜ P(M (x) < m) = log 10 (m) f¨ ur alle m ∈
[1, 10).
Bemerkung 14
[1, m b ) · b e erh¨ alt man f¨ ur die Benford-Verteilungsfunktion ˜ F M b (m b ) = ˜
∞
[1, m b ) · b e
= log b (m b ) f¨ ur alle m b ∈ [1, b).
lichkeiten ˜ Definition 21 (Wahrscheinlichkeit f¨ ur D Ausgehend von der Benford-Verteilungsfunktion sollen nun die Benford-Wahrschein- P angegebenwerden. (b)
n ) P(D n = d (b) ˜ (b)
(b) n = d n ) heißt Wahrscheinlichkeit daf¨ ur, dass die n-te signifikante Ziffer
gleich d
P(D
1 = d), dass die erste signifikante Ziffer gleich d ist, wird
auch kurz geschrieben als ˜ P(d).
P(M b (x) = m b ) einer n-ziffrigen Zahl x lassen sich P(D 1 = d 1 , ..., D Bemerkung 16 Die Benford-Wahrscheinlichkeiten ˜ ¨ aquivalent in der Form ˜ (b) (b) (b)
n = d
(b) n ) schreiben.
Satz 2 (Benford-Wahrscheinlichkeit) [Posch 2004]
n = d (b)
(b)
der
n
ersten signifikanten Ziffern
(n
∈
N)
P(D
Die
Benford-Wahrscheinlichkeit
˜
(b)
P
ist gegeben durch die gemeinsame Verteilung
˜ n ) = ˜
d i=1 (b) n
i · b n−i
Quote paper:
Diplom-Mathematikerin Maja Glück, 2007, Die Benford-Verteilung - Anwendung auf reale Daten der Marktforschung, Munich, GRIN Publishing GmbH
This text can be quoted and accessed from this url:
Embed
DOI
Hollywood und Vietnam - Die Bedeutung des Vietnamfilms für die Bildung...
Communications - Media History
Scholarly Paper (Advanced Seminar), 26 Pages
US-amerikanische Kriegsfilme der späten neunziger Jahre, die neueren P...
Communications - Movies and Television
Thesis (M.A.), 106 Pages
Der SDS – Ursachen der Ausgrenzung durch die SPD
Politics - Political Systems - Germany
Scholary Paper (Seminar), 31 Pages
Als die Ökologiebewegung zur Partei 'Die Grünen' wurde
Politics - Political Systems - History
Intermediate Examination Paper, 38 Pages
Maja Glück's text Die Benford-Verteilung - Anwendung auf reale Daten der Marktforschung is now available as a printed book
Maja Glück has published the text Die Benford-Verteilung - Anwendung auf reale Daten der Marktforschung
Maja Glück has uploaded a new text
Erste Briefe / First Letters aus dem Exil 1945-1950
(Un)mögliche Gespräche. Fallbe...
Johannes Evelein, Helga Schreckenberger, Primus H. Kucher
0 comments