Register or log in at GRIN

Your e-mail-address or password is wrong
Register now
For new authors: free, easy and fast
This will be used as your user name, please specify a valid e-mail address

Lost password

Your e-mail-address or password is wrong

Request a new password
Die Benford-Verteilung - Anwendung auf reale Daten der Marktforschung close

Please wait

Please install the Adobe Flash Player if no e-book is displayed.

Die Benford-Verteilung - Anwendung auf reale Daten der Marktforschung

Diploma Thesis, 2007, 93 Pages
Author: Diplom-Mathematikerin Maja Glück
Subject: Mathematics - Stochastics

Details

Category: Diploma Thesis
Year: 2007
Pages: 93
Grade: 1,0
Bibliography: ~ 28  Entries
Language: German
Archive No.: V111955
ISBN (E-book): 978-3-640-09841-5
ISBN (Book): 978-3-640-09937-5
File size: 1029 KB
Notes :
Die vorliegende Diplomarbeit entstand an der Technischen Universität Dresden in der Fachrichtung Mathematik am Institut für Mathematische Stochastik unter der Betreuung von Prof. Dr. rer. nat. habil. Volker N. und Dr. rer. nat. Hans-Otfried M.. Sie wurde am 14. Februar 2007 eingereicht. Aus dem Gutachten von Prof. Dr. N.: "Die vorliegende Arbeit stellt die bekannten Resultate, deren Formulierung mathematisch sehr anspruchsvoll ist, in übersichtlicher und konsequenter Weise dar, zumal dieser Verteilungstyp in der Standard-Literatur der Stochastik de facto nicht behandelt wird."


Abstract

Die vorliegende Arbeit handelt von Benfords Gesetz über die Verteilung signifikanter Ziffern von realen Zahlen und dessen Anwendung in der Marktforschung. Benfords Gesetz besagt kurzgefasst, dass die Anfangsziffern bestimmter Datenmengen nicht gleichverteilt sind, sondern einer logarithmischen Verteilung folgen. Es werden ein Wahrscheinlichkeitsraum für Benfords Gesetz und Formeln für die Verteilung der ersten, zweiten und n-ten Ziffer sowie die gemeinsame Verteilung der ersten n Ziffern eingeführt. Ferner werden die besonderen Eigenschaften der Benford-Verteilung wie die Skalen- und die Baseninvarianz betrachtet. Als Hauptresultat wird ein Grenzwertsatz für signifikante Ziffern angegeben und bewiesen. Als besondere Anwendungsmöglichkeit wird die Aufdeckung von Fälschungen bei Interviews in der Marktforschung betrachtet. Dazu werden die Prozesse der Datenerhebung beleuchtet und Ergebnisse bisheriger Studien vorgestellt. Die verschiedenen in der Marktforschung auftauchenden Datentypen werden analysiert und ihre Eignung als Prüfgrößen untersucht. Darauf aufbauend wird ein Programm zum Test auf die Benford-Verteilung vorgestellt und eine mögliche Testfrage auf Tauglichkeit untersucht.


Excerpt (computer-generated)

Maja Irene Susanne Gl¨

uck

Die Benford-Verteilung

Anwendung auf reale Daten der Marktforschung



Inhaltsangabe

Die vorliegende Arbeit handelt von Benfords Gesetz ¨

uber die Verteilung signifikanter

Ziffern von realen Zahlen und dessen Anwendung in der Marktforschung. Benfords Ge-

setz besagt kurzgefasst, dass die Anfangsziffern bestimmter Datenmengen nicht gleich-

verteilt sind, sondern einer logarithmischen Verteilung folgen.

Es werden ein Wahrscheinlichkeitsraum f¨

ur Benfords Gesetz und Formeln f¨

ur die Vertei-

lung der ersten, zweiten und n-ten Ziffer sowie die gemeinsame Verteilung der ersten n

Ziffern eingef¨

uhrt. Ferner werden die besonderen Eigenschaften der Benford-Verteilung

wie die Skalen- und die Baseninvarianz betrachtet. Als Hauptresultat wird ein Grenz-

wertsatz f¨

ur signifikante Ziffern angegeben und bewiesen.

Als besondere Anwendungsm¨

oglichkeit wird die Aufdeckung von F¨

alschungen bei In-

terviews in der Marktforschung betrachtet. Dazu werden die Prozesse der Datenerhe-

bung beleuchtet und Ergebnisse bisheriger Studien vorgestellt. Die verschiedenen in

der Marktforschung auftauchenden Datentypen werden analysiert und ihre Eignung

als Pr¨

ufgr¨

oßen untersucht. Darauf aufbauend wird ein Programm zum Test auf die

Benford-Verteilung vorgestellt und eine m¨

ogliche Testfrage auf Tauglichkeit untersucht.

Danksagung

Die vorliegende Diplomarbeit entstand an der Technischen Universit¨

at Dresden in der

Fachrichtung Mathematik am Institut f¨

ur Mathematische Stochastik unter der Betreu-

ung von Prof. Dr. rer. nat. habil. Volker Nollau und Dr. rer. nat. Hans-Otfried M¨

uller.

Sie wurde am 14. Februar 2007 eingereicht.

Ich danke allen, die mich bei der Arbeit, ihrer Betreuung, dem Korrekturlesen und ¨

uber

das ganze Studium hinweg unterst¨

utzt haben.

Mein besonderer Dank gilt Herrn Prof. Dr. Nollau und Herrn Dr. M¨

uller, die diese

Arbeit fachlich betreut haben. Ferner danke ich Iris Keller, Dr. Hariet K¨

ostner und Uwe

Rennschmied vom Marktforschungsinstitut ForschungsWerk GmbH in N¨

urnberg, die

mir wertvolle Einblicke in die praktische Arbeit der Marktforschung gew¨

ahrt haben.

iii


Inhaltsverzeichnis

1

Einf¨

uhrung

1

1.1

Geschichtlicher Abriss zu Benfords Gesetz .

1

1.2

Erkl¨

arungen f¨

ur Benfords Gesetz

.

2

1.3

Aufbau der Arbeit

.

3

1.4

Mathematische Grundlagen

.

3

2

Benfords Gesetz

6

2.1

Mantissen und signifikante Ziffern .

6

2.2

Wahrscheinlichkeitsraum .

9

2.2.1

Grundraum .

9

2.2.2

Mantissen--Algebra Mb .

9

2.2.3

Wahrscheinlichkeitsmaß ~

P .

12

2.3

Spezialf¨

alle von Benfords Gesetz

.

16

2.3.1

Gesetz der ersten Ziffern .

16

2.3.2

Gesetz der n-ten Ziffern

.

17

2.4

Allgemeine Eigenschaften der Benford-Verteilung

.

19

2.4.1

Konvergenz der Benford-Verteilung .

19

2.4.2

Abh¨

angigkeit der Ziffern .

22

2.5

Strukturelle Eigenschaften der Benford-Verteilung .

24

2.5.1

Skaleninvarianz .

24

2.5.2

Baseninvarianz .

27

2.6

Grenzwertsatz f¨

ur signifikante Ziffern .

33

2.7

Beispiele f¨

ur benford-verteilte Datenmengen .

43

2.7.1

Endpreise von Ebay-Auktionen .

43

2.7.2

Fibonacci-Zahlen .

43

2.7.3

Lucas-Zahlen .

44

2.7.4

Hills Datenmengen .

44

3

Anwendung von Benfords Gesetz in der Marktforschung

46

3.1

Verschiedene Anwendungsm¨

oglichkeiten .

46

3.1.1

Computeroptimierung

.

46

3.1.2

Plausibilit¨

atstest bei mathematischen Modellen .

46

iv


Inhaltsverzeichnis

3.1.3

Steuerfahndung .

47

3.1.4

Marktforschung .

48

3.2

Datenerhebung in der Marktforschung

.

48

3.2.1

Stichprobe .

49

3.2.2

Pretest .

49

3.2.3

Ablauf des Interviews .

49

3.2.4

Durchf¨

uhrungsobjektivit¨

at .

50

3.2.5

Dispositions .

50

3.2.6

Kontaktphase .

51

3.2.7

Filterfragen und unfertige Interviews .

51

3.2.8

Abh¨

oren und Monitoring .

51

3.2.9

Interviewdauer

.

52

3.2.10 Ausreißer-Pr¨

ufung

.

52

3.2.11 Telefonische Nachkontrollen .

52

3.2.12 Falsche Angaben der Befragten .

52

3.3

Datentypen in der Marktforschung

.

53

3.3.1

Nominal- und Ordinalskalen .

53

3.3.2

Intervallskalen .

54

3.4

Tests auf die Benford-Verteilung .

55

3.4.1

Verschiedene in der Literatur erw¨

ahnte Tests .

55

3.4.2

Invarianz-Testverfahren .

56

3.4.3

2-Anpassungstest .

58

3.4.4

Programm zum Test auf die Benford-Verteilung .

59

3.4.5

Testbeispiele .

60

3.4.6

Interpretation von Tests .

61

3.5

Ergebnisse bisheriger Studien

.

62

3.5.1

Judge und Schechter .

62

3.5.2

Swanson, Cho und Eltinge .

63

3.5.3

Schr¨

apler und Wagner .

64

3.6

Tests bei Umfragedaten

.

65

3.6.1

Daten aus der Literatur

.

65

3.6.2

Reale Daten .

67

4

Zusammenfassung und Ausblick

71

A Programm zur Ermittlung der Ziffernh¨

aufigkeiten

73

B Teilstichproben aus Datensatz 3

79

Literaturverzeichnis

84

v



Kapitel 1

Einf¨

uhrung

1.1 Geschichtlicher Abriss zu Benfords Gesetz

Der Astronom Simon Newcomb ver¨

offentlichte 1881 einen Artikel mit dem Titel No-

"

te on the Frequency of Use of the Different Digits in Natural Numbers" [Newcomb

1881]. In diesem Beitrag erl¨

auterte er seine Beobachtung, dass die ersten Seiten von

Logarithmen-Tafeln wesentlich schneller abgenutzt sind als die letzten. Er schloss dar-

aus, dass die 1 als erste Ziffer h¨

aufiger vorkomme als die 2, die 2 h¨

aufiger als die 3 und

so fort. F¨

ur seine Beobachtung gab er folgende Beschreibung an:

1

P(erste signifikante Ziffer = d) = log10 1 +

, wobei d = 1, 2, ..., 9 ist

d

und

9

P(zweite signifikante Ziffer = d) =

log10(1+(10k +d)-1), wobei d = 0, 1, 2, ..., 9.

k=1

Diese Entdeckung widerspricht der allgemeinen Ansicht, dass jede Ziffer mit der glei-

chen Wahrscheinlichkeit - beispielsweise 1 f¨

ur die erste Ziffer bei den Dezimalzahlen

9

- vorkommen sollte. Lange Zeit besch¨

aftigte sich niemand mit diesem Thema. Be-

kannt wurde es erst, als der Physiker Frank Benford dieselbe Beobachtung in den

Logarithmen-Tafeln machte und 1938 fundiert durch eigenes Datenmaterial in dem

Artikel The law of anomalous numbers" ver¨

offentlichte [

"

Benford 1938].

Das Gesetz ist heutzutage unter dem Namen Benfords Gesetz" (Benford′s Law) be-

"

kannt. Einige Autoren nennen es auch Newcomb-Benford-Gesetz" (Newcomb-Benford-

"

Law), Gesetz der ersten Ziffern" (First Digit Law), Gesetz der signifikanten Ziffern"

"

"

1


Kapitel 1 Einf¨

uhrung

(Significant Digit Law) oder logarithmisches Gesetz" (Logarithmic Law).

"

Anl¨

asslich des 125. Jahrestages von Newcombs Artikel im Jahr 2006 hat Werner H¨

ur-

limann eine Bibliographie akademischer Arbeiten erstellt, die sich mit Benfords Gesetz

besch¨

aftigen [H¨

urlimann 2006]. Allein in dieser nicht ganz vollst¨

andigen Auflistung

finden sich ¨

uber 300 Artikel zum Thema.

1.2 Erkl¨

arungen f¨

ur Benfords Gesetz

Manche Datenmengen erf¨

ullen Benfords Gesetz, manche nicht. Selbst bei den von Ben-

ford aufgef¨

uhrten Datenmengen gen¨

ugen laut Scott und Fasli [Scott und Fasli 2001]

nur etwa die H¨

alfte tats¨

achlich seinem Gesetz. Es gibt eine Reihe von Erkl¨

arungsver-

suchen, warum und wann Benfords Gesetz gilt.

Eine recht philosophische Hypothese ist, dass die Menge aller Zahlen selbst Benfords

Gesetz folgt, da es eine eingebaute Charakteristik unseres Zahlensystems" sei [

"

Wea-

ver 1963]. Die empirisch beobachteten ¨

Ubereinstimmungen ergeben sich also aus der

Tatsache, dass die untersuchten Zahlenmengen Repr¨

asentanten derselben zugrunde lie-

genden mystischen Menge aller Zahlen sind. Auch Benford vertrat diese Ansicht.

Raimi [Raimi 1976] gibt eine ¨

Ubersicht ¨

uber verschiedene andere Erkl¨

arungsversuche,

doch Hill [Hill 1995b] kritisiert all diese. Bei den meisten Theorien werden n¨amlich

keine geeigneten Wahrscheinlichkeitsr¨

aume definiert oder es wurden andere falsche An-

nahmen getroffen.

In Kapitel 2.2 wird deshalb ein geeigneter Wahrscheinlichkeitsraum eingef¨

uhrt, der eine

korrekte Darstellung der Benford-H¨

aufigkeiten gestattet. In Kapitel 2.6 wird dann ein

Grenzwertsatz angegeben, der besagt, dass eine Mischung aus Datenmengen mit ver-

schiedenen Verteilungen unter bestimmten Voraussetzungen gegen die Benford-Verteilung

konvergiert.

2


1.3 Aufbau der Arbeit

1.3 Aufbau der Arbeit

Die Arbeit ist in zwei Teile gegliedert: Der erste Teil (Kap. 2) besch¨

aftigt sich mit

der Theorie rund um Benfords Gesetz, der zweite (Kap. 3) bezieht sich auf die An-

wendungsm¨

oglichkeiten in der Marktforschung, insbesondere auf die Aufdeckung von

alschungen bei Interviews.

In Kapitel 2.2 wird ein geeigneter Wahrscheinlichkeitsraum eingef¨

uhrt. Darauf aufbau-

end werden S¨

atze ¨

uber die gemeinsame Verteilung der ersten n Ziffern (Kap. 2.2.3)

sowie f¨

ur die Verteilung der ersten (Kap. 2.3.1), zweiten und n-ten Ziffern (Kap. 2.3.2)

angegeben. Zu den besonderen Eigenschaften der Benford-Verteilung geh¨

oren die Ab-

angigkeit der Ziffern (Kap. 2.4.2), die Konvergenz der Benford-Verteilung gegen die

Gleichverteilung (Kap. 2.4.1), die Skalen- und die Baseninvarianz (Kap. 2.5.1 und 2.5.2).

In Kapitel 2.6 wird ein Satz hergeleitet, der dem Zentralen Grenzwertsatz ¨

ahnelt. Die-

ser trifft eine Aussage, unter welchen Bedingungen eine Mischung von Datenmengen

benford-verteilt ist. Beispiele f¨

ur benford-verteilte Datenmengen werden in Kapitel 2.7

gegeben.

In Kapitel 3.1 werden verschiedene Anwendungsm¨

oglichkeiten von Benfords Gesetz

vorgestellt, wobei n¨

aher auf die Anwendung in der Marktforschung eingegangen wird.

Dazu werden zun¨

achst in Kapitel 3.2 die Prozesse bei der Erhebung von Umfragedaten

beschrieben und in Kapitel 3.3 die verschiedenen Datentypen vorgestellt. In Kapitel

3.4 werden verschiedene Tests auf die Benford-Verteilung bewertet und ein Programm

zum Test auf Benford-Verteilung eingef¨

uhrt (Kap. 3.4.4). Ergebnisse bisheriger Studien

zum Thema werden in Kapitel 3.5 pr¨

asentiert. Die Auswertung eigener Tests erfolgt in

Kapitel 3.6.

1.4 Mathematische Grundlagen

Folgende Definitionen werden als Grundlagen f¨

ur die eigentliche Arbeit ben¨

otigt.

Definition 1 (R+)

Die Menge der positiven reellen Zahlen ohne Null wird mit R+ bezeichnet.

Definition 2 (-Algebra auf )

Eine Familie F von Teilmengen einer Menge mit

3



Comments

No comments yet

Add Comment
Your comment is reviewed before being published

Other users also were interested in the following titles:

Erstellen einer schriftlichen Hausarbeit

Author: Claudia Nickel
Presentations, Models, Tutorials, Instructions, 2006 Download as PDF-file for 4,99 EUR

Grundtechniken wissenschaftlichen Arbeitens

Author: Maik Philipp
Presentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR

This text can be quoted and accessed from this url:

http://www.grin.com/e-book/111955/die-benford-verteilung-anwendung-auf-reale-daten-der-marktforschung
please wait Please wait