Inhaltsangabe
Die vorliegende Arbeit handelt von Benfords Gesetz ¨ uber die Verteilung signifikanter
Ziffern von realen Zahlen und dessen Anwendung in der Marktforschung. Benfords Gesetz besagt kurzgefasst, dass die Anfangsziffern bestimmter Datenmengen nicht gleichverteilt sind, sondern einer logarithmischen Verteilung folgen.
Es werden ein Wahrscheinlichkeitsraum f¨ ur Benfords Gesetz und Formeln f¨ ur die Verteilung der ersten, zweiten und n-ten Ziffer sowie die gemeinsame Verteilung der ersten n Ziffern eingef¨ uhrt. Ferner werden die besonderen Eigenschaften der Benford-Verteilung wie die Skalen- und die Baseninvarianz betrachtet. Als Hauptresultat wird ein Grenzwertsatz f¨ ur signifikante Ziffern angegeben und bewiesen.
Als besondere Anwendungsm¨ oglichkeit wird die Aufdeckung von F¨ alschungen bei Interviews in der Marktforschung betrachtet. Dazu werden die Prozesse der Datenerhebung beleuchtet und Ergebnisse bisheriger Studien vorgestellt. Die verschiedenen in der Marktforschung auftauchenden Datentypen werden analysiert und ihre Eignung als Pr¨ ufgr¨ oßen untersucht. Darauf aufbauend wird ein Programm zum Test auf die Benford-Verteilung vorgestellt und eine m¨ ogliche Testfrage auf Tauglichkeit untersucht.
Danksagung
Die vorliegende Diplomarbeit entstand an der Technischen Universit¨ at Dresden in der Fachrichtung Mathematik am Institut f¨ ur Mathematische Stochastik unter der Betreuung von Prof. Dr. rer. nat. habil. Volker Nollau und Dr. rer. nat. Hans-Otfried M¨ uller. Sie wurde am 14. Februar 2007 eingereicht.
Ich danke allen, die mich bei der Arbeit, ihrer Betreuung, dem Korrekturlesen und ¨ uber
das ganze Studium hinweg unterst¨ utzt haben.
Mein besonderer Dank gilt Herrn Prof. Dr. Nollau und Herrn Dr. M¨ uller, die diese Arbeit fachlich betreut haben. Ferner danke ich Iris Keller, Dr. Hariet K¨ ostner und Uwe Rennschmied vom Marktforschungsinstitut ForschungsWerk GmbH in N¨ urnberg, die mir wertvolle Einblicke in die praktische Arbeit der Marktforschung gew¨ ahrt haben.
iii
Inhaltsverzeichnis
1 Einf uhrung 1
1.1 Geschichtlicher Abriss zu Benfords Gesetz 1
1.2 Erkl arungen f ur Benfords Gesetz 2
1.3 Aufbau der Arbeit 3
1.4 Mathematische Grundlagen 3
2 Benfords Gesetz 6
2.1 Mantissen und signifikante Ziffern 6
2.2 Wahrscheinlichkeitsraum 9
2.2.1 Grundraum Ω 9
2.2.2 Mantissen-σ-Algebra M b 9
2.2.3 Wahrscheinlichkeitsmaß
P 12
2.3 Spezialf alle von Benfords Gesetz 16
2.3.1 Gesetz der ersten Ziffern 16
2.3.2 Gesetz der n-ten Ziffern 17
2.4 Allgemeine Eigenschaften der Benford-Verteilung 19
2.4.1 Konvergenz der Benford-Verteilung 19
2.4.2 Abh angigkeit der Ziffern 22
2.5 Strukturelle Eigenschaften der Benford-Verteilung 24
2.5.1 Skaleninvarianz 24
2.5.2 Baseninvarianz 27
2.6 Grenzwertsatz f ur signifikante Ziffern 33
2.7 Beispiele f ur benford-verteilte Datenmengen 43
2.7.1 Endpreise von Ebay-Auktionen 43
2.7.2 Fibonacci-Zahlen 43
2.7.3 Lucas-Zahlen 44
2.7.4 Hills Datenmengen 44
3 Anwendung von Benfords Gesetz in der Marktforschung 46
3.1 Verschiedene Anwendungsm oglichkeiten 46
3.1.1 Computeroptimierung 46
3.1.2 Plausibilit atstest bei mathematischen Modellen 46
iv
Inhaltsverzeichnis
3.1.3 Steuerfahndung 47
3.1.4 Marktforschung 48
3.2 Datenerhebung in der Marktforschung 48
3.2.1 Stichprobe 49
3.2.2 Pretest 49
3.2.3 Ablauf des Interviews 49
3.2.4 Durchf uhrungsobjektivit at 50
3.2.5 Dispositions 50
3.2.6 Kontaktphase 51
3.2.7 Filterfragen und unfertige Interviews 51
3.2.8 Abh oren und Monitoring 51
3.2.9 Interviewdauer 52
3.2.10 Ausreißer-Pr ufung 52
3.2.11 Telefonische Nachkontrollen 52
3.2.12 Falsche Angaben der Befragten 52
3.3 Datentypen in der Marktforschung 53
3.3.1 Nominal- und Ordinalskalen 53
3.3.2 Intervallskalen 54
3.4 Tests auf die Benford-Verteilung 55
3.4.1 Verschiedene in der Literatur erw ahnte Tests 55
3.4.2 Invarianz-Testverfahren 56
3.4.3 χ 2 -Anpassungstest 58
3.4.4 Programm zum Test auf die Benford-Verteilung 59
3.4.5 Testbeispiele 60
3.4.6 Interpretation von Tests 61
3.5 Ergebnisse bisheriger Studien 62
3.5.1 Judge und Schechter 62
3.5.2 Swanson, Cho und Eltinge 63
3.5.3 Schr apler und Wagner 64
3.6 Tests bei Umfragedaten 65
3.6.1 Daten aus der Literatur 65
3.6.2 Reale Daten 67
4 Zusammenfassung und Ausblick 71
A Programm zur Ermittlung der Ziffernh aufigkeiten 73
B Teilstichproben aus Datensatz 3 79
Literaturverzeichnis 84
v
Kapitel 1
Einf¨ uhrung
1.1 Geschichtlicher Abriss zu Benfords Gesetz
Der Astronom Simon Newcomb ver¨ offentlichte 1881 einen Artikel mit dem Titel ” Note on the Frequency of Use of the Different Digits in Natural Numbers“ [Newcomb 1881]. In diesem Beitrag erl¨ auterte er seine Beobachtung, dass die ersten Seiten von Logarithmen-Tafeln wesentlich schneller abgenutzt sind als die letzten. Er schloss daraus, dass die 1 als erste Ziffer h¨ aufiger vorkomme als die 2, die 2 h¨ aufiger als die 3 und so fort. F¨ ur seine Beobachtung gab er folgende Beschreibung an:
1
P(erste signifikante Ziffer = d) = log 10 1 + , wobei d = 1, 2, ..., 9 ist
d
und
P(zweite signifikante Ziffer = d) =
Diese Entdeckung widerspricht der allgemeinen Ansicht, dass jede Ziffer mit der gleichen Wahrscheinlichkeit - beispielsweise 1 f¨ ur die erste Ziffer bei den Dezimalzahlen
9
- vorkommen sollte. Lange Zeit besch¨ aftigte sich niemand mit diesem Thema. Bekannt wurde es erst, als der Physiker Frank Benford dieselbe Beobachtung in den Logarithmen-Tafeln machte und 1938 fundiert durch eigenes Datenmaterial in dem Artikel ” The law of anomalous numbers“ ver¨ offentlichte [Benford 1938].
Das Gesetz ist heutzutage unter dem Namen ”
kannt. Einige Autoren nennen es auch ” Law), ” Gesetz der ersten Ziffern“ (First Digit Law), ”
1
Kapitel 1 Einf¨ uhrung
(Significant Digit Law) oder ” logarithmisches Gesetz“ (Logarithmic Law).
Anl¨ asslich des 125. Jahrestages von Newcombs Artikel im Jahr 2006 hat Werner H¨ urlimann eine Bibliographie akademischer Arbeiten erstellt, die sich mit Benfords Gesetz besch¨ aftigen [H¨ urlimann 2006]. Allein in dieser nicht ganz vollst¨ andigen Auflistung finden sich ¨ uber 300 Artikel zum Thema.
1.2 Erkl¨ arungen f¨ ur Benfords Gesetz
Manche Datenmengen erf¨ ullen Benfords Gesetz, manche nicht. Selbst bei den von Ben-ford aufgef¨ uhrten Datenmengen gen¨ ugen laut Scott und Fasli [Scott und Fasli 2001] nur etwa die H¨ alfte tats¨ achlich seinem Gesetz. Es gibt eine Reihe von Erkl¨ arungsversuchen, warum und wann Benfords Gesetz gilt.
Eine recht philosophische Hypothese ist, dass die Menge aller Zahlen selbst Benfords
Gesetz folgt, da es eine ”
ver
1963]. Die empirisch beobachteten ¨
Tatsache, dass die untersuchten Zahlenmengen Repr¨ asentanten derselben zugrunde liegenden mystischen Menge aller Zahlen sind. Auch Benford vertrat diese Ansicht.
Raimi [Raimi 1976] gibt eine ¨ Ubersicht ¨ uber verschiedene andere Erkl¨ arungsversuche,
doch Hill [Hill 1995b] kritisiert all diese. Bei den meisten Theorien werden n¨ amlich keine geeigneten Wahrscheinlichkeitsr¨ aume definiert oder es wurden andere falsche Annahmen getroffen.
In Kapitel 2.2 wird deshalb ein geeigneter Wahrscheinlichkeitsraum eingef¨ uhrt, der eine korrekte Darstellung der Benford-H¨ aufigkeiten gestattet. In Kapitel 2.6 wird dann ein Grenzwertsatz angegeben, der besagt, dass eine Mischung aus Datenmengen mit verschiedenen Verteilungen unter bestimmten Voraussetzungen gegen die Benford-Verteilung konvergiert.
2
1.3 Aufbau der Arbeit
1.3 Aufbau der Arbeit
Die Arbeit ist in zwei Teile gegliedert: Der erste Teil (Kap. 2) besch¨ aftigt sich mit der Theorie rund um Benfords Gesetz, der zweite (Kap. 3) bezieht sich auf die Anwendungsm¨ oglichkeiten in der Marktforschung, insbesondere auf die Aufdeckung von F¨ alschungen bei Interviews.
In Kapitel 2.2 wird ein geeigneter Wahrscheinlichkeitsraum eingef¨ uhrt. Darauf aufbauend werden S¨ atze ¨ uber die gemeinsame Verteilung der ersten n Ziffern (Kap. 2.2.3)
sowie f¨ ur die Verteilung der ersten (Kap. 2.3.1), zweiten und n-ten Ziffern (Kap. 2.3.2) angegeben. Zu den besonderen Eigenschaften der Benford-Verteilung geh¨ oren die Abh¨ angigkeit der Ziffern (Kap. 2.4.2), die Konvergenz der Benford-Verteilung gegen die Gleichverteilung (Kap. 2.4.1), die Skalen- und die Baseninvarianz (Kap. 2.5.1 und 2.5.2). In Kapitel 2.6 wird ein Satz hergeleitet, der dem Zentralen Grenzwertsatz ¨ ahnelt. Dieser trifft eine Aussage, unter welchen Bedingungen eine Mischung von Datenmengen benford-verteilt ist. Beispiele f¨ ur benford-verteilte Datenmengen werden in Kapitel 2.7 gegeben.
In Kapitel 3.1 werden verschiedene Anwendungsm¨ oglichkeiten von Benfords Gesetz vorgestellt, wobei n¨ aher auf die Anwendung in der Marktforschung eingegangen wird. Dazu werden zun¨ achst in Kapitel 3.2 die Prozesse bei der Erhebung von Umfragedaten beschrieben und in Kapitel 3.3 die verschiedenen Datentypen vorgestellt. In Kapitel 3.4 werden verschiedene Tests auf die Benford-Verteilung bewertet und ein Programm zum Test auf Benford-Verteilung eingef¨ uhrt (Kap. 3.4.4). Ergebnisse bisheriger Studien zum Thema werden in Kapitel 3.5 pr¨ asentiert. Die Auswertung eigener Tests erfolgt in Kapitel 3.6.
1.4 Mathematische Grundlagen
Folgende Definitionen werden als Grundlagen f¨ ur die eigentliche Arbeit ben¨ otigt.
Definition 1 (R + )
Die Menge der positiven reellen Zahlen ohne Null wird mit R + bezeichnet.
Definition 2 (σ-Algebra auf Ω)
Eine Familie F von Teilmengen einer Menge Ω mit
3
Kapitel 1 Einf¨ uhrung
• Ω ∈ F
• A ∈ F ⇒ ¯ A ∈ F
• A 1 , A 2 , ... ∈ F ⇒
heißt σ-Algebra auf Ω.
Definition 3 (Borel-σ-Algebra und Borel-Mengen auf R + ) [M¨ uller 1991] Die kleinste σ-Algebra von Teilmengen der positiven reellen Zahlen R + , die alle offenen, halboffenen und abgeschlossenen Teilmengen von R + enth¨ alt, heißt Borel-σ-Algebra B des R + . Die Elemente dieser Algebra heißen Borel-Mengen des R + .
Definition 4 (messbarer Raum) [M¨ uller 1991]
Sei Ω eine nichtleere Menge und F eine σ-Algebra von Teilmengen von Ω. Dann heißt das Paar (Ω,F) messbarer Raum.
Definition 5 (Wahrscheinlichkeitsmaß auf R + )
Sei (Ω, F) ein messbarer Raum. Eine auf F definierte Funktion P : A ∈ F → P(A) ∈ [0, 1] mit
• P(Ω) = 1
• A 1 , A 2 , ... ∈ F und A i ∩ A i = ∅ f¨ ur i = i
⇒ P(
heißt Wahrscheinlichkeitsmaß (oder Wahrscheinlichkeit) auf Ω.
Definition 6 (Diskretes Wahrscheinlichkeitsmaß)
Sei {ω i } i∈I mit Ω = i∈I {ω i } und I ⊆ N eine Menge von endlich oder abz¨ ahlbar
vielen Elementarereignissen mit Wahrscheinlichkeiten P ({ω i }) = p i . Ein Wahrscheinlichkeitsmaß mit
p i = 1 i∈I
heißt diskretes Wahrscheinlichkeitsmaß.
Definition 7 (Borel-Wahrscheinlichkeitsmaß)
Sei B die Borel-σ-Algebra. Ein Wahrscheinlichkeitsmaß P B : A ∈ B → P(A) ∈ [0, 1] heißt Borel-Wahrscheinlichkeitsmaß auf Ω.
4
1.4 Mathematische Grundlagen
Definition 8 (atomlos)
Ein Wahrscheinlichkeitsmaß P, f¨ ur das f¨ ur alle messbaren Mengen A mit P(A) > 0 eine messbare Teilmenge B ⊂ A existiert, so dass
P(A) > P(B) > 0 ist,
heißt atomlos.
Definition 9 (Wahrscheinlichkeitsraum) [M¨ uller 1991]
Sei Ω eine nichtleere Menge, F eine σ-Algebra von Teilmengen von Ω und P ein zugeh¨ origes Wahrscheinlichkeitsmaß. Dann heißt das Tripel (Ω, F, P) Wahrscheinlichkeitsraum.
Definition 10 (messbare Funktion) [M¨ uller 1991]
Seien (Ω, F) und (Ω , F ) messbare R¨ aume. Eine Funktion f : Ω → Ω , f¨ ur die gilt, dass das Urbild f −1 (A ) f¨ ur alle A ∈ F in F liegt, heißt (F, F )-messbar.
Definition 11 (Zufallsvariable) [M¨ uller 1991]
Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und (R, B) ein messbarer Raum. Eine Funktion X : Ω → R, f¨ ur die gilt, dass
X −1 (A) = {ω ∈ Ω|X(ω) ∈ A} ∈ F ist f¨ ur alle A ∈ B, (1.1)
heißt Zufallsvariable, kurz ZV.
Definition 12 (i.i.d.)
Eine Folge von Zufallsvariablen {X i } i∈N , die stochastisch unabh¨ angig und identisch verteilt ist, wird als i.i.d. (independent identically distributed) bezeichnet. Dies wird i.i.d. ∼ dargestellt. auch mit dem Symbol
Definition 13 (mathematische Stichprobe)
Sei {X i } i∈N i.i.d.. Dann heißt der Vektor X := (X 1 , X 2 , ..., X n ) mathematische Stichprobe vom Umfang n.
Definition 14
Sei a ∈ R und E ⊂ R + . Es gelten folgende Bezeichnungen:
(i) aE := {ae|e ∈ E}
(ii) a + E := {a + e|e ∈ E}
(iii) E a := {e a |e ∈ E}.
5
Kapitel 2
Benfords Gesetz
2.1 Mantissen und signifikante Ziffern
Benfords Gesetz ist eine Aussage ¨ uber eine Wahrscheinlichkeitsverteilung auf den signifikanten Ziffern von Zahlen. Die tats¨ achliche Gr¨ oße dieser Zahlen spielt bei Benfords Gesetz im Gegensatz zu vielen anderen Verteilungsgesetzen keine Rolle - es geht lediglich um deren Ziffern.
Beispiel 1
Die Zahlen 1902, 19,02 und 0,01902 sind im Sinne von Benfords Gesetz gleich. Die erste signifikante Ziffer ist 1, die zweite 9, die dritte 0 und die vierte 2. Eine Null als f¨ uhrende Ziffer wird ignoriert. Betrachtet man nur die ersten Ziffern, sind die Zahlen 1902, 0,01 und 1,99 in diesem Sinne ebenfalls gleich.
Um mit den signifikanten Ziffern arbeiten zu k¨ onnen, werden die folgenden Definitionen eingef¨ uhrt:
Definition 15 (Mantisse, Basis) [Hill 1995a]
Jede positive reelle Zahl x ∈ R + kann dargestellt werden als
x = m b · b e , wobei e ∈ Z ist.
Dabei heißt die nat¨ urliche Zahl b ∈ N\{1} Basis und die positive reelle Zahl m b ∈ [1, b) Mantisse zur Basis b einer positiven reellen Zahl x.
Bemerkung 1
Die Mantisse m 10 zur Basis 10 wird auch als m bezeichnet.
6
2.1 Mantissen und signifikante Ziffern
Beispiel 2
Die Mantisse f¨ ur x = 1902 = 1, 902 · 10 3 , f¨ ur y = 19, 02 = 1, 902 · 10 1 und f¨ ur z = 0, 01902 = 1, 902 · 10 −2 ist also m = 1, 902.
Bemerkung 2
Eine negative reelle Zahl −x kann auf die gleiche Weise dargestellt werden:
−x = −m b · b e , wobei e ∈ Z ist.
Im Folgenden werden also als Mantissen m b nur positive reelle Zahlen betrachtet.
Bemerkung 3
Da die Mantisse m b auf dem Intervall [1, b) definiert ist, ist die Null als f¨ uhrende Ziffer automatisch ausgeschlossen. Erst ab der zweiten Ziffer kann die Null vorkommen.
Bemerkung 4
Die Darstellung einer positiven reellen Zahl mit unendlicher Ziffernfolge ist nicht notwendig eindeutig. Beispielsweise die Zahl 1, 999.... ˆ =2, 000.... Im Folgenden werden deshalb nur endliche Ziffernfolgen betrachtet.
Definition 16 (Mantissenfunktion) [Hill 1995a]
Sei b ∈ N \ {1} eine Basis. Die Funktion
M b : R + → [1, b)
x → m b ,
die jeder Zahl x ∈ R + ihre Mantisse M b (x) = m b ∈ [1, b) zuordnet, heißt Mantissenfunktion zur Basis b.
Bemerkung 5
Die Mantissenfunktion M 10 zur Basis 10 wird auch als M bezeichnet.
Beispiel 3
M (1902) = M (19, 02) = M (0, 01902) = 1, 902.
Definition 17 (Funktion der signifikanten Ziffern) [Posch 2004] Sei b ∈ N \ {1} eine Basis. Die Funktion
Kapitel 2 Benfords Gesetz
(b)
wobei
(d
n
)
n∈N
die eindeutig bestimmte Folge bezeichnet, f¨ ur die
d
(b)
n
∈ {0,
1, 2,
..., b
−
1}
f¨ ur
n
∈
N
\ {1}
und
M
b
(x) =
d
signifikanten Ziffern zur Basis b.
Bemerkung 6
(10) Die Funktion D der signifikanten Ziffern zur Basis 10 wird auch als D n bezeichnet. n
Definition 18 (n-te signifikante Ziffer) [Posch 2004] (b) (b) n (x) heißt n-te signifikante Ziffer von x zur Basis b ∈ N \ {1}, kurz D D n .
Bemerkung 7
D n (x) steht f¨ ur die n-te signifikante Ziffer von x zur Basis 10.
Beispiel 4
Angewendet auf das obige Beispiel, erh¨ alt man also
D 1 (1902) = D 1 (19, 02) = D 1 (0, 01902) = 1,
D 2 (1902) = D 2 (19, 02) = D 2 (0, 01902) = 9,
D 3 (1902) = D 3 (19, 02) = D 3 (0, 01902) = 0,
D 4 (1902) = D 4 (19, 02) = D 4 (0, 01902) = 2
und
D 1 (1902) = D 1 (0, 01) = D 1 (1, 99) = 1
8
2.2 Wahrscheinlichkeitsraum
2.2 Wahrscheinlichkeitsraum
F¨ ur das weitere Vorgehen wird ein Wahrscheinlichkeitsraum eingef¨ uhrt.
2.2.1 Grundraum Ω
Als Grundraum wird Ω = R + gew¨ ahlt. R − l¨ asst sich mit Bemerkung 2 in R + ¨ uberf¨ uhren.
2.2.2 Mantissen-σ-Algebra M b
Die σ-Algebra ist so zu w¨ ahlen, dass sie alle im Zusammenhang mit signifikanten Ziffern relevanten Ereignisse enth¨ alt. Als σ-Algebra wird oftmals die Borel-σ-Algebra B auf dem Grundraum - in diesem Fall R + - gew¨ ahlt. Diese erweist sich jedoch als zu reichhaltig“. Es muss also eine andere σ-Algebra gefunden werden.
”
Im Folgenden sei b ∈ N \ {1} eine feste Basis. Die Menge der Zahlen, deren erste signifikante Ziffer 1 ist, kann mit Definition 14 folgendermaßen dargestellt werden:
(b) {x ∈ R + |D 1 (x) = 1} =: {D
Allgemein erh¨ alt man die Menge
M −1 b (B) =
in der alle reellen Zahlen enthalten sind, deren Mantisse in B liegt.
(b) d (b) n b i−1 mit Hilfe von {D n } n∈N , den Funktionen der signifikanten Da sich M b (x) = i
i=1
Ziffern, darstellen l¨ asst, besteht die M¨ oglichkeit, die interessierenden Ereignisse unter Verwendung dieser Funktionen zu beschreiben. Außerdem k¨ onnen Wahrscheinlichkeiten auf diesen Ereignissen vorgegeben werden.
9
Kapitel 2 Benfords Gesetz
Definition 19 (Mantissen-σ-Algebra) [Hill 1995a]
(b)
Die von
M
b
beziehungsweise der Menge der Funktionen der signifikanten Ziffern
{D
n
}
n∈N
auf
R
+
erzeugte
σ-Algebra
M b =
heißt Mantissen-σ-Algebra zur Basis b.
Bemerkung 8
Als Urbild der Borelmengen B bez¨ uglich der Mantissenfunktionen M b ist M b eine σ-Algebra.
Bemerkung 9
F¨ ur die Dezimalbasis b = 10 schreibt man statt M 10 kurz M.
Bemerkung 10
∞ e=−∞ B · b e erzeugt ganz M b . Deshalb l¨ asst sich auf allen Mengen von M b eindeutig ein Maß definieren.
Bemerkung 11 [Hill 1996]
Die Mantissen-σ-Algebra M b ist eine Sub-σ-Algebra der Borelmengen und es gilt
S ∈ M b ⇔ S =
M b enth¨ alt tats¨ achlich nicht alle Borelmengen, ist also eine echte Teil-σ-Algebra der Borelmengen: Beispielsweise das finite Intervall [1, 2) liegt nicht in M b . Diese Borelmenge l¨ asst sich n¨ amlich nicht eindeutig als Teilmenge von M b darstellen. Bei den signifikanten Ziffern gibt es schließlich keinen Unterschied zwischen den Zahlen 1 und 10 und somit auch nicht zwischen den Intervallen [1, 2) und [10, 20).
Satz 1 (Eigenschaften von M b ) [Hill 1996]
Die Mantissen-σ-Algebra M b besitzt folgende Eigenschaften:
(i) Jede nichtleere Teilmenge von M b ist unendlich mit den H¨ aufungspunkten 0 und ∞.
(ii) M b ist bez¨ uglich der Skalarmultiplikation im R + abgeschlossen, d.h. f¨ ur ein s > 0 und eine Menge S ∈ M b gilt, dass sS ∈ M b ist.
(iii) M b ist abgeschlossen bez¨ uglich der ganzzahligen Wurzeln (n ∈ N, S ∈ M b ⇒
10
2.2 Wahrscheinlichkeitsraum
1 n ∈ M b ), nicht aber bez¨ uglich der Potenzen. S
(iv) M b ist selbst-¨ ahnlich, d.h. f¨ ur eine Menge S ∈ M b gilt, dass b n S = S f¨ ur alle n ∈ N ist.
Beweis
(i) Aus Bemerkung 11 folgt, dass die Mengen S ∈ M b unendlich viele disjunkte Intervalle und somit unendliche viele Elemente enthalten. F¨ ur e → −∞ und e → ∞ ergeben sich f¨ ur B · b e die H¨ aufungspunkte 0 beziehungsweise ∞.
∞ e=−∞ B · b e f¨ ur alle (ii) Da S ∈ M b ist, gilt wegen Bemerkung 11, dass S = Borelmengen B ⊆ [1, b) ist. Es gilt also, dass
Mit Bemerkung 11 folgt somit, dass sS in M b liegt.
Teilen“ bestehen. ¨ (iii) Die Quadratwurzel einer Menge S ∈ M b kann aus zwei ” Ahnliches gilt f¨ ur h¨ ohere Wurzeln. Man betrachte beispielsweise die Menge der Zahlen mit erster signifikanter Ziffer 1
F¨ ur gerade e gilt b
(−∞, ∞) ist. Also gilt f¨ ur die Quadratwurzel der Menge S 1 ∈ M b :
F¨ ur das Quadrat der Menge S 1 ∈ M b gilt allerdings
da die Exponenten von b nur gerade Zahlen sind. Daher kann S 2 1 nicht wie in
Bemerkung 11 dargestellt werden und ist nicht in M b enthalten. Da die Selbst¨ Ahnlichkeit in (iv) nur f¨ ur ganzzahlige Potenzen von b, nicht aber f¨ ur Wurzeln gilt, kann die Menge S 2 1 auch nicht umgeformt werden.
∞ e=−∞ B · b e f¨ ur alle (iv) Da S ∈ M b ist, gilt wegen Bemerkung 11, dass S =
11
Kapitel 2 Benfords Gesetz
Borelmengen B ⊆ [1, b) ist. Es gilt also, dass
Da die Menge
folgt, dass b n S = S f¨ ur alle n ∈ N ist.
Mit der Mantissen-σ-Algebra M b k¨ onnen alle signifikanten Ziffern eindeutig dargestellt werden. Der n¨ achste Schritt besteht also darin, auf dem messbaren Raum (R + , M b ) das Benford-Wahrscheinlichkeitsmaß ˜ P zu definieren.
2.2.3 Wahrscheinlichkeitsmaß ˜ P
Die folgende Definition gibt eine Verteilungsfunktion f¨ ur Mantissen an. Es wird die Wahrscheinlichkeit f¨ ur alle x ∈ R + berechnet, deren Mantisse kleiner als m b ist - also f¨ ur die Menge {x ∈ R + |M b (x) < m b } = M −1 b ([1, m b )) ∈ M b f¨ ur alle m b ∈ [1, b).
Definition 20 (Benford-Verteilungsfunktion) [Hill 1996, Posch 2004] Die Verteilungsfunktion
˜ F M b (m b ) := ˜ P(M b (x) < m b ) := log b (m b ) f¨ ur alle m b ∈ [1, b) und x ∈ R +
heißt Benford-Verteilungsfunktion zur Basis b.
Bemerkung 12
Durch ˜ F M b (m b ) ist tats¨ achlich eine Verteilungsfunktion definiert. Die Logarithmusfunktion ist n¨ amlich monoton wachsend, stetig und hat ihre Nullstelle an der Stelle 1. Außerdem gilt
˜ lim F M b (m b ) = log b (b) = 1.
m b →b
12
2.2 Wahrscheinlichkeitsraum
Bemerkung 13
Zur Basis 10 gilt entsprechend ˜ F M (m) = ˜ P(M (x) < m) = log 10 (m) f¨ ur alle m ∈ [1, 10).
Bemerkung 14
˜ F M b (m b ) = ˜ P(M b (x) < m b ) = ˜
Ausgehend von der Benford-Verteilungsfunktion sollen nun die Benford-Wahrscheinlichkeiten ˜ P angegeben werden.
Definition 21 (Wahrscheinlichkeit f¨ ur
D
(b) ˜ P(D n = d (b) gleich d n ist.
Bemerkung 15
Die Wahrscheinlichkeit ˜
P(D
auch kurz geschrieben als ˜
Bemerkung 16
Die Benford-Wahrscheinlichkeiten ˜
¨ aquivalent in der Form ˜ P(D
Satz 2 (Benford-Wahrscheinlichkeit) [Posch 2004]
Die Benford-Wahrscheinlichkeit ˜ P ist gegeben durch die gemeinsame Verteilung der n ersten signifikanten Ziffern (n ∈ N)
(b) ˜ P(D 1 = d
(b) (b) 1 ∈ {1, 2, ..., b − 1} und d j ∈ {0, 1, 2, ..., b − 1} f¨ ur j = 2, ..., n. mit d
13
Arbeit zitieren:
Diplom-Mathematikerin Maja Glück, 2007, Die Benford-Verteilung - Anwendung auf reale Daten der Marktforschung, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Hollywood und Vietnam - Die Bedeutung des Vietnamfilms für die Bildung...
Medien / Kommunikation - Mediengeschichte
Hausarbeit (Hauptseminar), 26 Seiten
US-amerikanische Kriegsfilme der späten neunziger Jahre, die neueren P...
Medien / Kommunikation - Film und Fernsehen
Magisterarbeit, 106 Seiten
Der SDS – Ursachen der Ausgrenzung durch die SPD
Politik - Politische Systeme - Politisches System Deutschlands
Seminararbeit, 31 Seiten
Als die Ökologiebewegung zur Partei 'Die Grünen' wurde
Politik - Politische Systeme - Historisches
Zwischenprüfungsarbeit, 38 Seiten
Maja Glück's Text Die Benford-Verteilung - Anwendung auf reale Daten der Marktforschung ist nun auf dem Buchmarkt erhältlich
Maja Glück hat den Text Die Benford-Verteilung - Anwendung auf reale Daten der Marktforschung veröffentlicht
Maja Glück hat einen neuen Text hochgeladen
0 Kommentare