Bitte warten
Bitte installieren Sie den Flash Player, wenn kein E-Book erscheint.
Autor: Dirk Lange
Fach: Informatik - Theoretische Inf.
Details
Tags: Häufigkeitsverteilung
Jahr: 2001
Seiten: 25
Note: ohne Bewer
Sprache: Deutsch
Dateigröße: 154 KB
ISBN (E-Book): 978-3-640-00322-8
Vorlesungsmitschrift mit vielen Beispielen und Grafiken
Volltext (computergeneriert)
Statistik A - Internationales Management
1
10.10.00
Merkmale
Quantitative Merkmale
Qualitative Merkmale
diskrete Merkmale
stetige Merkmale
Sozialstruktur von
Haushalten
- Menge der nat. Zahlen
- alle reellen Zahlen R
- z.B. alle Landwirte,
- z.B. Personen, Autos, ...
- z.B. Meter, Längen
Arbeiter, Rentner,
- Gewichte, Zeiteinh.
Selbstständige, ...
dd
- Einkommen, ...
1.4 Die statistische Erhebung
Erhebungsarten: Erfassen des Urmaterials ( Daten liegen noch nicht vor)
Umfang des Urmaterials ( Daten liegen bereits vor)
Erhebung
Primärstatistik
Sekundärstatistik
Das statistische Material wird nur für
Das statistische Material wurde
eine statistische Untersuchung erhoben.
bereits erfaßt und liegt in Form von
Nachteil: hoher Kosten/Zeitaufwand
Statistiken vor.
Vorteil: entspricht der Zielsetzung
Vorteil: geringer Kosten/Zeitaufwand
Nachteil: Daten sind allgemein
Statistik A - Internationales Management
2
2.
Eindimensionale empirische Häufigkeitsverteilung
Die Zuordnung von Häufigkeiten zu den Merkmalsausprägungen
2.1 ... qualitative Merkmale
Beispiel: Private Haushalte im Landkreis Fulda, strukturiert nach ihrer
sozialen Stellung (in Tsd)
a) Häufigkeitstabelle
Ausprägung des Merkmals absolute Häufigkeiten relative Häufigkeiten
"soziale Stellung" Ai
n(Ai) = ni
hi = ni / n
Landwirt
8
0,0388 = 0,04
Selbstständig
16
0,08
Beamter
12
0,06
Angestellter
36
0,17
Arbeiter
63
0,31
nicht erwerbstätig
71
0,34
206
1,00
6
Häufigk.-verteilung
n = Summe
n
Summe immer = 1
i
i
=1
b) Häufigkeitsverteilung
n
(
A
)
n
= Gesamtheit der relativen Häufigkeiten
i
i
h
(
A
) =
=
=
h
i
i
n
n
c) graphische Darstellung
als Kreisdiagramm, Berechnung der Winkel: 4% = x°, 100% = 360°
Landwirt
4%
Selbstständig
8%
Beamter
nicht erwerbstätig
6%
34%
Angestellter
17%
Soziale Stellung im LK Fulda
Arbeiter
31%
Statistik A - Internationales Management
3
2.2 ... diskrete Merkmale
Beispiel: Größe der untersuchten Haushalte im Landkreis Fulda,
gemessen an der Personenanzahl (in Tsd)
a) Häufigkeitstabelle
Merkmalswert absolute Häufigkeiten relative Häufigkeiten
Verteilungsfkt.
xi
n(xi) = ni
hi = ni / n
F(xi)
1
48
0,233 = 0,23
0,23
2
60
0,29
0,52
3
41
0,20
0,72
4
32
0,16
0,88
5 und mehr
25
0,12
1,00
206
1,00
5
Häufigkeitsverteilung
Verteilungs-
n = Summe
n
Summe immer = 1
funktion
i
i
=1
(= fester Begriff)
n
(
x
)
n
b) Häufigkeitsverteilung =
i
i
h
(
x
) =
=
=
h
i
i
n
n
Interpretation: 23% aller untersuchten Haushalte waren zum Zeitpunkt
der Erhebung 1-Personen-Haushalte.
c) Verteilungsfunktion = akkumulierte relative Häufigkeiten
x
x n
F
(
xi
) =
hi
=
i
i
1
1
n
=
i
=
Interpretation: 52% aller untersuchten Haushalte waren zum Zeitpunkt
der Untersuchung 1- und 2-Personen-haushalte oder in 52% aller
untersuchten Haushalte wohnten weniger als 3 Personen, oder in 48%
aller untersuchten Haushalte wohnten mehr als 2 Personen.
d) graphische Darstellung
1) Häufigkeitsverteilung
F(x) 2) Verteilungsfunktion
hi
(Stabdiagramm; nicht verbinden
1,0
(Treppenfunktion
0,4
da diskrete Merkmale)
0,75
0,3
0,5
0,2
0,25
0,1
xi
xi
1
2
3
4
5
1
2
3
4
5
Statistik A - Internationales Management
4
2.3 ... stetige Merkmale
16.10.00
Voraussetzung: Klassenbildung
Kriterien:
a) möglichst gleich große Klassen bilden
b) Anzahl der Klassen unter 15, K <= 15
c) Der häufigste Wert sollte in der Klassenmitte liegen
d) Die Klassen müssen disjunkt sein (genau zuzuordnen)
z.B.: K1 = 800 bis 1000 (800 < x < 1000) und K2 = (1000 < x < 1200)
ist nicht disjunkt, da der Wert 1000 nicht zuzuordnen ist (nur wenn <=)
Probleme: Die Verteilung der Merkmale innerhalb einer Klasse ist
unbekannt (= Annahme: Gleichverteilung) oder die Klassen sind evtl.
vorgegeben.
Häufigkeitstabelle:
z.B.: Monate, Nettoeinkommen der Ehefrauen
xu
Klassenuntergrenze
xo
Klassenobe
i
rgrenze
i
u
o
n
n
x
x
x
ni
h
i
i
F
(
o
x
)
f
(
x
) =
i
i
i
i
=
i
n
i
n
xi
200 bis 600
30
0,145
0,145
0,0003625
600 bis 800
21
0,102
0,247 %
25
0,0005100
800 bis 1000
24
0,117
0,364
0,0005850
1000 bis 1200
26
0,126
0,490
0,0006300
Modus
1200 bis 1500
34
0,165
0,655 75%
0,0005500
1500 bis 1800
24
0,117
0,772
0,0003900
1800 bis 2500
29
0,141
0,913
0,0002014
2500 bis 10000
18
0,087
1,000
0,0000115
n = 206
1,00
relative
Verteilungs-
Dichtefunktion
Häufigkeits-
funktion
Klassenvergleich
verteilung
Interpretation:
zur Häufigkeitsverteilung: 10,2% aller befragten Ehefrauen hatten zum Zeit-
punkt der Erhebung ein monatliches Nettoeinkommen zwischen 600 DM und
800 DM. (Wert 0,102 bei hi in der 2. Klassen)
zur Verteilungsfunktion: 49% aller befragten Ehefrauen hatten ein monatliches
Nettoeinkommen von unter 1200 DM.
Statistik A - Internationales Management
5
Graphische Darstellung
16.10.00
Die Häufigkeitsverteilung quantitativ-stetiger Merkmale sind als Histogramm
dargestellt.
f(xi)
n
f
(
x
)
x
i
i
i
=
n
h
n
i
i
f
(
x
)
i
=
n
x
i
Dichtefunktion, nur Berechnung
x
600
800
bei unterschiedlich großen
xi
Klassenbreiten
Histogramm
eine offene Klasse muß
geschlossen werden,
f(xi)
egal wo.
Dichtefunktion
DM
200 600 800 1000 1200 1500 1800 2500 10000
f(xi)
Verteilungsfunktion
Polygon
DM
Statistik A - Internationales Management
6
Berechnung von Anteilen für Werte innerhalb einer Klasse
16.10.00
z.B.: Berechnen Sie den Anteil der Ehefrauen mit einem monatlichen
Nettoeinkommen zwischen 880 DM und 1300 DM. hi (880 <= x <= 1300) = ?
1
3
u
u
F(x
F
(
x
) -
F
(
x
)
x
-
x
i)
i
i
=
h
x
i
i
2
2
4
F(x)
u
x
-
x
1
u
i
F
(
x
) =
F
(
x
) +
h
i
i
x
i
F(x ui)
3
4
x
x ui
x
x oi
Wert 880; 1. Klasse zwischen 800 und 1.000
Wert 1.300; 2. Klasse zwischen 1.200 und 1.500
0,545
1300 -1200
F
13
( 0 )
0 = ,
0 49 +
165
,
0
300
x
F
13
( 0 )
0 = 545
,
0
bedeutet, dass 54,5% aller Ehefrauen
ein Nettoeinkommen von weniger
0,2938
als 1.300 DM hatten.
880 DM
1.300 DM
Rechenweg: Einfallsklasse suchen (1.300 fällt in "1.200 bis 1.500 DM")
x i = 1.200 ist der untere Wert der Einfallsklasse
u
Klassenbreite ist 300 (1.500 ./. 1.200)
hi aus der Einfallsklasse übernehmen
2)
880 - 800
F
88
( 0) = ,
0 247 +
117
,
0
F
)
880
(
= ,
0 2938
200
3)
Differenz = 0,2512
h (880 <= x < 1300) = 0,545 ./. 0,2938 = 0,2512
d.h. 25,12% aller untersuchten Ehefrauen haben ein Nettoeinkommen
unter 1.300 DM, aber über 880 DM.
Statistik A - Internationales Management
7
3
Berechnung statistischer Merkmale
17.10.00
3.1 Mittelwerte
3.1.1 Der Modus
Der Modus (Mo, D) ist der häufigste, bzw. dichteste Wert einer
Häufigkeitsverteilung.
a) bei quantitativ diskreten Merkmalen
z.B. Verkaufte Schuhe nach Schuhgrößen
Merkmal
Anzahl der
Schuhgröße verk. Schuhe
Bemerkungen
x
ni
39
2
40
6
41
5
42
9
Modus
43
7
44
3
45
1
33
Bei zwei gleichen Werten ist kein Modus zu bestimmen
b) bei quantitativ stetigen Merkmalen
z.B. monatliche Nettoeinkommen der Ehefrauen (vergl. Tabelle S. 4)
n
Modus durch Dichtefunktion bestimmen
i
f
(
x
)
i
=
n
x
i
Der Modus ist die Klassenmitte der Klasse mit der Klassenmitte.
Bei den Ehefrauen: 1.100 ist der Modus, da dichtester Wert in der Klasse
von 1.000 bis 1.200. Mittelwert ist 1.100.
Frage nach dem Modus z.B.: Wieviel verdienen die meisten Frauen?
Statistik A - Internationales Management
8
3.1.2 Der Median (Me, Z)
Der Median ist der Merkmalswert, der in einer der Größe nach geordneten
Reihe genau in der Mitte liegt.
Der Median bezeichnet man auch als den 50%-Punkt (Zentralwert)
z.B.: Vorgabezeiten für einen Akkordlohn
Messung
1
2
3
4
5
6
7
8
9
10
11
3,3
3,2
3,6
3,5
3,3
3,4
3,4
3,1
3,7
3,5
3,6
geordnet
3,1
3,2
3,3
3,3
3,4
3,4
3,5
3,5
3,6
3,6
3,7
d.h. 50% der Arbeiter haben unter 3,4 min benötigt und 50% der Arbeiter
haben über 3,4 min benötigt.
n
+1 11+1
Nach der Ordnungsformel:
Z
=
=
= 6
2
2
ist der 6. Wert (nach Ordnung) der Median-Wert
Variante:
1
2
3
4
5
6
3,1
3,2
3,3
3,5
3,8
3,8
n
+1 6 +1
3
,
3 + 5
,
3
Z
=
=
= 5
,
3 ?
= ,
3 4 = (
Median
)
2
2
2
bei klassierten Merkmalswerten
u
x
-
x
z.B.: Nettoeinkommen der Ehefrauen
u
i
F
(
x
) =
F
(
x
) +
h
i
i
xi
Z = Berechnung über die lineare Interpolation
(x = Z)
u
F
(
x
) -
F
(
x
)
Bestimmung von x:
u
i
Z
=
x
+
x
i
i
hi
50
,
0
- ,
0 49
Hier:
Z
=1 200
.
+
300 = 1
18
,
218
.
DM
165
,
0
0,50 = fester Wert für 50%, 0,49 = Wert aus der darunterliegenden Klasse
0,165 = Wert aus der Einfallsklasse (hier zw. 0,49 und 0,655),
1.200 = Klassenuntergrenze, 300 = Klassenbreite (1.500 ./. 1.200)
Interpretation: 50% der befragten Ehefrauen haben ein monatliches
Nettoeinkommen über bzw. unter 1.218,18 DM
,
0 67 - ,
0 655
Übung: 67% = ?
Z
= 1.500 +
300 = 1.
,
538 46
DM
117
,
0
Statistik A - Internationales Management
9
3.1.3 Das arithmetische Mittel ( x )
a) ungewogener Fall:
x
...
1
1 +
x
2 +
x
3 +
n
x
x
=
n
=
xi
b) Gewogener Fall:
n
n i
=1
n
1
n
x
=
x n
ni
i i
x
=
xi
= relative Häufigkeit
n i
=1
i
1
n
=
z.B. monatliche Lagerbestände des ganzen Jahres
xi
ni
ni xi
ni / n
xi · ni / n
98
2
196
0,17
16,66
109
1
109
0,08
8,72
112
4
448
0,33
36,96
117
2
234
0,17
19,89
123
3
369
0,25
30,75
Summe
12
1356
112,98 =
Bei der monatlichen Abrechnung der im Akkordlöhner einer Baustelle wurden
folgende DM-Beträge in 10 Klassen an die Mitarbeiter ausbezahlt:
Ausbezahlte
Anzahl der
Klassen-
DM-Beträge
Bauarbeiter
mitte
xi*
·
ni
xmax
·
ni
xmin
·
ni
xi
ni
xi*
unter 160
2
140
280
320
240
160 bis 180
21
170
3570
3780
3360
180 bis 200
38
190
7220
7600
6840
200 bis 250
19
225
4275
4750
3800
250 bis 300
14
275
3850
4200
3500
300 bis 350
8
325
2600
2800
2400
350 bis 400
4
375
1500
1600
1400
400 bis 500
3
450
1350
1500
1200
500 und mehr
1
550
550
600
500
Summe
110
25.195
27.150
23.240
1
k
1
x
x in
x i
i
=
xi
=
Klassenmitte
?
195
.
25
= 229 04
, 5
n i
1
110
=
= Pr
äsum
t
tivwer
Der mutmaßliche Fehler durch x * kann mit Hilfe der relativen
i
Fehlerspanne ermittelt werden. = 7,76% fehlen in %
x
-
x
Berechnung der absoluten Fehlerspanne:
max
min
Fabs
=
= 17
%
77
,
2
F
Berechnung der relativen Fehlerspanne:
F
=
abs
rel
100 = ,
7 758%
x
Statistik A - Internationales Management
10
Die Relation zwischen den Mittelwerten ergibt Aufschluß über die
"Schiefe der Verteilung"
a) linkssteile Verteilung
Mo < Me < x
b) rechtssteile Verteilung
Mo > Me > x
c) Symmetrische
Verteilung
Mo = Me = x
3.1.4 Das geometrische Mittel (G)
Das geometrische Mittel wird benutzt, um steigende oder fallende
Entwicklungstendenzen zu charakterisieren, d.h. es geht um die
Ermittlung der durchschnittlichen relativen Veränderung der Merkmale
im Zeitablauf
n
1
G
=
n x
...
log
log
1
x
2
x
G
x
n
?
=
i
n i
=1
z.B.: Die Montageleistung eines Maschinenbaubetriebes beträgt:
1996: 1800 Stück
1999: 2025 Stück
1997: 1854 Stück
2000: 2147 Stück
1998: 1947 Stück
a) Wie groß ist die durchschnittliche jährliche Zuwachsrate?
1854 1947 2025 2147
4
G
=
= 04
,
1
505
1800 1854 1947
2025
Die jährliche Zuwachsrate beträgt 4,505%, die Wachstumsrate ist 1,045
Die 1,xxx zeigt eine steigende Entwicklung (im Gegensatz zu 0,xxx)
Statistik A - Internationales Management
11
Aufgabe: Welche Montageleistung kann im Jahre 2001 und im Jahre 2002
erwartet werden?
a01 = a0 * qn =
a0 * 1,045 =
2.147 * 1,045 = 2.244 Stück
2.244 * 1,045 = 2.345 Stück
Interpretation: Unter der Annahme gleicher Arbeitsbedingungen ist im Jahr
2001 eine Montageleistung von 2.244 Stück zu erwarten. Im Jahr 2002 ist
unter gleicher Annahme eine Montageleistung von 2.345 Stück zu erwarten.
Nachteile: Ist ein Wert negativ oder 0 ist eine Rechnung nicht mehr möglich.
Man muß ein arithmetisches Mittel berechnen.
Statistik A - Internationales Management
12
3.2 Streuungsparameter
Abweichungen von einem Mittelwert
3 Verteilungskurven mit (scheinbar) gleichem Mittelwert ( x )
z.B.: 1. Klausur-Auswertung: 1
2
3
4
5
x = 3
2. Klausur-Auswertung:
2
3
4
x = 3
Lösung: Streuungsmaß
errechnen!
Spannweite (R): Die Spannweite einer Verteilung ist die Differenz
zwischen dem größten (xn) und dem kleinsten (x1) vorhandenen
Merkmalswert in der Grundgesamtheit.
R = xn - x1
z.B.: Preislagen von T-Shirts:
1
2
3
4
5
6
7
8
9
10
11
16,50 19,80 22,50 24,80 26,50 28,50 32,90 34,80 38,50 44,90 49,80
R = 49,80 ./. 16,50 = 33,30 DM
Interpretation: Die Preisspanne bei T-Shirts beträgt 33,30 DM.
Statistik A - Internationales Management
13
3.2.1 Der Quartilsdispersionskoeffizient (4-teilige Streuung)
Der Quartilsabstand (Quartilsabweichung) mißt den halben Abstand
zwischen Q und Q nach der Formel:
3
1
Q
-
Q
3
1
QA
=
2
25%
25%
25%
25%
Q
Q
Z (Median)
Q
Q
0
1
3
4
50% der Merkmale
Die ersten und die letzen 25% fallen aus der Berechnung heraus (um z.B.
Extremwerte zu vermeiden). Der Zentralwert (Median, Z) ist vorab zu
ermitteln.
Vorgehensweise bei z.B. Preislagen der T-Shirts
1.)
Berechnung der Maßzahlen Z, Q und Q
1
3
n
+1 11+1
Z
=
=
= ,
6
d h
. .
an der
6.
Stelle
=
50
,
28
DM
2
2
n
+1 11+1
Q
=
=
= ,
3
d h
. .
an der
3.
Stelle
50
,
22
DM
1
=
4
4
n
+1
11+1
Q
=
3 =
3 = ,
9
d h
. .
an der
9.
Stelle
50
,
38
DM
3
=
4
4
2.)
Berechnung des mittleren Quartilsabstandes
Q
-
Q
50
,
38
-
50
,
22
Q
3
1
=
=
= ,
8 00
DM
A
2
2
3.)
Berechnung des Quartilsdispersionskoeffizienten
QA
100
,
8 00 100
VQ
=
=
=
,
28 07 %
Z
50
,
28
Interpretation: Die durchschnittliche Abweichung der Preise für T-Shirts
im mittleren Bereich beträgt 28,07%
Statistik A - Internationales Management
14
Quartilsdispersionskoeffizient bei klassierten Merkmalen
z.B. monatliches Nettoeinkommen der Ehefrauen
1.) Median (Z) ermitteln (hier: 1.218,18 DM)
u
F
(
x
) -
F
(
x
)
Ermittlung von Q und Q
u
i
Z
=
x
+
x
1
3
i
i
hi
,
0 25 - ,
0 247
Q
= 800 +
200
128
,
805
1
=
11
,
0
7
75
,
0
- 655
,
0
Q
= 1500 +
300
589
,
1743
3
=
117
,
0
Q
-
Q
2.) mittleren Quartalsabstand ermitteln:
3
1
QA
=
=
,
469 23
2
QA
100
3.) Quartilsdispersionskoeffizient ermitteln:
VQ
=
=
519
,
38
Z
Interpretation: Die durchschnittliche Abweichung der Monatsnetto-
einkommen der Ehefrauen vom Median beträgt im mittleren Bereich 38,52%,
d.h. die monatlichen Nettoeinkommen weichen um durchschnittlich
469,23 DM vom Median (1.218,18 DM) ab.
Z
-
Q
1218 18
, -
12
,
805
8
Schiefe der Verteilung:
1
QZ
=
=
= ,
0 786
Q
-
Z
1743 589
,
-1218 18
,
3
Q > 1 = rechtssteile Verteilung
Z
Q < 1 = linkssteile Verteilung
Z
Q = 1 = Symmetrische Verteilung
Z
hier: 0,786, d.h. linkssteile Verteilung.
Die meisten Einkommen liegen im unteren Bereich
Statistik A - Internationales Management
15
3.2.2 Die Varianz und die Standardabweichung
Bedingungen: Die Varianz bezieht sich auf alle Merkmalswerte
Bemessungsgrundlage für die Berechnung der prozentualen Abweichung
ist das arithmetische Mittel ( x ).
Die Varianz ist ein sehr empfindliches Streuungsmaß (anzuwenden bei
nicht zu extremen Abweichungen)
n
2
1
2
1) ungewogener Fall:
s
=
(
x
-
x
) =
durchschn
.
Abweichung
n
i
i
1
=
n
1
2) gewogener Fall:
s
2 =
(
x
-
x
)
n
=
Gewichtung durch n
n
i
i
i
=1
(gewichtet mit den Häufigkeiten)
(Anmerkung: bei unter 1000 Merkmalen )
2
1
s
=
...
n
-1
k
1
3) klassierter Fall:
s
2 =
(
x
*
2
*
i
-
x
)
n
x i
=
x
i
i
n i
=1
(es liegen Klassen vor; die Klassenmitte muß ermittelt werden)
Tabelle 7
30.10.00
Arbeitstabelle zur Berechnung der Streuung der durchschnittlichen Leistungen
der Arbeiter einer Firma.
*
x
n
i
i
x
=
=
62
,
312
ni
Leistung
AN 1. Schritt 2. Schritt 3. Schritt
x u
o
n
x *
x *
x * - x
( x * - x )2
i x xi
i
i
i · ni
i
i
·ni
270-280
10
275
2750
-37,62
14152,64
280-290
14
285
3990
-27,62
10680,10
290-300
24
295
7080
-17,62
7451,15
300-310
35
305
10675
-7,62
2032,25
310-320
28
315
8820
2,38
158,60
320-330
19
325
6175
12,38
2912,02
330-340
16
335
5360
22,38
8013,83
340-350
14
345
4830
32,38
14678,50
350-360
8
355
2840
42,38
14368,51
168
52520
74447,60
Frage: Wie groß ist die durchschnittliche Abweichung der Arbeitsleistungen der
Beschäftigten (AN) der Firma?
2
k
S
tan
dardabwei h
c ung
:
s
=
s
= ,
21 05
2
1
s
=
( *
x i
-
x
)2
n
n
i
=
durc
ttl
hschni
.
Abweichung von x
(= 312 62
, )
i
1
=
s
100
.
2 105
2
1
=
s
=
.
74
,
447 60 = 44314
, (
Varianz
)
Variationskoeffizient
:
v
=
=
=
%
73
,
6
168
x
62
,
312
Statistik A - Internationales Management
16
Beispiel:
In einer Erhebung wurde der Durchschnittspreis für 1 kg Butter mit 7,90 DM,
bzw. für 1 kg Margarine mit 2,70 DM festgestellt.
Die Standardabweichung wurde mit 0,3 für Butter und mit 0,25 für Margarine
errechnet.
Vergleichen Sie die beiden Verteilungen der Merkmale!
s
100
3
,
0 100
s
100
,
0 25 100
vB
=
=
= ,
3 79 %
7
vM
=
=
= ,
9 25 %
9
x
90
,
7
x
70
,
2
Bei Vergleichen werden die Variationskoeffizienten herangezogen.
k
2
1
*
2
1
s
* 2
=
(
x
*
2
i
-
x
)
n
?
(
x i
n
- 2
x
x i
n
+
x
n
)
i
i
i
i
n i
=1
n
1
* 2
1
*
2 1
=
x i
n
- 2
x
x i
n
+
x
n
i
i
i
n
n
n
= x
= 1
1
* 2
2
2
1
* 2
2
=
x i
n
- 2
x
x
+
x
=
s
=
x i
n
-
x
n
i
n
i
k
2
1
Beispiel: a)
s
=
( *
x i
-
x
)2
ni
=
14
,
443
n i
1=
k
2
1
b)
* 2
2
s
=
x i
ni
-
x
,
2
wobei x
=
.
97
,
731 26
2
und x
= 31 ,
2 62
n i
1=
Leistung
k
AN
2
1
* 2
2
s
= x u
x i
o
ni
-
x
n
x *
x * 2
n
i x x
i
1
=
i
i
i
i
1 270-280
10
275
756.250
?
.
16
.
493 200 - .
97
,
731 26
168280-290
14
285
1.137.150
= 442 290-300
,
55
,
also s
= ,
21
24
04
295
2.088.600
300-310
35
305
3.255.875
310-320
28
315
2.778.300
320-330
19
325
2.006.875
330-340
16
335
1.795.600
340-350
14
345
1.666.350
350-360
8
355
1.008.200
168
16.493.200
Statistik A - Internationales Management
17
Die Konzentrationskurve
31.10.00
Abweichung in der Gleichverteilung für jede Klasse
z.B. 10% der Ehefrauen liegen in der 1. Klasse. Diese haben 2% Anteil am
Gesamteinkommen (= ungleichmäßige Konzentration)
Man betrachtet für jede Klasse die Differenz d zwischen der beobachteten
i
Merkmalssumme einer Klasse und der Merkmalssumme der Gleichverteilung.
d
=
x
*
i
n
(
gesamte Klasse
) =
x
n
(
gesamte Verteilung
)
i
i
~
x
*
i
n
n
d
i
i
i
=
-
x
n
n
~
di
= die Differenz zwischen dem Einkommensanteil der Haushalte der
Klasse (i) und dem Anteil der Haushalte dieser Klasse an der
Gesamtheit aller Haushalte (kann auch negativ sein)
~
d
0 : untere Einkommensklassen sind unterrepräsentiert
i
~
d
0 : obere Einkommenklassen sind stärker in der Verteilung begünstigt
i
~
di
= 0 : Gleichverteilung liegt vor
Beispiel: Einkommen der Ehefrauen
x
*
iu
*
~ *
x n
n
in
o
dh
i
x
in
n
F ix
=(
MS i
x
( )
x x
)
i
n
i
xi
i
=
i
i
i j
-
i
x n i
xn
n
n
200 bis 600
30
0,145
12.000
0,036
-0,109
0,145
0,036
600 bis 800
21
0,102
14.700
0,044
-0,058
0,247
0,08
800 bis 1000
24
0,117
21.600
0,064
-0,053
0,364
0,144
1000 bis 1200
26
0,126
28.600
0,085
-0,041
0,49
0,229
1200 bis 1500
34
0,165
45.900
0,136
-0,029
0,655
0,365
1500 bis 1800
24
0,117
39.600
0,117
0
0,772
0,482
1800 bis 2500
29
0,141
62.350
0,185
0,044
0,913
0,667
2500 bis 10000 18
0,087
112.500
0,334
0,247
1,00
1,00
206
1,00
337.250
0,001
hi
= n rel.Häuf.
=
x
n
1,00
kumm. kumm.
x
= .
1 637 13
, 6
14,5% der Ehefrauen haben einen Anteil am gesamten Einkommen (aller Klassen) von nur
3,6%. Es liegt eine ungleichmäßige Verteilung vor.
Interpretation 5. Spalte:
Der Anteil der Netto-EK der 1. Klasse gemessen am Gesamt-EK aller Klassen beträgt 3,6%
Interpretation 6. Spalte: Die 1. Klasse bekommt 10,9% (monatl. Netto-EK) zuwenig gemessen
an der Gleichverteilung (
x
)
Statistik A - Internationales Management
18
Graphische Darstellung (Lorenzkurve)
1,1
1
0,9
Gleichverteilung: d = 0
0,8
i
0,7
0,6
MS (xj)
0,5
Fläche
:
0,4
Maß für die Konzentration der
Verteilung.
0,3
Je weiter entfernt, desto größer
0,2
die Konzentration in den
23%
einzelnen Klassen
0,1
0
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
F (xi)
bei 49%
Interpretation: auf 49% aller Ehefrauen, die ein monatl. Einkommen unter 1.200
DM haben, entfallen nur 23% des Gesamteinkommens aller Ehefrauen.
Gini´sches Konzentrationsverhältnis
Fläche zwischen
eilung
Gleichvert
Ger
(
ade
)
und Lorenzkur e
v
=
Fläche des Dreiecks unter der
eilung
Gleichvert
Pr
ozent
-
Satz
?
0 1
= 0 ?
vollständige Gleichv
eilu
ert
ng
= 1?
vollständige Konzentration
Anmerkung: Alpha ist dann nicht aussagefähig, wenn sich zwei Lorenzkurven schneiden
Statistik A - Internationales Management
19
3.3 Indexzahlen
Meßzahl:
Beschreibung der Entwicklung eines einzigen Merkmals
z.B. Umsatz von Fahrrädern gleichen Typs
Indexzahl: Sie beschreibt die zeitliche Entwicklung der durchschnittlichen
Veränderung einer Reihe von verschiedenen Tatbeständen in einer
einzigen Zahl. (z.B. Umsatz aller Fahrzeuge)
Typische Fragestellungen lauten:
- Wie hat sich das Lohnniveau in Osthessen seit 1990 entwickelt?
- Wie stark haben sich die Preise der Lebenshaltung seit 1990 entwickelt?
Formen von Indizes:
1. Preisindex (Menge bleibt hierbei konstant)
2. Mengenindex (Preise bleiben konstant)
3. Wert-/Umsatzindex (beides wird berücksichtigt)
Mit der Indizierung sind folgende Probleme verbunden:
13.11.00
1) Vereinfachung der komplexen Fragestellung, z.B. Index der
landwirtschaftslichen Produktion.
2) Gewichtungsproblem, d.h. beim Mengenproblem sind die Preise die
Gewichte, beim Preisproblem sind die Mengen die Gewichte.
3) Wahl des Basisjahres, z.B. Entwicklung der Produktionsergebnisse zweier
Maschinenfabriken:
Umsatz
B
Jahr A
B
1990 30 210
1995 60 240
A
2000 90 290
Jahre
Jahr A
B
in %
A
1990 100 100
Basis
1995 200 114,3
2000 300 128,6
B
Jahre
Jahr
A
B
in %
1990 33,3 77,8
1995 66,7 88,9
B
2000 100 100
Basis
A
Jahre
Statistik A - Internationales Management
20
3.3.1 Indexe nach Laspeyres
Allgemeine Erläuterung: Beim Laspeyres-Index sind die Umsatzwerte der
Basisperiode die Gewichte. Symbolschreibweise:
p = Preis des Gutes i in der Basisperiode 0
oi
p = Preis des Gutes i in der Berichtsperiode n
ni
q = Menge des Gutes i in der Basisperiode 0
oi
q = Menge des Gutes i in der Berichtsperiode n
ni
p * q = Umsatz des Gutes i in der Basisperiode 0
oi
oi
p * q = Umsatz des Gutes i in der Berichtsperiode n
ni
ni
p
p
p
1
n
n
2
n
3
Beispiel:
p
q
+
p
q
+
p
q
+ ...
01
01
02
02
03
03
p
p
p
01
02
03
p
0,
n
=
p
q
+
p
q
+
p
q
+ ...
01
01
02
02
03
03
1) Mengenindex
q
q
q
p
q
p
ni
ni
i
i
ni
0
0
0
i
Q
g
Q
L
n
=
i
=
=
L
n
=
100
0,
0,
q
q
q
p
q
p
0
i
0
i
0
i
0
i
0
i
0
i
2) Preisindex
p
p
p
q
p
q
ni
ni
i
i
ni
0
0
0
P
g
P
L
n
=
i
=
=
L
n
=
i
100
0,
0,
p
p
p
q
p
q
0
i
0
i
0
i
0
i
0
i
0
i
Beispiel: Ein Händler, der 4 Warengattungen führt, möchte wissen, wie sich das
Preisniveau (PN) und die Mengen im Laufe der letzten 3 Jahre verändert haben.
A
B
C
D
Jahre
P/kg
M in kg
P/kg
M in kg
P/kg
M in kg
P/kg
M in kg
1997
2,20
560
14,00
112
40,00
18
9,60
680
1998
2,00
580
12,00
148
40,00
20
9,40
720
1999
2,80
600
15,00
150
50,00
22
9,80
730
2000
3,00
610
17,00
145
52,00
24
10,20
750
a) Mengenindex für den Zeitraum 1997 bis 1999 (1997 = 100)
q
p
ni
0
i
600 ,
2 20 +150 ,
14 00 + 22
,
40 00 + 730 ,
9 60
Q
L
=
100 =
100 =
5
,
112
97,99
q
p
i
560
i
,
2 20 +112 ,
14 00 +18
,
40 00 + 680 ,
9 60
0
0
Interpretation:
Die abgesetzte Menge stieg im Zeitraum von 1997 bis 1999 um 12,5%
Statistik A - Internationales Management
21
b) Preisindex für den Zeitraum 1997 bis 1999 (1997 = 100)
p
q
ni
0
i
80
,
2
560 +
,
15 00 112 +
00
,
50
18 + 80
,
9
680
P
L
=
100 =
100 =
6
,
107
97,99
p
q
i
,
2 20
i
560 +
,
14 00 112 +
,
40 00 18 + ,
9 60 680
0
0
Interpretation:
Das Preisniveau (PN) stieg im Zeitraum von 1997 bis 1999 um 7,6%
Indexreihen nach Laspeyres:
Jahre Preisindex Mengenindex
1997
100
100
1998
95,3
110,1
1999
107,6
112,5
2000
114
114,8
Vorteil: Gewichte müssen nur einmal bestimmt werden, es ist eine direkte
Vergleichbarkeit aller Zahen der Indexreihe möglich
Nachteil: Es wird angenommen, dass sich die Umsätze gegenüber dem Basisjahr
nicht geändert haben, was unrealistisch ist.
Index nach Paasche
Die Gewichte bilden die Preise bzw. Mengen des Berichtsjahres (dadurch reale,
aktuelle Werte). Der Index berücksichtigt somit die veränderten Konsum-
gewohnheiten.
q
q
q
p
a) Mengenindex
Q
n
=
g
(
Gewichtun s
g faktor
)
1
n
0
n
=
(
kürz
)
en
P
0,
n
q
i
q
q
p
0
0
0
n
q
p
n
Q
P
n
=
n
100
0,
q
p
0
n
p
p
p
q
b) Preisindex
P
n
=
g
(
Gewichtu
s
ng faktor
)
2
n
0
n
=
(
kürzen
)
P
0,
n
p
i
p
p
q
0
0
0
n
p
q
n
P
P
n
=
n
100
0,
p
q
0
n
Statistik A - Internationales Management
22
Beispiel: Ein Händler, der 4 Warengattungen führt, möchte wissen, wie sich das
Preisniveau (PN) und die Mengen im Laufe der letzten 3 Jahre verändert haben.
A
B
C
D
Jahre
P/kg
M in kg
P/kg
M in kg
P/kg
M in kg
P/kg
M in kg
1997
2,20
560
14,00
112
40,00
18
9,60
680
1998
2,00
580
12,00
148
40,00
20
9,40
720
1999
2,80
600
15,00
150
50,00
22
9,80
730
2000
3,00
610
17,00
145
52,00
24
10,20
750
Beispiel: Paasche-Index 1997 bis 1999, Basis 1999 = 100
600 80
,
2
+150
,
15 00 + 22
00
,
50
+ 730 80
,
9
12184
a)
Q
P
n
=
100 =
100 = 11 ,
2 7
0,
560 80
,
2
+112
,
15 00 +18
,
50 00 + 680 80
,
9
10812
p
q
n
n
80
,
2
600 +
00
,
15
150 +
,
50 00 22 + 80
,
9
730
1218400
b)
P
P
n
=
100 =
100 =
=
8
,
107
0,
p
q
,
2 20
n
600 +
00
,
14
150 +
00
,
40
22 + ,
9 60 730
11308
0
Eigenschaften des Paasche-Index:
Vorteil: Der Index gibt die Situation wieder, die zum gegenwärtigen Zeitpunkt
besteht (ist damit realitätsnah und aktuell)
Nachteil: in jedem Jahr müssen die Preise und Mengen neu ermittelt werden
(damit hoher Arbeits- und Kostenaufwand). Die Indexzahlen können nicht als durch-
laufende Reihe dargestellt werden - ein direkter Vergleich ist nicht möglich.
3.3.3 Umsatzindex
pn
qn
SummeUmsätze Berichtsp r
e iode
12184 100
U n
=
100 =
100 =
= 12 ,
1 258
0,
p
q
Summe Umsätze Basisperiode
10048
0
n
Umsatzindex = + 21,3%
ergibt sich ungefähr aus: Q
= + 12,7% + P
= + 7,8%
P 97/99
P 97/99
3.3.4 Index der industriellen Nettoproduktion
Die Berechnung beruht auf dem Index nach Laspeyres
qn
N
q
0
Q
100
0
=
0
,
N
0 =
Nettop
k
rodu tionswerte
L
n
N
0
Statistik A - Internationales Management
23
Beispiel: Berechnung des Nettoproduktionsindex für die Stahlindustrie anhand
repräsentativ ausgewählter Erzeugnisse (in 1000 t)
Produktionswerte
Nettoproduktionswerte (zu SK/HK)
Q
L 0,n
Erzeugnisse
1990
2000
N (DM)
q /q
q /q
=253,116
90
n 0
n 0·N90
A
31
45
57
1,4516
82,7412
170
B
27
42
54
1,5555
84,00
=1,4889
C
7
9
21
1,2857
26,9997
=149
D
16
25
38
1,5625
59,375
81
121
170
253,1159 = + 49%
Mengensteigerung
3.3.5 Besondere Indexprobleme
1) Umbasierung von Indexzahlen
Index per Dreisatz gleichsetzen (beim Gleichsetzten von Indexreihen)
Jahr
Indexreihe Einzelhandel
Indexreihe Großhandel
1990 = 100 umbasiert 1995 = 100
1995 = 100
1990
100
1991
98
1992
112
1993
125
1994
130
1995
138
100
100
1996
146
105,8 (+ 5,797%.)
108 (+ 8%.)
1997
154
111,28(+ 5,48%.)
117 (+ 9%.)
2) Verknüpfung von Indexzahlen
Beispiel: Verkaufspreise
alter Rechner
neuer Rechner
Zeit
Preis
Meßzahl (L)
Preis
Meßzahl (L)
1987
1200 DM
100
1992
1100 DM
92
700 DM
92
1997
710 DM
93,3
Statistik A - Internationales Management
24
3) Verkettung von Indexzahlen
Beispiel: Basisjahränderung alle 5 Jahre
Jahr
1970
1980
1990
Jahr
1980
1990
1970
100
1990
158
100
...
1991
170,64
108
1980
142
100
1992
181,70
115
...
1993
192,76
122
1990
158
100
1994
203,82
129
...
1995
213,30
135
1995
135
per Dreisatz Vorgegebene
L-indizes
4) Preisbereinigung
Ziel ist die Berechnung von Realgrößen, z.B. Reallohn, Realeinkommen,
reales BIP, reales Wachstum,...
Feststellung des Kaufkraftverlustes: Kaufkraft = 1/P * 100, P = P
L 0,n
Wie stark war der Kaufkraftverlust gegenüber 1995 bei einer PN-
steigerung in diesem Zeitraum von 12%?
100 / 112 = 0,893 = Verlust von ca. 11 Pfennigen auf 1 DM
Interpretation: Die Mark ist nur noch 89,3 Pfennig wert!
Preisbereinigter Umsatz
Umsatz
U n
U
0,
,
121 26
=
=
realer Umsatz
.
Bsp
: 97/99 =
=
,
112 7 = + ,
12 %
7
Pr
ei
sin
dex
P
P
10 ,
7 6
L
0,
n
L
97 / 99
= Mengenindex Paasche
Interpretation:
Der Absatz (mengenmäßiger Umsatzanstieg) ist um 12,7% gestiegen.
Kommentare
Dieser Text kann über folgende URL aufgerufen und zitiert werden: