Statistik III – Deskriptive Statistik zuletzt geändert: 09.02.06
A Deskriptive Statistik
A.1 Zweidimensionale Häufigkeitsverteilung
absolute Häufigkeit:
Gegeben sind die Merkmale X mit den Ausprägungen x j (j=1,2,...,n) und Y mit den
Ausprägungen y k (k=1,2,...,q), die an den selben statistischen Einheiten erhoben werden. Die
Anzahl der Beobachtungswerte, bei denen die Ausprägungskombinationen (x j , y k ) auftritt
heißt absolute Häufigkeit = h(x j , y k )
relative Häufigkeit:
Der Anteil der absoluten Häufigkeit an der Gesamtzahl n der Beobachtungen heißt relative
Häufigkeit = f(x j , y k )
1 = ) ; ( ) ; ( y x h y x f k j k j n
zweidimensionale Häufigkeitsverteilung
Die Gesamtheit aller aufgetretenen Kombinationen von Merkmalsausprägungen und der
dazugehörigen absoluten und relativen >Häufigkeit heißt zweidimensionale
Häufigkeitsverteilung
Tabellarische Darstellung: in Häufigkeitstabelle
Bsp.:
Von 70 Studies wurden Mathe und Englischnoten erfasst! (Mathe; Englisch) (4; 3);(5;1)
Ordnen! lexikografische Ordnung
(1;2);(1;4)
(2;1);(2;2)... oder Häufigkeitstabelle
- 3 dimensionale Darstellung mit Säulen
- Streudiagramm
Copyright © 2001 – 2004 by bwl24.net Alle Angaben ohne Gewähr! Seite 2
Statistik III – Deskriptive Statistik zuletzt geändert: 09.02.06
Randverteilung:
Gegeben sei die 2 – dimensionale Häufigkeitsverteilung der Merkmale X und Y. Die
zugehörige 1 – dimensionale Verteilung des Merkmals X (bzw. Y), bei der das Auftreten des
Merkmals Y(bzw. X) unberücksichtigt bleibt, heißt Randverteilung von X (bzw. Y).
Bsp.:
Bedingte Verteilung:
Definition:
Gegeben sei die 2 – dimensionale Häufigkeitsverteilung der Merkmale X und Y. Die
Häufigkeitsverteilung des Merkmales X (bzw. Y) , die sich für eine gegebene Ausprägung y k
(bzw. x j ) ergibt, heißt bedingte Verteilung von X (bzw. Y) für gegebenes y k (bzw. x j ). Die
Häufigkeiten der bedingten Verteilungen bezeichnet man mit
h(x j /Y=y k ) oder kurz h(x j /y k ) und entsprechend f(x j /y k ).
am Bsp.:
*d.h. y 1 und y 3 können nicht mehr eintreten y 2 ist gegeben x 1 kann also nur 3 sein!
h(y 3 /x 1 )=4
Die absoluten bedingten Häufigkeiten können sofort aus der Tabelle abgelesen werden!
relative bedingte Häufigkeit:
f(x 1 /y 2 )= 3/5 =0,6
Copyright © 2001 – 2004 by bwl24.net Alle Angaben ohne Gewähr! Seite 3
Statistik III – Deskriptive Statistik zuletzt geändert: 09.02.06
f(y 3 /x 1 )=4/9=
bedingte relative Häufigkeiten:
) ; ( y x h
Abhängige Merkmale:
(Abhängigkeit und Unabhängigkeit muss geklärt werden!)
Abhängigkeit:
x 1 2 0,1 4 0,2 10 0,5 4 0,2 20 1
x 2 2 0,04 8 0,16 24 0,48 16 0,32 50 1
x 3 6 0,2 8 0,27 6 0,2 10 0,33 30 1
10 20 40 30 100
Wenn es für die Verteilung des Merkmales y nicht darauf ankommt wie groß x ist, dann
besteht Unabhängigkeit. Wenn x und y unabhängig wären, dann dürfte es für die Verteilung
von y nicht darauf ankommen was x ist. Die Verteilung von y müsste gleich sein. Das ist nicht
der Fall x und y sind abhängig von einander.
x 1 2 0,2 4 0,2 10 0,25 4 0,13 20
x 2 2 0,2 8 0,4 24 0,6 16 0,54 50
x 3 6 0,6 8 0,4 6 0,15 10 0,73 30
10 1 20 1 40 1 30 1 100
y unabhängig: relative Häufigkeit x ist für jede Ausprägung von y gleich dies ist hier nicht
der Fall x und sind abhängig von einander!
Bei einem Nachweis der Unabhängigkeiten ist es egal, ob man dies an Zeilen oder Spalten
zeigt.
Unabhängigkeit:
Copyright © 2001 – 2004 by bwl24.net Alle Angaben ohne Gewähr! Seite 4
Statistik III – Deskriptive Statistik zuletzt geändert: 09.02.06
Frage: Ist x abhängig von y?
Es kommt für y – Verteilung nicht darauf an, welche Ausprägungen x annimmt, da relative
Zeilenhäufigkeit entspricht immer dem x. (für jedes x ist y immer gleich)
x und y sind von einander unabhängig!
Eine relative bedingte Häufigkeit in einer Zelle = relative Randhäufigkeit
) ; ( y x f = k j ) / ( ) 1 ( y x f
( ) ( ) 2 ( x f x f
j
: (2) und (1) aus
×
( ) f(x y f oder j n
Beispiel: (Einzelne Häufigkeiten sind nicht gegeben!)
(10*12)/60=2
(10*30)/60=5
Copyright © 2001 – 2004 by bwl24.net Alle Angaben ohne Gewähr! Seite 5
Statistik III – Deskriptive Statistik zuletzt geändert: 09.02.06
A.2 Regressionsanalyse
Das Finden der best passendsten Gerade heißt Regression!
Regression von y auf x, nur dann, wenn x unabhängige und y abhängige Variable ist. Man versucht durch das Finden der Geraden eine Prognose für weiter rechts liegende x zu stellen:
Voraussetzungen:
1) Es handelt sich um eine 2 – dimensionale Verteilung (x, y)
2) X und Y haben ein bestimmtes Skalenniveau (metrisch skalierte Daten)
3) bereits entdeckter linearer Zusammenhang zwischen X und Y
A.2.1 Die Mathematik einer Geraden
- 2 Punkte bestimmen eine Gerade vollständig oder
- ein Schnittpunkt mit der y – Achse (A) und die Steigung der Gerade b (b = tan α )
Statistik III – Deskriptive Statistik zuletzt geändert: 09.02.06
Frage: Wie kann ich aus der Menge der Punkte die Parameter a und b berechnen?
Welche Gerade ist die bestpassendste?
Es muss ein Kriterium entwickelt werden, welches diese beste Anpassung beschreibt!
A.2.2 Gauß 1777 – 1855 „Methode der kleinsten Quadrate“
- Bestimmung der Differenz der tatsächlichen Punkte zu der Geraden (auf diese Art-
und Weise würden unendlich viele Graden entstehen)
- man bildet von der Differenz die Quadrate
- die Summe der Quadrate soll minimal sein
- es entsteht auf diese Art- und Weise genau eine Gerade
Die oben im Chart rot markierten Linien stellen die Fehler der Regressionsgeraden dar
= Residuum = e
− =
e
e bezeichnet den Fehler, den man macht, wenn man mit der Regressionsgeraden arbeitet!
Methode der kleinsten Quadrate
Die Summe der Residualquadrate soll minimal sein!
n ! ∑
Copyright © 2001 – 2004 by bwl24.net Alle Angaben ohne Gewähr! Seite 7
Quote paper:
Dipl. Betriebswirt (FH) Torsten Montag, 2006, Statistik III - Deskriptive Statistik, Munich, GRIN Publishing GmbH
This text can be quoted and accessed from this url:
Embed
DOI
Das lebensweltorientierte Konzept nach Hans Thiersch
Lebensweltorientierung - Gesch...
Termpaper, 27 Pages
Eine Diskussion der aktuellen ...
Politics - International Politics - Region: Western Europe
Essay, 11 Pages
Physics - Nuclear Physics, Molecular Physics, Solid State Physics
Presentation / Essay (Pre-University), 12 Pages
Marketing für Produktinnovationen
Vermarktung von Produktinnovat...
Communications - Public Relations, Advertising, Marketing
Intermediate Diploma Thesis, 46 Pages
´GemeinSinn` - Eine uneingeschränkte Teilhabe für Alle durch gemeinwes...
Master's Thesis, 115 Pages
Begriff, Theorie und neuere Tr...
Sociology - Individual, Groups, Society
Scholary Paper (Seminar), 21 Pages
Biogasanlagen sowie Nutzung und Bedeutung von Biogas
Geography / Earth Science - Miscellaneous
Scholarly Paper (Advanced Seminar), 21 Pages
Deskriptive Statistiken und Grafiken
Business economics - Didactics, Economic Pedagogy
Termpaper, 13 Pages
Elitenförderung und Elitenrekrutierung
Politics - Political Systems - Germany
Scholarly Paper (Advanced Seminar), 22 Pages
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Presentations, Models, Tutorials, Instructions
Elaboration, 39 Pages
Torsten Montag has published the text Statistik III - Deskriptive Statistik
Torsten Montag has uploaded a new text
Deskriptive Statistik und moderne Datenanalyse
Eine computergestützte Einführ...
Thomas Cleff
Arbeitsbuch zur deskriptiven und induktiven Statistik
Helge Toutenburg, Michael Schomaker, Christian Heumann, Malte Wißmann
Grundlagen - Methoden - Beispi...
Hans-Friedrich Eckey, Reinhold Kosfeld, Matthias Türck
0 comments