Statistik III - Deskriptive Statistik


Skript, 2006

27 Seiten


Leseprobe

Inhaltsverzeichnis

A Deskriptive Statistik
A.1 Zweidimensionale Häufigkeitsverteilung
A.2 Regressionsanalyse
A.2.1 Die Mathematik einer Geraden
A.2.2 Gauß 1777 – 1855 „Methode der kleinsten Quadrate“
A.2.3 Kovarianz
A.2.4 Lineares einfaches Bestimmtheitsmaß
A.3 Korrelation
A.3.1 Rangkorrelation (Sparman)
A.3.2 Korrelation – Ursache

A Deskriptive Statistik

A.1 Zweidimensionale Häufigkeitsverteilung

absolute Häufigkeit:

Gegeben sind die Merkmale X mit den Ausprägungen xj (j=1,2,...,n) und Y mit den Ausprägungen yk (k=1,2,...,q), die an den selben statistischen Einheiten erhoben werden. Die Anzahl der Beobachtungswerte, bei denen die Ausprägungskombinationen (xj, yk) auftritt heißt absolute Häufigkeit = h(xj, yk)

relative Häufigkeit:

Der Anteil der absoluten Häufigkeit an der Gesamtzahl n der Beobachtungen heißt relative Häufigkeit = f(xj, yk)

Abbildung in dieser Leseprobe nicht enthalten

zweidimensionale Häufigkeitsverteilung

Die Gesamtheit aller aufgetretenen Kombinationen von Merkmalsausprägungen und der dazugehörigen absoluten und relativen >Häufigkeit heißt zweidimensionale Häufigkeitsverteilung

Tabellarische Darstellung:

in Häufigkeitstabelle

Bsp.:

Von 70 Studies wurden Mathe und Englischnoten erfasst! (Mathe; Englisch) ➔ (4; 3);(5;1)

Ordnen! ➔ lexikografische Ordnung

(1;2);(1;4)

(2;1);(2;2)... oder Häufigkeitstabelle

Abbildung in dieser Leseprobe nicht enthalten

Grafische Darstellung:

- 3 dimensionale Darstellung mit Säulen
- Streudiagramm

Randverteilung:

Gegeben sei die 2 – dimensionale Häufigkeitsverteilung der Merkmale X und Y. Die zugehörige 1 – dimensionale Verteilung des Merkmals X (bzw. Y), bei der das Auftreten des Merkmals Y(bzw. X) unberücksichtigt bleibt, heißt Randverteilung von X (bzw. Y).

Abbildung in dieser Leseprobe nicht enthalten

Bsp.:

Abbildung in dieser Leseprobe nicht enthalten

Bedingte Verteilung:

Definition:

Gegeben sei die 2 – dimensionale Häufigkeitsverteilung der Merkmale X und Y. Die Häufigkeitsverteilung des Merkmales X (bzw. Y) , die sich für eine gegebene Ausprägung yk (bzw. xj) ergibt, heißt bedingte Verteilung von X (bzw. Y) für gegebenes yk (bzw. xj). Die Häufigkeiten der bedingten Verteilungen bezeichnet man mit h(xj/Y=yk) oder kurz h(xj/yk) und entsprechend f(xj/yk).

am Bsp.:

Abbildung in dieser Leseprobe nicht enthalten

=h(x1/y2)* = 3

*d.h. y1 und y3 können nicht mehr eintreten ➔ y2 ist gegeben ➔ x1 kann also nur 3 sein!

h(y3/x1)=4

Die absoluten bedingten Häufigkeiten können sofort aus der Tabelle abgelesen werden!

relative bedingte Häufigkeit:

f(x1/y2)= 3/5 =0,6

Abbildung in dieser Leseprobe nicht enthalten

f(y3/x1)=4/9=

Abbildung in dieser Leseprobe nicht enthalten

bedingte relative Häufigkeiten:

Abbildung in dieser Leseprobe nicht enthalten

Abhängige Merkmale:

(Abhängigkeit und Unabhängigkeit muss geklärt werden!)

Abhängigkeit:

Abbildung in dieser Leseprobe nicht enthalten

Wenn es für die Verteilung des Merkmales y nicht darauf ankommt wie groß x ist, dann besteht Unabhängigkeit. Wenn x und y unabhängig wären, dann dürfte es für die Verteilung von y nicht darauf ankommen was x ist. Die Verteilung von y müsste gleich sein. Das ist nicht der Fall ➔ x und y sind abhängig von einander.

Abbildung in dieser Leseprobe nicht enthalten

y unabhängig: relative Häufigkeit x ist für jede Ausprägung von y gleich ➔ dies ist hier nicht der Fall ➔ x und sind abhängig von einander!

Bei einem Nachweis der Unabhängigkeiten ist es egal, ob man dies an Zeilen oder Spalten zeigt.

Unabhängigkeit:

Abbildung in dieser Leseprobe nicht enthalten

Frage: Ist x abhängig von y?

Abbildung in dieser Leseprobe nicht enthalten

Es kommt für y – Verteilung nicht darauf an, welche Ausprägungen x annimmt, da relative Zeilenhäufigkeit entspricht immer dem x. (für jedes x ist y immer gleich)

Abbildung in dieser Leseprobe nicht enthalten

➔ x und y sind von einander unabhängig!

Abbildung in dieser Leseprobe nicht enthalten

Eine relative bedingte Häufigkeit in einer Zelle = relative Randhäufigkeit

Abbildung in dieser Leseprobe nicht enthalten

Gilt nur wenn x und y unabhängig sind!

Beispiel: (Einzelne Häufigkeiten sind nicht gegeben!)

Abbildung in dieser Leseprobe nicht enthalten

(10*12)/60=2

(10*30)/60=5

A.2 Regressionsanalyse

Abbildung in dieser Leseprobe nicht enthalten

Das Finden der best passendsten Gerade heißt Regression!

Regression von y auf x, nur dann, wenn x unabhängige und y abhängige Variable ist.

Man versucht durch das Finden der Geraden eine Prognose für weiter rechts liegende x zu stellen:

Voraussetzungen:

1) Es handelt sich um eine 2 – dimensionale Verteilung (x, y)
2) X und Y haben ein bestimmtes Skalenniveau (metrisch skalierte Daten)
3) bereits entdeckter linearer Zusammenhang zwischen X und Y

A.2.1 Die Mathematik einer Geraden

Abbildung in dieser Leseprobe nicht enthalten

- 2 Punkte bestimmen eine Gerade vollständig oder
- ein Schnittpunkt mit der y – Achse (A) und die Steigung der Gerade b (b = tan Abbildung in dieser Leseprobe nicht enthalten)

y = a + bx

Frage: Wie kann ich aus der Menge der Punkte die Parameter a und b berechnen?

Abbildung in dieser Leseprobe nicht enthalten

Welche Gerade ist die bestpassendste?

Es muss ein Kriterium entwickelt werden, welches diese beste Anpassung beschreibt!

A.2.2 Gauß 1777 – 1855 „Methode der kleinsten Quadrate“

Abbildung in dieser Leseprobe nicht enthalten

- Bestimmung der Differenz der tatsächlichen Punkte zu der Geraden (auf diese Art- und Weise würden unendlich viele Graden entstehen)
- man bildet von der Differenz die Quadrate
- die Summe der Quadrate soll minimal sein
- es entsteht auf diese Art- und Weise genau eine Gerade

Die oben im Chart rot markierten Linien stellen die Fehler der Regressionsgeraden dar

= Residuum = e

Abbildung in dieser Leseprobe nicht enthalten

e bezeichnet den Fehler, den man macht, wenn man mit der Regressionsgeraden arbeitet!

Methode der kleinsten Quadrate

Die Summe der Residualquadrate soll minimal sein!

Abbildung in dieser Leseprobe nicht enthalten

[...]

Ende der Leseprobe aus 27 Seiten

Details

Titel
Statistik III - Deskriptive Statistik
Autor
Jahr
2006
Seiten
27
Katalognummer
V50539
ISBN (eBook)
9783638467407
Dateigröße
441 KB
Sprache
Deutsch
Schlagworte
Statistik, Deskriptive, Statistik
Arbeit zitieren
Dipl. Betriebswirt (FH) Torsten Montag (Autor), 2006, Statistik III - Deskriptive Statistik, München, GRIN Verlag, https://www.grin.com/document/50539

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Statistik III - Deskriptive Statistik



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden