3
9.1.1 Negative Korrelation 43
9.1.2 Positive Korrelation 44
9.1.3 Keine Korrelation 45
9.2 Korrelation und Kausalität 46
9.2.1 Die unmittelbare Korrelation 47
9.2.2 Die mittelbare Korrelation 48
9.2.3 Die Scheinkorrelation 48
9.2.4 Die Nonsens-Korrelation 50
10 Aufgaben 51
10.1 Wunschalter des Partners in Kontaktanzeigen 51
10.2 Weiß oder Braun - wo ist mehr drin? 56
10.3 Schulnotenvergleich 58
10.3.1 Mathematik und Latein 58
10.3.2 Mathematik und Französisch 61
10.3.3 Musik und Kunst 63
10.4 Würmer und Äpfel 65
10.5 Lieblingsfarbe und Lieblingssorte bei RitterSport 67
10.6 Gleiche Geschmäcker bei Geschwistern? 76
10.7 Bauernregeln 78
10.7.1 Simon, Juda und Cäcilia 78
10.7.2 St. Anton und St. Peter 79
11 Schluss 83
12 Quellen-und Literaturverzeichnis 85
»So eine Arbeit wird eigentlich nie fertig, man muß sie für fertig
erklären, wenn man nach Zeit und Umständen das möglichste
1 Einleitung
»STATISTIK IST FÜR MICH DAS INFORMATIONSMITTEL DER MÜNDIGEN. WER MIT IHR UM-GEHEN KANN, KANN WENIGER LEICHT MANIPULIERT WERDEN. DER SATZ: ›MIT STATISTIK KANN MAN ALLES BEWEISEN‹ GILT NUR FÜR DIE BEQUEMEN, DIE KEINE LUST HABEN, GENAU
Mit dem Beschluss, meine Facharbeit über die Korrelationsanalyse zu schreiben, habe ich mich für einen Bereich aus der deskriptiven Statistik entschieden. Als ich mir einen groben Überblick über das, was mir da bevorstand, verschaffte, musste ich feststellen, dass es zu weit führen würde, auf alle Aspekte der Korrelationsanalyse einzugehen. Daher ließ ich einzelne Themengebiete, die oft mit der Korrelation zusammen auftreten (z.B. Regression, partielle Korrelation), aus. Stattdessen konzentrierte ich mich auf die Berechnung von Zusammenhängen zwischen zwei verschiedenen Variablen.
Der letzte Satz der oben zitierten Aussage trifft meiner Meinung nach äußerst genau auf die Korrelationsanalyse zu. So lassen sich mit ihr »beweisen«, dass Störche Kinder bringen und Fieber Läuse verjagt. Für »die Bequemen, die keine Lust haben, genau hinzusehen« möge dieser »Beweis« aussagekräftig genug sein. Alle anderen, die sich mit der Korrelationsanalyse beschäftigt haben, wissen, dass die eine Erscheinung die andere keineswegs bedingen muss. Durch das Verfassen dieser Arbeit erhoffe ich mir den sicheren Umgang mit zusammenhängenden Erscheinungen und deren Dokumentation. Auch verspreche ich mir, den Hintergrund vieler Statistiken leichter erschließen, um dadurch deren Ergebnis leichter interpretieren zu können.
Die vorliegende Arbeit beschäftigt sich zunächst mit der Theorie der Korrelationsanalyse. Dabei werden nach der Definition und dem geschichtlichen Hintergrund die verschiedenen Formeln, die zur Berechnung der Korrelation bestimmter Variablen hinzu-
1 http://www.stubig.com.Sammlung von Zitaten zur Statistik.
http://www.stubig.com/Wissenschaft/Zitate.html; aufgerufen am 29.10.2010
2 * 19. Dezember 1916 in Berlin; † 25. März 2010 in Allensbach; Professorin für Kommunikationswissenschaft
gezogen werden, einzeln dargelegt. Dies geschieht meist an einem Beispiel, um die Anwendung der Formel zu veranschaulichen. Danach erfolgt unter der Rubrik »Aufgaben« der praktische Teil meiner Arbeit, in der ich die Formeln auf Alltagsprobleme anwendete. Dabei wog ich unter anderem Eier, untersuchte Kontaktanzeigen, befragte Passanten in der Frankfurter Hauptwache hinsichtlich ihres Farb- und Schokoladengeschmackes, untersuchte Schülernoten in verschiedenen Fächern auf deren Zusammenhang, befasste mich mit dem Wunschalter in Kontaktanzeigen, prüfte Bauernregel auf ihre Glaubwürdigkeit und den »verwandten« Geschmack von Geschwistern. Was sich oft als mühsame Arbeit aufgrund der langwierigen, viel Zeit in Anspruch nehmenden Auswertung der einzelnen Daten zeigte, wurde am Ende jedes Experiments mit einem Ergebnis belohnt.
Walldürn, am 18. 07. 2011
2 Korrelation - Was ist das?
Die Korrelation ist ein »nur statistisch, mit Hilfe der Wahrscheinlichkeitsrechnung zu erfassender [loser, zufälliger] Zusammenhang zwischen bestimmten Erscheinungen« 1 so jedenfalls definiert der »Duden« den genannten Begriff. Nach allgemeinem Verständnis im Alltag jedoch wird unter »Korrelation« eine »irgendwie geartete Beziehung« 2 zwischen unterschiedlichen Komponenten aufgefasst.
In der deskriptiven Statistik, die Kausalzusammenhänge sowohl erforscht als auch untersucht, ist diese Definition hingegen viel zu unpräzise. Zwar ist »Korrelation« der mathematische Begriff für den laienhaften »Zusammenhang«, aber eine einheitliche Definition dieses Wortes gibt es in der Statistik nicht. 3
Das Hauptziel der Statistik besteht darin, Datenmaterial zu analysieren, auszuwerten und eine Relation, beziehungsweise einen Zusammenhang innerhalb bestimmter Charakteristika herzustellen. 4 Die Methode, derer sie sich bedient, um ihr Ziel zu verwirklichen, bezeichnet man als Korrelationsanalyse. Mit dieser wird vor allem der Zusammenhang »zweier gleichberechtigter Merkmale« 5 ermittelt. Ferner fungiert sie als Indikator für die Intensität der Beziehung und kommt nur dann zum Einsatz, wenn die Richtung der Relation nicht bekannt oder nicht von Relevanz ist 5 . Somit lässt sich »Korrelation« im engeren Sinne wie folgt definieren:
Daneben existiert zur Bestimmung der Art eines Zusammenhangs auch noch das Phänomen der Regression. 5 Innerhalb dieses Themenbereiches gibt es eine Vielzahl von
1 Drosdowski, G. et al., DUDEN Deutsches Universalwörterbuch, 2. Auflage, Mannheim 1989, S. 886
2 TIEDE, M. (1987): Statistik, Regressions-und Korrelationsanalyse, München: Oldenbourg Verlag; S. 1
3 Vgl. TIEDE, S. 1f.
4 Nach http://www.mathe-online.at (19.01.2004).BERGER, K.(2004): Die Korrelation von Merkmalen.
http://www.mathe-online.at/materialien/klaus.berger/files/regression/korrelation.pdf; aufgerufen am
14.08.2010
5 Nach http://www.imbe.med.uni-erlangen.de;MUELLER, M.(2007): Korrelation.
http://www.imbe.med.uni-erlangen.de/lehre/Querschnittsbereich1/Unterlagen/; aufgerufen am 14.08.2010
6 Grafik entnommen aus http://www.mathe-online.at(14.08.2010)
Rechenarten, auf die jedoch in dieser Arbeit nicht näher eingegangen werden soll. Obwohl die Gedankengänge und Aufgabenstellungen bei der Korrelation (»wie stark ist der Zusammenhang?«) und der Regression (»von welcher Art ist der Zusammenhang?«) verschieden sind, besteht zwischen den beiden Teilgebieten dennoch eine gewisse Beziehung. Dies führte dazu, den Korrelationsbegriff als Oberbegriff für zwei voneinander abweichende Fragestellungen in Anspruch zu nehmen. 1
Korrelation (im engeren Sinne)
1 Vgl. FÖRSTER, E. & Rönz, B.(1979): Methoden der Korrelations- und Regressionsanalyse, Ein Leitfaden für
Ökonomen, Berlin: Verlag Die Wirtschaft; S. 20f.
3 Historisches zur Korrelation
3.1 Von der Korrelationsanalyse zum Korrelationskoeffizienten
Der Begriff »Korrelation« leitet sich von dem lateinischen »co - relatio« ab und bezeichnet eine Wechselbeziehung, »das Aufeinander-bezogen-Sein von zwei Begriffen oder Dingen«. 1 Er gewann etwa in der Mitte des 19. Jahrhunderts durch Sir Francis Galton 2 (Vetter von Charles Darwin) und Karl Pearson 3 an Bedeutung.
Anfangs bediente man sich der Korrelationsanalyse insbesondere in den Naturwissenschaften, speziell in der Biologie. Später fand sie aber auch Anwendung in den Wirtschaftswissenschaften, wo sie praktische Resultate hervorrief.
Als Galton 1859 Darwins 4 »Der Ursprung der Arten« gelesen hatte, widmete er sich der Genetik. Er fragte sich, weshalb die Körpergrößen der Menschen nicht in zwei Extrema auseinanderdriften, sodass es lediglich »Zwerge« und »Riesen« gebe. Laut Darwins Theorie müssten kleine Eltern kleine Kinder und große Eltern große Kinder haben. Nach umfassenden Untersuchungen an Tieren stellte Galton die Hypothese auf, dass die Körpergrößen der Kinder stets auf das Mittelmaß komprimiert werden. Diesen Vorgang bezeichnete Galton als »Regression« und publizierte 1885 sein Werk »Die Regression in Richtung auf das allgemeine Mittelmaß bei der Vererbung der Körpergröße«. Auf dieser Erkenntnis basierend begründete er den Korrelationskoeffizienten r, der zahlenmäßig die Stärke der Korrelation festhält. Dieser wurde erst später durch seine Kollegen Bravais 5 und Pearson bekannt, nach welchen er letztlich auch benannt wurde. 6
1 http://www.wissen.de.Wissen Media Verlag © :München.
http://www.wissen.de/wde/generator/wissen/ressorts/bildung/index,page=1169818.html; aufgerufen am
14.08.2010
2 * 16. Februar 1833 in Sparkbrook, Birmingham; † 17. Januar 1911 in Haslemere, Surrey; britischer Naturwissen
schaftler und Schriftsteller
3 * 27. März 1857 in London; † 27. April 1936 in Coldharbour, Surrey; britischer Mathematiker
4 * 12. Februar 1809 in Shrewsbury; † 19. April 1882 in Downe; britischer Naturwissenschaftler
5 * 23. August 1811 in Annonay, Frankreich; † 30. März 1863 in Le Chesnay; französischer Physiker
6 Vgl. FÖRSTER & RÖNZ; S. 50ff.
3.2 »Groß« ist nicht gleich »groß«
Galton behauptete zunächst, dass Wörter wie »groß« und »klein« oder »leicht« und »schwer« ohne eine Beziehung zu einer Tatsache nicht sonderlich aussagekräftig seien. Es sei falsch anzuführen, dass große Männer automatisch schwerer als kleine seien, ohne davor zu definieren, was »große Männer« eigentlich sind. Für den einen mag 1,80m bereits »groß« sein, ein anderer empfindet diese Maße als »klein«. Somit sind solche Begriffe relativ und zahlenmäßig nicht eindeutig festlegbar. Um dennoch eine Verwendung für derartige Worte zu finden, setzte Galton die Bedingung voraus, dass jene nur »in bezug[sic!] auf einen wie auch immer definierten Durchschnitt gelten« 1 müssen. Demnach bedeutet »groß« in einem bestimmten Kontext nichts anderes als »größer als der Durchschnitt«, »klein« folglich »kleiner als der Durchschnitt«. Dabei spielen die Tatsächlichen Maße eine irrelevante Rolle - das eigentlich Interessante stellt die Abweichung vom Mittelmaß dar. Die Behauptung »große Männer wiegen mehr als kleine« müsste entsprechend übersetzt werden: »Überdurchschnittlich große Männer wiegen mehr als das Durchschnittsgewicht. Männer, deren Körpergröße unter dem des Mittelmaßes liegt, bringen unterdurchschnittlich viele Kilos auf die Waage. 2 « Der Durchschnittswert lässt sich hierbei mithilfe des arithmetischen Mittels berechnen.
1 Nach: KRÄMER, W. (1998):Statistik verstehen. Eine Gebrauchsanweisung. 3. Auflage.
Frankfurt/Main:Campus Verlag; S. 185
2 Vgl. KRÄMER; S. 185
4 Der BRAVAIS-PEARSON-KORRELATIONSKOEFFIZIENT
Voraussetzung für die Anwendung dieses Korrelationskoeffizienten, der auch EMPIRI- SCHER KORRELATIONSKOEFFIZIENT 1 bzw.PRODUKTMOMENT-KORRELATIONSKOEFFIZIENT genannt wird, ist, dass es sich bei den zu untersuchenden Variablen x und y um zwei proportionalitätsskalierte Variablen handelt. 2 Die Komponenten müssen quantitativ erfassbar sein und einen berechenbaren Durchschnittswert zulassen.
4.1 Berechnung des Bravais-Pearson-Korrelationskoeffizienten r - Möglichkeit 1
Im Folgenden soll anhand eines Beispiels der Bravais-Pearson-Koeffizient verdeutlicht werden. Dabei orientiert man sich an der Behauptung »Große Männer wiegen mehr als kleine«.
Untersucht wurden Körpergröße und Gewicht von 13 Männern. Diese Daten wurden in der folgenden Tabelle (Abb.1) festgehalten:
1 Vgl. SACHS, L. (1972): Angewandte Statistik. Methodensammlung mit R. 13. Auflage. Heidelberg: Sprin
ger-Verlag Berlin-Heidelberg; S. 102
2 http://shop.elsevier.de(02.07.2004).ELSEVIER: Einfache Korrelationsanalyse. Podukt-Moment-
Korrelation zwischen zwei proportionalitätsskalierten Merkmalen.
http://shop.elsevier.de/sixcms/media.php/795/Einfache%20Korrelationsanalyse.pdf; aufgerufen am
23.08.2010
schreiben.
Die durchschnittliche Größe beträgt
=
Setzt man nun die jeweiligen Zahlenwerte in die Formel ein, erhält man für :
=
Entsprechend erhält man für das durchschnittliche Gewicht
=
Wie man nun erkennen kann, wiegt die erste Person aus Abb.1 um also 15,2 kg weniger und ist gleichzeitig , also 11,3 cm kleiner als der Durchschnitt, während der letzte Kandidat das Durchschnittsgewicht um 16,8 kg und die Durchschnittsgröße um 12,7cm übertrifft. Eine weitere Überlegung von Galton war, dass je weniger die gemessenen Daten streuen, die einzelnen Abweichungen vom Mittelwert umso gravierender sind. Dies bedeutet nichts anderes als, dass
»eine gegebene Abweichung vom Mittelwert […] um so mehr aus dem Rahmen
[fällt], je enger sich die Daten um den Mittelwert versammeln: Wenn alle Männer
80 Kilo wiegen und nur einer bringt zwei Zentner auf die Waage, wiegt das im
wahrsten Sinne des Wortes mehr, als wenn die Gewichte gleichmäßig zwischen 60
und 100 Kilo streuen. « 1
Deshalb schlug Galton vor, sich bei den Abweichungen der einzelnen Daten an der »Standardabweichung« zu orientieren, anstatt diese in »cm« oder »kg« zu messen. 2 Die Standardabweichung bezeichnet dabei die mittlere Abweichung vom Durchschnittswert und dient der Beschreibung der Punktwertverteilung. 3
4.1.1 Die Varianz s 2
a) „Klassische Formel“
Als Varianz wird der Quotient aus der Summe aller quadrierten Abweichungen vom Mittelwert durch die Anzahl der Versuchsobjekte bezeichnet, gemäß der Formel: 4
=
Für die Varianz bei der Größe im aktuellen Beispiel ergibt sich:
=
=
Nach äquivalenter Rechnung ergibt sich für die Varianz des Gewichts :
=
1 Zitiert nach KRÄMER; S. 186
2 Nach KRÄMER; S. 186
3 Vgl. LOHNES, P. R. & COOLEY, W. W.(1968): Einführung in die Statistik. Beiträge zur empirischen
Unterrichtsforschung. Hannover: Hermann Schroedel Verlag KG; S. 58
4 Vgl. LOHNES & COOLEY; S. 54ff.
4.1.2 Die Standardabweichung
Sie entspricht der Quadratwurzel der Varianz :
Hier wird die Notwendigkeit des vorherigen Kapitels deutlich: Um die Standardabweichung berechnen zu können, muss vorher die Varianz bekannt sein.
Für die Standardabweichung der Größe s x gilt:
Für die Standardabweichung des Gewichts s y ergibt sich:
4.1.3 Die Standardisierung der gemessenen Größen
Die beiden Werte s x und s y werden nun als Maß für die mittlere Abweichung genommen, an welcher sich die gemessenen Abweichungen x n und y n orientieren sollen. Dabei werden die Messdaten standardisiert, indem sie als Vielfache der Standardabweichung ausgedrückt werden. 2 Die Umrechnung in die standardisierte Größe X i erfolgt dabei auf Basis der folgenden Funktion:
Der erste Kandidat der Tabelle in Abb. 1 hat eine Größe von 170cm; das entspricht umgerechnet:
X 1 =
Seine Größe weicht also um 1,62 Standardabweichungen von dem Durchschnittswert
1 Vgl. MÜLLER, A.(1991): Abitur-Training Mathematik/Stochastik. Leistungskurs Grundlagen und
Aufgaben mit Lösungen. Auflage 2008. Freising: STARK Verlagsgesellschaft mbH & Co. KG; S. 40
2 Vgl. KRÄMER; S. 187
ab. Das negative Vorzeichen deutet darauf hin, dass sich der Wert unterhalb des Durchschnittswertes befindet.
Entsprechend erhält man für das Gewicht nach der Formel Y i =
Y 1 =
Das Gewicht liegt um 1,49 Standardabweichungen unter dem Durchschnittswert . 1
Auf diese Art lassen sich alle Werte aus Abb. 1 standardisieren. Die folgende Tabelle (Abb. 3) zeigt die standardisierten Werte aller gemessenen Gewichte und Größen auf zwei Dezimale gerundet:
Abb.3
Ein Vorteil von standardisierten Werten ist die Tatsache, dass diese nicht von den ursprünglich gemessenen Einheiten abhängen. Es spielt also keine Rolle, ob das Gewicht in Kilogramm, Tonnen oder Zentner gemessen wird, der standardisierte Wert bleibt dabei immer der gleiche. So kann man Punktwerte von verschiedenen Einheitsmaßen einfacher miteinander vergleichen. Aus den neu berechneten Werten lässt sich erneut ein Diagramm (Abb. 4) aufstellen, das dem ersten (Abb. 2) ähnelt: 2
1 Vgl. KRÄMER; S. 187
2 Vgl. LOHNES & COOLEY; S. 61
Wie sich aus dem Diagramm entnehmen lässt, befinden sich die meisten Punkte entweder im ersten oder dritten Quadranten. Ein positiver x-Wert zieht (meist) einen positiven y-Wert nach sich; umgekehrt lässt sich einem negativen x-Wert (meist) ein negativer y-Wert zuordnen. Bei dieser Äquivalenz spricht man von einer positiven Korrelation.
4.1.4 Berechnung des Korrelationskoeffizienten
Mit den soeben ermittelten Werten lässt sich der Bravais-Pearson-Korrelationskoeffizient ermitteln. Er entspricht der »mittleren Fläche, welche die Punkte unseres Diagramms mit den Mittelwert-Achsen bilden« 2 . Dabei sind die Flächen im ersten und dritten Quadranten positiv (»+« »+« und » - « » - «), die Flächen der zweiten und vierten Quadranten negativ (»+« » - « bzw. » - « »+«). Um den Wert der mittleren Fläche zu ermitteln, muss das arithmetische Mittel auf die Teilflächen angewendet werden. Allgemein lässt sich somit schreiben:
r xy =
Im obigen Beispiel ergibt sich für den Korrelationskoeffizienten:
1 Diagramm entnommen aus KRÄMER; S. 188
2 Zitiert aus: KRÄMER, W. S. 189
Arbeit zitieren:
Vanessa Wegert, 2010, Korrelationsanalyse - Berechnung von Zusammenhängen zwischen zwei verschiedenen Variablen, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Mathematik - Mathematik als Schulfach: Korrelationsanalyse - Berechnung von Zusammenhängen zwischen zwei verschiedenen Variablen ist nun auf dem Buchmarkt erhältlich
Mathematik - Mathematik als Schulfach: neuer Titel erschienen: Korrelationsanalyse - Berechnung von Zusammenhängen zwischen zwei verschiedenen Variablen
Vanessa Wegert hat einen neuen Text hochgeladen
Logische Untersuchungen: Zweiter Band: Untersuchungen Zur PH Nomenolog...
Edmund Husserl, U. Panzer
Ian Hamilton Finlay - Zwei Gärten / Two Gardens
Einsamkeit und Entsagung / Sol...
Sam Rebben, Pia M. Simig
Zwei Altert Mliche Litaneien Aus Dem Paschabuch Der Koptischen Kirche
Willi Heffening, Anton Baumstark
0 Kommentare