Was ist den Deutschen wichtig am eigenen Beruf? Eine Clusteranalyse


Hausarbeit (Hauptseminar), 2012
30 Seiten, Note: 2,3
Anonym

Leseprobe

Inhaltsverzeichnis

1. Einleitung

2. Grundlagen der Clusteranalyse

3. Durchführung der Clusteranalyse
3.1 Auswahl des Untersuchungsgegenstands
3.2 Voraussetzungen der Clusteranalyse
3.3 Die hierarchische Clusteranalyse
3.4 Die nicht-hierarchische Clusteranalyse (Clusterzentrenanalyse)
3.4.1 Clusterzentrenanalyse: 6 Cluster
3.4.2 Clusterzentrenanalyse: 5 Cluster
3.4.3 Clusterzentrenanalyse: 4 Cluster
3.4.4 Clusterzentrenanalyse: 3 Cluster
3.4.5 Interpretation der Clusterlösungen
3.4.6 Auswahl der besten Clusterlösung

4. Analyse: Bedeutung wichtiger Aspekte des eigenen Berufs

5. Abschließende Bemerkungen

Anhang

I. Literaturverzeichnis

II. Tabellenverzeichnis

III. Abbildungsverzeichnis

IV. Tabellen und Abbildungen

1. Einleitung

Im Leben eines Menschen in Deutschland nimmt die berufliche Anstellung sehr viel Zeit ein. Nahezu das gesamte Erwachsenenleben wird dadurch geprägt. Dennoch können die Berufsphasen und ihr Verlauf sehr unterschiedlich ausfallen. Ein sehr wichtiger Ansatzpunkt für die Wahl oder die Stellung gegenüber dem eigenen Beruf ist die innere Motivation. Manchen treibt die eigene Karriere an, ein hohes Einkommen, Prestige, andere hingegen wollen einen Sinn in ihrem Job sehen, sie wollen anderen helfen, etwas Nützliches tun. Für andere wiederum sind Dinge wie Selbstverwirklichung oder Einflussmöglichkeiten bei der Arbeit von großer Bedeutung.

Auf Basis der Allgemeinen Bevölkerungsumfrage1 (Allbus) von 2006 wurden einige der Fragen zur Bedeutung der beruflichen Stellung untersucht. Die zufällig ausgewählten Personen wurden danach gefragt, wie wichtig die folgenden Aspekte für sie sind: „sichere Stellung“, „hohes Einkommen“, „Aufstiegschancen“, „interessante Tätigkeit“, „selbstständiges Arbeiten“, „helfender Beruf“ und „soziale Tätigkeit“. Mittels einer Faktorenanalyse wurden diese Variablen auf Zusammenhänge untersucht und sie konnten zu drei dahinterliegenden Dimensionen zusammengefasst werden. So bleiben drei Aspekte übrig, welche eine besondere Bedeutung für die Wichtigkeit des Berufs aufweisen. Zum einen sind es Aspekte der „Karriere“ („hohes Einkommen“, „sichere Stellung“, „Aufstiegschancen“), zum anderen „soziale“ Aspekte („helfender Beruf“, „soziale Tätigkeit“) und Aspekte der „Selbstverwirklichung“ („interessante Tätigkeit“, „selbstständiges Arbeiten“). Die vorliegende Arbeit widmet sich der Frage, ob sich nicht nur die Fragen zusammenfassen lassen, sondern auch welche Bevölkerungsgruppen sich diesen Merkmalen zuordnen lassen. Dies wird mithilfe einer Clusteranalyse untersucht. Das Verfahren steht im Mittelpunkt, weshalb es sehr ausführlich beschrieben wird. Die einzelnen Schritte und die jeweiligen Schlussfolgerungen und Entscheidungen werden hervorgehoben.

2. Grundlagen der Clusteranalyse

Das Verfahren der Clusteranalyse zählt zu den klassifizierenden Verfahren. Im Unterschied zu den dimensionsreduzierenden Verfahren (hierzu zählt unter anderem die Faktorenanalyse) werden hierbei nicht die Variablen zusammengefasst, es werden hier die Fälle nach ihrem Antwortverhalten in Klassen eingeteilt. Ziel ist die „Einteilung einer Anzahl von Objekten in homogene Gruppen“2. Bei der Clusteranalyse werden diese Klassen „Cluster“ genannt. Die gebildeten Klassen sollen ähnliche Objekte enthalten, allerdings sollen sich die Cluster deutlich voneinander unterscheiden und dürfen keine zu großen Ähnlichkeiten aufweisen.3

Der Begriff „Clusteranalyse“ steht für eine Vielzahl an Verfahren, welche die Zuordnung der Fälle in die Gruppen berechnen. Dabei wird hauptsächlich zwischen den hierarchischen und den nicht-hierarchischen Verfahren unterschieden. Bei der hierarchischen Clusteranalyse werden zuerst die einzelnen Fälle zu Clustern zusammengeführt und anschließend werden immer mehr dieser Cluster aufgrund ihrer Distanzen zusammengefasst bis sich schließlich alle Fälle in einer einzigen Gruppe befinden. Während den Zuordnungen nimmt das Verfahren keine Veränderungen oder Neugruppierungen vor sondern geht Schritt für Schritt vor. Nachträgliche Optimierungen finden im Verfahren keine Anwendung. Eine sinnvolle Lösung muss aus all diesen möglichen Clustern gewählt werden. Bei den nicht-hierarchischen Verfahren muss die Anzahl der Cluster vorher angegeben werden. Für die zu erstellenden Cluster wird dann aufgrund der Distanzen zu den Gruppenmittelpunkten versucht die „optimale Homogenität unter allen Gruppierungen“4 zu erreichen. Folglich werden die Fälle so lange zu den Clustern zugeordnet, bis alle Fälle zugeteilt sind und sie den geringsten mittleren Abstand zum Clustermittelwert aufweisen. Diese Verfahren haben den Vorteil, dass sie die optimale Homogenität zum Ziel haben und dass sie die Fälle beliebig verschieben und neu zuordnen können. Jedoch gilt es bei den nicht-hierarchischen Clusteranalysen zu beachten, dass die jeweilige Sortierung der Fälle als Startpunkt der Zuordnung herangezogen wird. Verändert man die Reihenfolge der Fälle, so kann sich auch die Zuordnung ändern.

3. Durchführung der Clusteranalyse

Das dritte Kapitel umfasst die Durchführung der unterschiedlichen Clusteranalysen. Im Folgenden werden die ausgewählten Variablen dargelegt (Kapitel 3.1) und die Voraussetzungen des Verfahrens (Kapitel 3.2) kurz erläutert. Darauf folgend werden sowohl die hierarchische (Kapitel 3.3) als auch die nicht-hierarchische Analyse (Kapitel 3.4) beschrieben.

3.1 Auswahl des Untersuchungsgegenstand

Grundlage der Untersuchung sind die Befragungsdaten des Allbus5 2006. Die dort enthaltenen Fragen zur Wichtigkeit einzelner Aspekte am eigenen Beruf (v537 bis v543) werden zur Analyse herangezogen. Da die Ausgangsvariablen in ordinaler Form vorliegen, werden sie in einem ersten Schritt mithilfe einer Faktorenanalyse zusammengefasst.6 Die so entstehenden Variablen weisen metrisches Skalenniveau auf. Durch die Reduzierung entstehen drei Faktoren: „Erfolg“, „soziale Aspekte“ und „Selbstverwirklichung“.7 Diese Dimensionen werden für die Clusteranalyse verwendet.

Tabelle 1: Übersicht über die Faktoren

Abbildung in dieser Leseprobe nicht enthalten

3.2 Voraussetzungen der Clusteranalyse

Ähnlich wie bei der Faktorenanalyse ist auch das Verfahren der Clusteranalyse sehr robust und erfordert nur die Einhaltung einiger weniger Voraussetzungen. Die Variablen sollten in gleicher Weise skaliert sein, d. h. alle Variablen sollten das gleiche Skalenniveau aufweisen (entweder alle metrisch oder alle ordinal skaliert). Je besser das Skalenniveau ist, desto besser sind die Variablen geeignet. Im vorliegenden Fall sind die Variablen metrisch skaliert, weisen also das höchste Skalenniveau auf.

Die beobachteten Variablen sollten keine Zusammenhänge miteinander aufweisen. Da hier die gespeicherten Werte einer Faktorenanalyse verwendet werden, sind alle drei Variablen unabhängig voneinander (Korrelationskoeffizient nach Pearson r = 0). Die Unabhängigkeit ist auf das Verfahren der Faktorisierung zurückzuführen.

Problemtisch können Ausreißer sein, weshalb untersucht werden sollte, ob es solche gibt. Da bei der Clusteranalyse die mittleren Abstände der Fälle zum Clusterzentrum beobachtet werden, fallen Objekte, welche besonders weit draußen liegen, sehr stark ins Gewicht. Ausreißer sollten möglicherweise aus der Analyse ausgeschlossen werden. Identifiziert werden können sie unter anderem mithilfe der hierarchischen Clusteranalyse. Hier werden die Zuordnungen aller Fälle aufgezeigt und wenn einige der Fälle erst sehr spät zu eigenen Clustern zugewiesen werden, dann belegt dies, dass sie eine sehr große Distanz zu allen bereits bestehenden Clustern aufweisen. Weiterhin können die Ausreißer mittels einer einfachen Häufigkeitsauszählung ermittelt werden. Etwas deutlicher können sie durch Boxplots hervorgehoben werden.8 Problematisch an der Bestimmung ist, dass sich die Fallzahl ständig weiter reduzieren kann, selbst wenn die Ausreißer und Extremwerte in einem ersten Schritt ausgeschlossen werden.

Nach dem Ausschluss können weitere Fälle plötzlich als Ausreißer auftreten, weshalb an dieser Stelle keine weiteren Betrachtungen vorgenommen werden.

Ein weiterer wichtiger Punkt für die Clusteranalyse ist die Anzahl der zusammengefassten Objekte. Die Stichprobe sollte ausreichend groß sein, wenn Rückschlüsse auf eine Grundgesamtheit getroffen werden sollen. An dieser Stelle ist das Thema der fehlenden Werte von Bedeutung. Treten fehlende Daten auf, so muss entschieden werden, wie damit umgegangen wird. In der vorliegenden Arbeit werden alle Fälle ausgeschlossen, welche in mindestens einer der Variablen einen fehlenden Wert aufweisen. Dies reduziert die Fallzahl deutlich. Von den ursprünglichen 3421 Objekten gehen nur 1595 in die Analyse ein. Diese Zahl ist noch groß genug, um Rückschlüsse ziehen zu können. Nach der Einteilung der Cluster muss dann die Zahl der Fälle in den einzelnen Gruppen betrachtet werden, da auch hier das Prinzip der ausreichend großen Fallzahl Anwendung findet. Jedes Cluster sollte mindestens 20 Objekte umfassen. Ist dies nicht so, ist die Lösung nicht verwendbar.

Die verwendeten Variablen sind für die Analyse geeignet, da die Fallzahl groß genug ist (n = 1595), gleiche Skalenniveaus vorliegen (metrisch) und die Variablen unabhängig voneinander sind (r = 0). Somit kann die Clusteranalyse durchgeführt werden.

3.3 Die hierarchische Clusteranalyse

Nach der Prüfung der Voraussetzungen folgt nun der erste Schritt bei einer Clusteranalyse. Das hierarchische Verfahren wird als erstes durchgeführt, um die Anzahl möglicher Cluster einzugrenzen. Dazu werden die unterschiedlichen hierarchischen Verfahren angewandt und die jeweiligen Distanzmaße werden herangezogen, um die Entscheidung über die sinnvolle Clusterzahl zu treffen. Die sogenannten „Koeffizienten“ geben die Distanz zwischen dem jeweiligen Fall und dem neuen Cluster an. Gibt es hier sprunghafte Anstiege, dann deutet dies auf Grenzen möglicher Clusterzahlen hin. Um den besten Vergleich zu erhalten, werden alle möglichen hierarchischen Verfahren9 durchgeführt und dann die Distanzwerte miteinander verglichen.

Abbildung 1: „Fehlerkurven“ der hierarchischen Clusterverfahren

Abbildung in dieser Leseprobe nicht enthalten

Der Vergleich zwischen den Fehlerkurven ermöglicht die Einschränkung der Anzahl an möglichen Clustern. In Abbildung 1 wurden die Ergebnisse des Ward-Linkage ausgespart, da sie eine deutlich höhere Skalierung aufweisen.10 Der Verlauf nach der Ward-Methode weist nur sehr wenige eindeutige Elbows auf. Hier sind Knicke in den Übergängen vom 6. zum 5. Cluster und vom 4. zum 3. Cluster zu erkennen. Diese Ergebnisse werden nun mit den Verläufen aller anderen Methoden verglichen und so werden die geringste und die höchste Clusterzahl festgelegt.

Die Verläufe der Distanzwerte zeigen, dass es zahlreiche Hebungen gibt. Einige davon weit über zehn Clustern bis hin zu zwei Clustern. Auffällig sind die Hebungen die fast alle Methoden gemeinsam haben. In diesem Fall ist beim Übergang von sieben zu sechs Clustern ein „Elbow“ zu beobachten und es zeigt sich ein weiterer deutlicher Knick beim Übergang von einem zu zwei Clustern. Zwischendrin sind noch weitere starke Anstiege zu erkennen, allerdings ist das Ziel die Bestimmung der höchsten und der kleinsten Clusterzahl. Mögliche „Elbows“ in der Mitte werden nicht weiter beachtet. Alle Lösungen zwischen der höchsten und der kleinsten Clusterlösung werden ebenfalls geprüft. Da eine allzu hohe Anzahl an Clustern hier nicht sinnvoll erscheint werden lediglich die möglichen Lösungen im einstelligen Bereich geprüft. Da zwei Cluster eine zu starke Zusammenfassung bedeuten würden, wird die untere Grenze bei drei Clustern gesetzt. Als obere Grenze wird die Ward-Methode herangezogen, welche sechs Cluster nahelegt. Somit werden im Folgenden die 3- bis 6-Clusterlösung geprüft.

3.4 Die nicht-hierarchische Clusteranalyse (Clusterzentrenanalyse)

Nach der Festlegung der zu prüfenden Clusterlösungen mithilfe der hierarchischen Verfahren werden nun diese möglichen Lösungen geprüft. Da die nicht-hierarchischen Verfahren eine bessere Zuordnung der Fälle zu den jeweiligen Gruppen gewährleisten können, werden diese für die Einteilung herangezogen. Da die Zuteilung der Fälle von der Reihenfolge der Fälle abhängt, müssen mehrere Lösungen geprüft werden. Dazu werden die Fälle mehrmals neu sortiert, um neue Startpunkte zu erhalten. Diese Ergebnisse werden dann verglichen indem der mittlere Abstand aller Fälle zu den Clustermittelpunkten betrachtet wird. Je geringer der mittlere Abstand ist umso besser ist die Zuordnung zu den Clustern und umso besser ist die Lösung.11

Mittels einer Varianzanalyse werden die jeweiligen Clusterlösungen auf Unterschiedlichkeit der Gruppen untersucht. Weisen nur zwei der Gruppen keine signifikanten Unterschiede auf, dann ist die Lösung als nicht geeignet zu betrachten.

Die Analyse für die verschiedenen Clusterlösungen folgt den immer gleichen Schritten. Zuerst werden die Analysen durchgeführt mit unterschiedlichen Sortierungen und anschließend werden die vorliegenden Ergebnisse für alle Startpunkte miteinander verglichen. Betrachtet werden dabei die Varianzanalysen, um die Unabhängigkeit der Clusterlösungen zu untersuchen, die Anzahl der Fälle in den Clustern, diese sollten ausreichend groß sein, und abschließend werden die mittleren Abstände der Cluster betrachtet, je geringer der Abstand ist umso besser ist die Zuteilung der Fälle und die Sortierung liefert die bessere Lösung. Die inhaltliche Betrachtung folgt erst im Anschluss an die aufgezählten Analysepunkte.

3.4.1 Clusterzentrenanalyse: 6 Cluster

Als erstes wird die Lösung mit sechs Clustern geprüft. Ein wichtiger Punkt in der Prüffolge ist die Unabhängigkeit der gebildeten Gruppen zwischen einander. Sollten sich die Cluster zu sehr gleichen, so sind die gebildeten Gruppen nicht sinnvoll, da deutlich trennbare und unterschiedliche Gruppierungen erreicht werden sollen.

Tabelle 2: Varianzanalyse für alle Sortierungen (6 Cluster)

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3: Fallzahlen in den Clustern (6 Cluster)

Abbildung in dieser Leseprobe nicht enthalten

Als zweites bedeutendes Merkmal werden nun die Fallzahlen betrachtet. In jeder Gruppe sollten genug Fälle vorhanden sein, damit mathematisch damit überhaupt gerechnet werden darf. Sind die Fallzahlen zu gering12, so ist die Lösung nicht geeignet, da sie keine ausreichende Grundlage für weiterführende Berechnungen bietet. Lediglich deskriptive Analysen wären dann möglich.

[...]


1 Die Allbus-Befragung ist eine der größten Bevölkerungsumfragen in Deutschland und wird regelmäßig alle zwei Jahre von der Leibniz-Gesellschaft für Sozialwissenschaften (Gesis) durchgeführt.

2 Wiedenbeck / Züll S. 2

3 Vgl. Wiedenbeck / Züll S.2

4 Vgl. Wiedenbeck / Züll S.2

5 Allgemeine Bevölkerungsumfrage (Allbus) erhoben von der Leibnis-Gesellschaft für Sozialwissenschaften.

6 Siehe Syntax und Output

7 Die Ergebnisse der Faktorenanalyse sind dem Anhang zu entnehmen.

8 Vgl. Brosius SPSS 8, S.

9 SPSS stellt die folgenden hierarchischen Verfahren bereit: „Linkage zwischen den Gruppen“, „Linkage innerhalb der Gruppen“, „Nächstgelegener Nachbar“, „Entferntester Nachbar“, „Zentroid-Clustering“, „Median-Clustering“, „Ward-Clustering“

10 Die ausführlichen Ergebnisse sind in Tabellenform in der Output-Datei zu finden.

11 Für die Sortierung wurden aus allen Variablen zufällig 13 Stück ausgewählt nach denen sortiert wird. Diese sind: v8, v52, v86, v200, v251, v277, v293, v304, v344, v428, v517, v598

12 Weniger als 30 Fälle gelten stochastisch als zu gering.

Ende der Leseprobe aus 30 Seiten

Details

Titel
Was ist den Deutschen wichtig am eigenen Beruf? Eine Clusteranalyse
Hochschule
Albert-Ludwigs-Universität Freiburg  (Soziologie)
Veranstaltung
Clusteranalyse
Note
2,3
Jahr
2012
Seiten
30
Katalognummer
V309976
ISBN (eBook)
9783668090552
ISBN (Buch)
9783668090569
Dateigröße
842 KB
Sprache
Deutsch
Schlagworte
Clusteranalyse, Beruf, Gesellschaft, Individuum, Statistik, Untersuchung
Arbeit zitieren
Anonym, 2012, Was ist den Deutschen wichtig am eigenen Beruf? Eine Clusteranalyse, München, GRIN Verlag, https://www.grin.com/document/309976

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Was ist den Deutschen wichtig am eigenen Beruf? Eine Clusteranalyse


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden