Diese Ausarbeitung enthält nicht den Datensatz der Fallstudie, sondern lediglich die Aufgabenstellung und die Bearbeitungsergebnisse, welche auf Basis des Datensatzes gewonnen wurden. Dennoch können mittels dieser Unterlagen folgende Aspekte vermittelt werden:
x erste und weiterführende Schritte in SPSS – hier werden Anleitungen aus der Fachliteratur quasi “übersetzt” und direkt umgesetzt;
x dies erfolgt bezüglich gewisser Standardmethoden und –modelle – bspw. Regressions-, Korrelations- oder Faktoranalyse – wie sie in Statistikvorlesungen vorgestellt werden;
x Orientierung und Hilfestellung für ähnliche Statistik-Fallstudien und Seminar- oder Abschlussarbeiten wie sie in gängigen (Einführungs-)Kursen und Tutorien erstellt werden. Dies ist jedoch kein Grund, die vorliegenden Unterlagen im Copy-and-Paste-Verfahren zu verwenden! (Die Tutoren sind cleverer, als man glaubt.)
Die Aufgabenstellungen werden zu Beginn der Ausarbeitung angeführt. Jedes Aufgabenkapitel nimmt direkten Bezug auf die jeweilige Aufgabe, wobei stets die nötige Handhabung der SPSS-Software vorgestellt und entsprechend im Kontext der jeweiligen Aufgabe und der dahinter stehenden Statistiktheorie umgesetzt wird. Insofern ist der originäre Datensatz entbehrlich, da sich das nötige Statistikwissen und die Programmhandhabung auf beliebige ähnliche Fälle übertragen lassen.
Inhaltsverzeichnis
Geleitwort
Fallstudie: Hintergrund und Aufgabenstellung
Aufgabe 1: Definition von Variablen
Definitionserklärung der Variable MANN
Aufgabe 2: Lage- und Streuungsparameter; Korrelation
2.1 Differenzierung der Variablen ABTEILUN durch Filtern
2.2 Lage- und Streuungsparameter der einzelnen Abteilungen
2.2.1 Innendienst
2.2.2 Außendienst
2.2.3 Werk
2.3 Graphische Darstellung der Verteilung und Parameter
2.4 Korrelation
2.4.1. Zusammenhang Zufriedenheit und Einkommen
2.4.2 Zusammenhang Zufriedenheit und Abteilungszugehörigkeit
Aufgabe 3: Multiple lineare Regression
3.1 Die multiple lineare Regression, Modellformulierung
3.2 Schätzung der Regressionsfunktion
3.2.1 Schätzung des Einkommens
3.3 Prüfung der Regressionsfunktion
3.4 Prüfung der Regressionskoeffizienten
Aufgabe 4: Arbeiten mit Dummys; Kreuztabelle
4.1 Erstellung der Dummyvariablen DZUFRIED
4.2 Geschlechtsspezifische Unterschiede bei Zufriedenheit
Aufgabe 5: Binär logistische Regression
5.1 Die binär logistische Regression; Modellformulierung
5.2 Modellberechnung in SPSS
5.2.1 Datenausgabe und Interpretation
5.2.2 Beitrag der einzelnen Variablen
5.3 Schätzung der Wahrscheinlichkeit
5.3.1 Berechnung von Wahrscheinlichkeiten
Aufgabe 6: Faktoranalyse
6.1 Die Faktorenanalyse
6.2 Technischer Ablauf in SPSS
6.3 Analyse des Ergebnisausdrucks
Literaturverzeichnis
Geleitwort
Diese Ausarbeitung enthält nicht den Datensatz der Fallstudie, sondern lediglich die Aufgabenstellung und die Bearbeitungsergebnisse, welche auf Basis des Datensatzes gewonnen wurden. Dennoch können mittels dieser Unterlagen folgende Aspekte vermittelt werden:
- erste und weiterführende Schritte in SPSS – hier werden Anleitungen aus der Fachliteratur quasi “übersetzt” und direkt umgesetzt;
- dies erfolgt bezüglich gewisser Standardmethoden und –modelle – bspw. Regressions-, Korrelations- oder Faktoranalyse – wie sie in Statistikvorlesungen vorgestellt werden;
- Orientierung und Hilfestellung für ähnliche Statistik-Fallstudien und Seminar- oder Abschlussarbeiten wie sie in gängigen (Einführungs-)Kursen und Tutorien erstellt werden. Dies ist jedoch kein Grund, die vorliegenden Unterlagen im Copy-and-Paste-Verfahren zu verwenden! (Die Tutoren sind cleverer, als man glaubt.)
Die Aufgabenstellungen werden zu Beginn der Ausarbeitung angeführt. Jedes Aufgabenkapitel nimmt direkten Bezug auf die jeweilige Aufgabe, wobei stets die nötige Handhabung der SPSS-Software vorgestellt und entsprechend im Kontext der jeweiligen Aufgabe und der dahinter stehenden Statistiktheorie umgesetzt wird. Insofern ist der originäre Datensatz entbehrlich, da sich das nötige Statistikwissen und die Programmhandhabung auf beliebige ähnliche Fälle übertragen lassen.
Fallstudie: Hintergrund und Aufgabenstellung
Kurs: „Statistik mit SPSS“, Abschlussarbeit, Sommersemester 2003[1]
Die Personalabteilung der Firma Oelgemoeller Wurstwaren AG hat sich verzweifelt an Sie gewandt. Sie sollen die bereits erhobene Mitarbeiterbefragung auswerten.
Für die 460 zufällig ausgewählten Mitarbeiter liegen [in dem SPSS-File] folgende Variablen vor: Zum einen wurden gängige soziodemografische Merkmale erhoben (Alter, Geschlecht, Einkommen). Zusätzlich wurden firmenspezifische Angaben abgefragt (Abteilungsnummer, Anzahl der momentanen Überstunden und das Arbeitszeitmodell). Die Zufriedenheit mit der Arbeit wurde auf einer 10er-Skala von 0 (sehr unzufrieden) bis 10 (sehr zufrieden) erfasst und in der Variablen ZUFRIED abgespeichert. Des Weiteren wurde nach der Wichtigkeit einiger Aspekte des Arbeitsverhältnisses gefragt (W_1 bis W_6). Auch diese Variablen sind auf einer 10er-Skala von 0 (sehr unwichtig) bis 10 (sehr wichtig) erhoben. Einen SPSS-Übersichtsausdruck mit den notwendigen Details finden Sie im Folgenden.
Bearbeiten Sie folgende Fragen für die Patriarchen und Firmeninhaber, die Gebrüder Leopold und Ferdinand Oelgelmoeller:
1.) Beschreiben Sie die SPSS-Definition der Variablen „MANN“. Warum wurden die vorliegenden Einstellungen gewählt?
2.) Sie sollen die Einkommens-, Alters- und Zufriedenheitsangaben[2] getrennt für die drei Abteilungen anhand von wenigen Parametern der empirischen Verteilung skizzieren. Berechnen Sie geeignete Lage- und Streuungsparameter. Stellen Sie diese für eine Präsentation auch grafisch dar.
Überprüfen Sie, ob ein Zusammenhang zwischen folgenden Variablen auszumachen ist. Interpretieren Sie wenn möglich auch die Richtung des Zusammenhanges. Lassen sich diese Ergebnisse auf die Gesamtheit der Mitarbeiter übertragen?
a) Zufriedenheit und Einkommen und
b) Zufriedenheit und Zugehörigkeit zu einer Abteilung.
3.) Nachdem die Korrelationsanalyse einen Einfluss des Einkommens auf die Arbeitsplatzzufriedenheit zum Vorschein gebracht hat, sollen Sie untersuchen, von welchen Faktoren die Entlohnung in dem Betrieb abhängt. Wählen Sie als erklärende Größen Alter, Geschlecht und Abteilung. Achten Sie vor der Analyse drauf, dass die Daten für den Auswertungsschritt geeignet sind. Interpretieren Sie Ihr Ergebnis. Welche Einwände haben Sie gegen das vorgeschlagene Modell?
4.) Erstellen Sie eine Dummyvariable DZUFRIED, die genau dann den Wert „1“ annimmt, wenn ein Mitarbeiter auf der Zufriedenheitsskala („ZUFRIED“) mehr als 5 Punkte angegeben hat, sonst eine „0“. Untersuchen Sie, ob der Anteil der Zufriedenen bei Frauen wie Männern identisch ist oder ob geschlechtsspezifische Unterschiede bestehen.
5.) In einem weiteren Schritt wollen Sie konkurrierende Variablen heranziehen, die erklären sollen, ob ein Befragter sich als zufrieden einordnet. Verwenden Sie dazu die Größen Alter, Geschlecht, Einkommen, Dienstwagenbesitz, Überstunden und Abteilung. Interpretieren Sie Ihr Ergebnis.
6.) Zuletzt möchten Sie überprüfen, ob sich die Angaben über die Wichtigkeit verschiedener Aspekte des Arbeitsverhältnisses (Variablen W_1 bis W_6) zusammenfassen lassen. Führen Sie hierfür eine Faktoranalyse durch, bei der Sie auch die Faktorwerte in einer neuen Variablen speichern. Bestimmen Sie die Anzahl der Faktoren nach dem Kaiser-Kriterium. Interpretieren Sie die gefundenen Faktoren im rotierten Faktorraum und die wichtigsten Parameter Ihres Ergebnisses.
Aufgabe 1: Definition von Variablen
Definitionserklärung der Variable MANN
In der Grafik (Abb. 1.1) wird die Variable MANN in der Datenmaske (Variablenansicht) dargestellt. Sie ist bereits definiert und benannt, da es sich um einen vollständig erstellten SPSS-Datensatz handelt.
Abbildung in dieser Leseprobe nicht enthalten
(Abb. 1.1)
Jeder Variable kann über die Spalte Name ein Name zugeordnet werden. SPSS bedingt es, dass der Name maximal 8 Zeichen aufweisen darf, das ist auch der Grund warum diese Spalte nicht z.B. als „Geschlecht“ tituliert werden kann und man versucht sinnvolle Abkürzungen zu finden. Werden die Variablen nicht spezifisch benannt, dann erstellt das Programm automatisch Namen. (var00001, var00002 ...) Ebenso ist es möglich, über die Spalten Typ, Spaltenformat und Dezimalstellen Variablen genauer zu definieren. Die Spalte Typ bestimmt die Art der Variablen. Bei unserem Beispiel handelt es sich um einen numerischen Typ, weil es sich um Zahlenwerte (0 und 1, bedingt durch die Wertelabeldefinition) handelt. Neben der Variablen MANN wären in unserem Beispiel unter anderem auch die Größen Nettoeinkommen oder Alter als numerisch einzustufen. Über Spaltenformat bestimmen sie die Anzahl der Zeichen, die später abgespeichert werden sollen. Im Beispiel sind es 8 Zeichen, die in der Dialogbox Variablentyp festgelegt wurden. Die Dezimalstellen sind mit „0“ definiert, denn Nachkommastellen sind bei einer Binärcodierung von 0 und 1 nicht von Nöten. Das Variablenlabe l ist ein Etikett, mit dessen Hilfe man eine Variable näher beschreiben kann (bis zu 256 Zeichen sind möglich). Unser Variablenlabel ist Geschlecht, was keiner zusätzlichen Erläuterung bedarf. Wertelabels hingegen sind Etiketten, mit deren Hilfe man Merkmalsausprägungen unserer Variablen festlegen kann. Üblich ist es Ausprägungen durch einzelne Zahlen zu ersetzen Wir haben hier z.B. den Wert „0“ für das Etikett „Weiblich“, den Wert „1“ für das Etikett „Männlich“ vergeben. Die Spalte Fehlende Werte eröffnet die Option, benutzerdefinierte fehlende Werte zu benennen. Liegen z.B. bei einer Variablen keine Antwortvorgaben vor, so ist es dem Bearbeiter möglich, diese als fehlend zu deklarieren. Bei der Variablen MANN wurden keine fehlenden Werte entdeckt und somit auch nicht „programmiert“. Unausgefüllte Felder der Datenmatrix weist SPSS den „systemdefinierten fehlenden Werten“ zu. Das Feld Spalten bezieht sich auf die Breite, die dem jeweiligen Datenfeld bei der Anzeige der Daten im Dateneditor eingeräumt wird. In diesem Fall ist eine Breite von mindestens 4 nötig, um wenigstens den Spaltennamen „Mann“ erkennbar zu machen; für die reine Darstellung der Codes würde auch eine Breite von 1 genügen. Die Ausrichtung bestimmt die Lage der Daten im „Spreadsheet“ und ist im Beispiel mit „rechts“ definiert, was keiner Begründung bedarf. Zuletzt ist noch das Messniveau (metrisch, ordinal oder nominal) bestimmbar. Geschlecht bzw. MANN ist eine Dummyvariable, die zwei Kategorien beschreibt und ist somit eindeutig dem „nominalen“ Messniveau zuzuordnen.
Aufgabe 2: Lage- und Streuungsparameter; Korrelation
2.1 Differenzierung der Variablen ABTEILUN durch Filtern
Um die einzelnen Abteilungen differenziert zu betrachten, ist es notwendig, jeweils einen Filter zu bestimmen. Um z.B. nur die Mitarbeiter im Innendienst (ABTEILUN=0) zu untersuchen, gibt es in der Menüleiste die Option Data mit dem Unterpunkt Select Cases; dort öffnet sich ein Menü in dem man die Fälle genau bestimmen kann. Für die „Abteilung 0“ (Innendienst) geben wir z.B. im Zusatzdialog If die Bedingung ABTEILUN=0 ein und beobachten nun in unserer Häufigkeitsuntersuchung auch nur die Fälle, die diese Bedingung erfüllen. Für den Außendienst lautet die Bedingung ABTEILUN=1 und für die Werksangehörigen ABTEILUN=2. (Abb. 2.1.)
Abbildung in dieser Leseprobe nicht enthalten
(Abb. 2.1)
Um nun die Häufigkeiten der einzelnen Abteilungen festzulegen, gehen wir über den Menübefehl Analyze und dem Unterpunkt Descriptives Statistics in das Dialogfeld Frequencies, um dort, wie unten ersichtlich, die Variablen Alter des Mirtarbeiters, Nettoeinkommen und Zufriedenheitspunkte aus der Quellvariablenliste auszuwählen und über die zusätzliche Option Statistics die für uns interessanten statistischen Angaben (Lage- und Streuungsparameter) zu benennen. (siehe Abb. 2.2)
Abbildung in dieser Leseprobe nicht enthalten
(Abb. 2.2)
2.2 Lage- und Streuungsparameter der einzelnen Abteilungen
2.2.1 Innendienst
Lageparameter. Im Innendienst der Firma „Oelgemoeller Wurstwaren AG “ sind 88 Mitarbeiter beschäftigt. Zu berücksichtigen ist, dass 3 der 88 Mitarbeiter keine oder eine ungültige Angabe bei der Zufriedenheitsermittlung gemacht haben. Die Zufriedenheit wird demzufolge nur aus 85 der 88 Fälle ermittelt. Der durchschnittliche Mitarbeiter (arithmetisches Mittel) ist ca. 45 Jahre alt, verdient etwa 2179 Euro netto im Monat und hat seine Zufriedenheit mit 5 Punkten bewertet. Der jüngste Mitarbeiter (Minimum) ist 19 Jahre alt, das geringste Nettoeinkommen liegt bei 315 Euro und die unzufriedensten Mitarbeiter gaben 2 Zufriedenheitspunkte an. Der älteste Mitarbeiter (Maximum) ist 65 Jahre alt, das höchste Einkommen beläuft sich auf 9000 Euro netto und die zufriedensten Mitarbeiter gaben 10 Zufriedenheitspunkte an. Die häufigsten Angaben (Modus) sind 57 Jahre beim Alter, 1500 Euro beim Nettoeinkommen und 4 Punkte bei Zufriedenheit. 50% der Beobachtungen (Median) liegen beim Alter im Bereich über 46,5 Jahren, beim Nettoeinkommen im Bereich über 1750 Euro und bei Zufriedenheit im Bereich über 5 Punkten. 50 % der beobachteten Altersangaben liegen im Bereich zwischen 32,25 bis 58 Jahren. Der Median liegt nicht im Zentrum dieser Beobachtungen, folglich sind die Daten nicht symmetrisch verteilt. 50% der beobachteten Einkommensangaben liegen im Bereich zwischen 1312,50 Euro und 2718,75 Euro. Der Median liegt nicht im Zentrum dieser Beobachtungen, folglich sind die Daten nicht symmetrisch verteilt. 50% der beobachteten Zufriedenheitsangaben liegen im Bereich von 4 bis 6 Punkten. Der Median liegt hier im Zentrum der Beobachtungen, die Daten scheinen symmetrisch verteilt zu sein.
Streuungsparameter. Im Falle des Einkommens weichen der größte beobachtete Wert und der kleinste beobachtete Wert (Spannweite) um 8685 Euro voneinander ab, beim Alter beträgt die Differenz zwischen höchstem und geringstem Wert 46 Jahre und die Zufriedenheit weist eine Differenz von 8 Punkten zwischen größtem und kleinstem Wert auf. Das Alter der Mitarbeiter weicht im Durchschnitt (Standardabweichung) um 13,27 Jahre vom mittleren Alter der Mitarbeiter von 45,38 Jahren ab. Das Nettoeinkommen pro Monat weicht im Durchschnitt um 1385,58 Euro vom mittleren Nettoeinkommen von 2179,15 Euro ab. Die Zufriedenheit weicht im Durchschnitt um 1,73 Punkte von der mittleren Zufriedenheit, die 5,32 Punkte beträgt ab. Mit einem Schiefewert von –0,19 (Schiefe) ist das Alter der Mitarbeiter rechtssteil bzw. linksschief verteilt. Dies wird durch die Fechnersche Lageregel bestätigt, da arithm. Mittel < Median < Modus gilt. Nettoeinkommen und die Zufriedenheitspunkte sind mit einem Schiefewert von 2,253 bzw. 0,658 linkssteil bzw. rechtsschief verteilt. Dies wird durch die Fechnersche Lageregel bestätigt, da Modus < Median < arithm. Mittel gilt. Da für Alter, Nettoeinkommen und Zufriedenheit Schiefe ≠ 0 und arithm. Mittel ≠ Median ≠ Modus gilt, sind die jeweiligen Verteilungen asymmetrisch.
Abbildung in dieser Leseprobe nicht enthalten
(Abb. 2.3)
Diese Tabelle (Abb. 2.3) stellt die oben erwähnten Streuungsparameter für die Mitarbeiter im Innendienst dar. Die untere Tabelle weist die Lageparameter der entsprechenden Abteilung auf.
Abbildung in dieser Leseprobe nicht enthalten
(Abb. 2.4)
[...]
[1] Die Aufgabenstellung wurde aus dem Kompaktseminar „Statistik mit SPSS“, geleitet von Dipl. Vw. D. Burgert und Dipl. Kfm. H. Stolze, im Sommersemester 2003 an der Universität Lüneburg, übernommen.
[2] Variablen ALTER, EINKOMM und ZUFRIED.
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.