Systematische Darstellung und Einordnung der Methoden der Datenanalyse


Hausarbeit, 2001

27 Seiten, Note: 2,7


Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

1 Einleitung

2 Einteilung der Methoden der Datenanalyse
2.1 Anzahl der Variablen
2.2 Zielsetzung der Analyse
2.3 Skalenniveau der Variablen
2.4 Unterteilung der Datenmatrix

3 Univariate Datenanalyse
3.1 Univariate deskriptive Datenanalyse
3.1.1 Tabellarische und graphische Darstellung
3.1.2 Lageparameter
3.1.3 Dispersions- bzw. Streuungsmaße
3.2 Univariate induktive Datenanalyse

4 Bi- und multivariate Verfahren der Datenanalyse
4.1 Bivariate Analyseverfahren
4.1.1 Kreuztabellierung
4.1.2 Einfache Korrelationsanalyse
4.1.3 Einfache Regressionsanalyse
4.2 Multivariate Analyseverfahren
4.2.1 Multivariate Verfahren der Dependenzanalyse
4.2.1.1 Multiple Regressionsanalyse
4.2.1.2 Varianzanalyse
4.2.1.3 Diskriminanzanalyse(Trennverfahren)
4.2.2 Mulivariate Verfahren der Interdependenzanalyse
4.2.2.1 Faktorenanalyse
4.2.2.2 Clusteranalse
4.2.2.3 Multidimensionale Skalierung

5 Abschließender Überblick über die wichtigsten Datenanalyseverfahren

6 Schlußbetrachtung

Literaturverzeichnis

Anhang

Abbildungsverzeichnis

Abb. 1: Überblick über die Datenanalyseverfahren

Abb. 2: Der Grundgedanke der Faktorenanalyse

Tabellenverzeichnis

Tab. 1: Beispiel einer aufsteigend geordneten Urliste mit dem Alter der Befragten

Tab. 2: Berechnung der Häufigkeiten

Tab. 3: Beispiel anhand der Bundeswehr

Tab. 4: Messniveaus und Messwerteigenschaften

1 Einleitung

Durch das bestehende umfangreiche Angebot an Statistik- Programm- Paketen und der weit verbreiteten EDV gibt es eine Vielzahl von verschiedensten Auswertungs-verfahren. Hier sollte jedoch darauf verwiesen werden, dass der wichtigste Schritt bei einem Forschungsvorhaben nicht die Anwendung von Statistikverfahren sein sollte. Der Focus sollte auf der genauen Definition des Marktforschungsproblems, eines angemessenen Forschungsdesigns, einer zweckmäßigen Operationalisierung und Messung sowie einer gut ausgesuchten und genügend vorbereiteten Datenauswer-tung liegen.[1]

In der Datenanalyse werden die, aus den Verfahren der Informationsgewinnung gewonnen Einzeldaten, aufbereitet und ausgewertet. Ziel ist es, die in den Daten steckenden Informationen auf ein überschaubares Maß zu verdichten und Zusammenhänge zwischen den Variablen aufzudecken.[2]

Diese Hausarbeit soll einen Überblick über die wichtigsten Verfahren der Daten-auswertung geben. In den einzelnen Kapiteln werden die Methoden und Verfahren so definiert, dass der Leser das Grundlagenwissen erlangt, das für eine spätere Vertiefung der einzelnen Methoden der Datenanalyse benötigt wird.

2 Einteilung der Methoden der Datenanalyse

Die Datenanalyseverfahren lassen sich nach verschiedenen Kriterien einteilen.

Häufig erfolgt eine Klassifikation nach:

- der Variablenanzahl,
- der Zielsetzung der Analyse,
- dem Skalenniveau der Variablen,
- der Unterteilung der Datenmatrix.

2.1 Anzahl der Variablen

Ausgangspunkt des Einsatzes statistischer Methoden ist ein Untersuchungsziel. Das Untersuchungsziel konkretisiert sich in jedem Falle auf Eigenschaften der zu untersuchenden Einheiten. Die Einheiten, an denen ein spezieller Wert der Untersuchungsvariablen festgestellt wird, heißen Untersuchungseinheiten oder Merkmalsträger. Dies können sowohl Personen als auch Gegenstände sein.

Die jeweiligen Eigenschaften, die Gegenstand eines Einsatzes statistischer Methoden sind, heißen Untersuchungsvariablen, Untersuchungsmerkmale, statisti-sche Merkmale oder auch einfach Variablen oder Merkmale (beispielsweise Alter einer Person) . Die Betrachtung einer Einheit liefert einen Wert (eine Ausprägung) der Variablen.[3] Diese können innerhalb eines bestimmten Definitionsbereiches unter-schiedliche Werte annehmen.[4] (siehe Beispiel im Anhang)

Der Vorgang der Festlegung der Menge der Ausprägungen einer Variablen und der Präzisierung des Aussagegehalts dieser Ausprägungen heißt Skalierung der Variablen. Auf den Begriff der Skalierung wird im weiterführenden Teil näher einge-gangen. Die Zuordnung von Variablenwerten zu den Untersuchungseinheiten nach Vornahme der Skalierung wird als Messung bezeichnet.[5]

Falls sich die Analyse auf nur eine einzige Variable bezieht, spricht man von univariater Datenanalyse. Untersucht man jedoch die Beziehungen zwischen zwei oder mehr Variablen, so liegt eine bivariate oder eine multivariate Datenanalyse vor. Wobei lediglich zwischen den univariaten und multivariaten Verfahren unterschieden werden kann, da die bivariaten Verfahren weder inhaltlich noch mathematisch von den multivariaten Verfahren abweichen.

2.2 Zielsetzung der Analyse

Eine weitere Unterscheidung innerhalb der Verfahren erfolgt in deskriptive und induktive (schließenden) Methoden, welche sich auf die Zielsetzung der Verfahren bezieht. Die deskriptiven (beschreibenden) Verfahren geben Auskünfte über die vorliegende Datenmenge. Hier dient die Datenauswertung zur Beschreibung von Globalaussagen über die Grundgesamtheit. Aufgabe bei einer Vollerhebung ist es, sehr viele Einzelwerte in eine für Interpretationszwecke geeignete Form zu bringen, etwa durch Verwendung von Tabellen oder graphischen Darstellungen, Angabe von typischen (etwa Durchschnitts-) Variablenwerten oder Kennzeichnung der Variablilität der Werte.[6]

Demgegenüber stellt die schließende Statistik darauf ab, Hypothesen über die Grundgesamtheit anhand der Stichprobendaten zu überprüfen. Sie beruht auf Wahrscheinlichkeitsaussagen über die Vereinbarkeit von empirisch vorgefundenen Daten mit den zu Beginn des Marktforschungsprozesses formulierten Hypothesen.

Die Teilgesamtheit stellt eine Stichprobe dar, die aus der Grundgesamtheit gezogen wird, und die eine Beurteilung der Strukturen der gewonnenen Daten ermöglicht.[7]

Induktive Verfahren bauen auf der Wahrscheinlichkeitstheorie auf und ziehen von den in der Stichprobe gefundenen Strukturen Rückschlüsse auf Strukturen in der Grundgesamtheit (Population). Hierbei ist jedoch eine begrenzte Fehlerwahr-scheinlichkeit möglich, da dieser Rückschluss nicht mit Sicherheit möglich ist.

Ein Unternehmen befragt beispielsweise eine Stichprobe von Käufern eines bestimmten Produkts. Daraufhin kann man zu folgender deskriptiver Aussage gelangen: Der Mittelwert des Alters der Personen in der Stichprobe liegt bei 28,3 Jahren, eine induktive Aussage bezieht sich beispielsweise darauf, ob man mit hinreichender Sicherheit davon ausgehen kann, dass das durchschnittliche Alter der Käufer dieses Produkts unter 30 Jahren liegt.[8]

Induktive Statistik sind in einem bestimmten Sinn ein Gegenbegriff zur deskriptiven Statistik, da die Ergebnisse der Zufallsstichprobenerhebungen über die Grund-gesamtheit keine exakten Informationen liefern können. Eine wesentliche Aufgabe ist die Schätzung von Kenngrößen der Grundgesamtheit.

2.3 Skalenniveau der Variablen

Die Aufgabe von Skalen ist es , subjektive Tatbestände bewertbar zu machen, d. h. Objekteigenschaften und -merkmale und unterschiedliche Ausprägungen dieser Merkmale messbar und damit quantifizierbar zu machen.

Durch die Auswahl des geeigneten Skalierungsverfahrens und der Bestimmung der Skalentypen wird die Verständlichkeit für den Bewertenden und für den später die Daten Auswertenden, eine eindeutige Zuordnungsmöglichkeit der erfassten Daten, die Operationalisierung der Daten sowie die Eindeutigkeit für die Interpretation der Ergebnisse gewährleistet[9]. Die Zuordnung von Variablenwerten zu den Untersuchungseinheiten nach Vornahme der Skalierung wird als Messung bezeichnet.[10]

Ziel dieser Skalierung ist es, theoretische, nicht beobachtbare Sachverhalte, die innerhalb der Person wirksam werden (sogenannte hypothetische Konstrukte oder intervenierende Variablen wie Emotionen, Einstellungen, Wertungen, Präferenzen etc.) zu messen.[11]

Man unterscheidet je nach Aussagegehalt der durch Skalierung festgelegten Ausprägungen einer Variablen

- die Nominalskala,
- die Ordinalskala,
- die Intervallskala und
- die Verhältnisskala.

Nominalskala

Eine Variable ist nominal skaliert, wenn alternative Ausprägungen dieser Variablen Verschiedenheit zum Ausdruck bringen.[12] Es erfolgt eine Klassifizierung, d.h. eine Zuordnung von Kategorien bzw. von Attributen. Beispielsweise kann die Variable Familienstand klassifiziert werden in ledig, verheiratet, geschieden, usw. Das Vorhandensein von Merkmalen wird bestätigt oder nicht bestätigt. Bei vielen Merkmalsausprägungen wie beim Beruf, sollte nach einem sachlich sinnvollen Ord-nungsprinzip gesucht werden, wie Metallberufe, Holzberufe, usw.. Dazu wird heute meist die Dezimalklassifikation, bei der eine Zuordnung von Zahlen erfolgt (beispielsweise für ledig: 1, für verheiratet: 2, usw.), angewandt. Hier finden statistische Operationen wie die Ermittlung der absoluten und relativen Häufigkeiten in den Klassen Anwendung. Allgemein stellt sie die einfachste Form des Messens dar.[13] Das Vorhandensein von Merkmalen wird bestätigt oder nicht bestätigt.

Ordinalskala

Bei der Ordinalskala erfolgt eine Zuweisung von Rangziffern („vor“; „kleiner“), die eine Anordnung ermöglichen sollen. Die Zahlen bezeichnen Rangplätze, und nicht die Quantität der Eigenschaften.[14] Sie enthält keine Angaben über den Abstand verschiedener Ausprägungen der Variablen. Das bedeutet, dass es nicht festzustel-len ist, dass die Benotung 3 von der Benotung 4 genau so weit entfernt wäre wie von der Benotung 2. Eine singuläre Ordinalskalierung bedeutet, dass Einheiten mit gleichen Rängen nicht zugelassen sind und sollte dann angewandt werden, wenn die Variable auch die Möglichkeit zu einer Intervall- oder Verhältnisskalierung bietet.[15] Man verwendet bei der statistischen Berechnungen, z. B. die Ermittlung des Medians, der Rangkorrelation , usw..

Intervallskala und Verhältnisskala

Eine Variable heißt intervallskaliert, wenn alternative Ausprägungen dieser Variablen neben Verschiedenheit und einer Rangordnung auch einen Abstand (eine Entfernung) zum Ausdruck bringen.[16]

Eine Variable heißt verhältnisskaliert, wenn alternative Ausprägungen dieser Variablen neben Verschiedenheit und einer Rangordnung sowie einem Abstand auch ein Verhältnis ausdrücken. Eine Variable, die intervallskaliert oder verhältnisskaliert ist, heißt metrisch skaliert, sie hat eine Kardinalskala. Eine Verhältnisskala liegt meist dann vor, wenn Längen, Flächen, Volumina oder Zeitdauern wie üblich gemessen oder Anzahlen angegeben werden.

2.4 Unterteilung der Datenmatrix

Bei der Analyse von Beziehungen zwischen zwei und mehr Variablen ist danach zu unterscheiden, ob die Variablen der Datenmatrix vor der Analyse in Untergruppen unterteilt werden oder nicht. Bei Unterteilung der Datenmatrix in zwei Variablengruppen spricht man von der Analyse von Abhängigkeiten (Dependenzanalyse). Dabei können zwei Fälle unterschieden werden:

[...]


[1] vgl. Böhler(1985), S. 158

[2] vgl. Henze(1994), S. 70

[3] vgl. Schaich(1990), S. 3

[4] vgl. Henze(1994), S. 164

[5] vgl. Schaich(1990), S. 3

[6] vgl. Schaich(1990), S. 8

[7] ebenda, S. 104f.

[8] vgl. Homburg/Herrmann/Pflesser(2000), S. 104

[9] vgl. Pepels(2000), S. 125

[10] vgl. Schaich(1990), S. 3

[11] vgl. Berekhoven/Eckert/Ellenrieder(1989, S. 69

[12] vgl. Schaich(1990), S. 4

[13] vgl. Böhler(1985), S. 97

[14] vgl. Böhler(1985), S. 97

[15] vgl. Schaich(1990), S. 4 f.

[16] ebenda, S. 5

Ende der Leseprobe aus 27 Seiten

Details

Titel
Systematische Darstellung und Einordnung der Methoden der Datenanalyse
Hochschule
Universität Stuttgart  (Allgemeine BWL, Investitionsgütermarketing und Beschaffungsmanagement)
Note
2,7
Autor
Jahr
2001
Seiten
27
Katalognummer
V23101
ISBN (eBook)
9783638262903
ISBN (Buch)
9783638647809
Dateigröße
483 KB
Sprache
Deutsch
Schlagworte
Systematische, Darstellung, Einordnung, Methoden, Datenanalyse
Arbeit zitieren
Cem Atli (Autor), 2001, Systematische Darstellung und Einordnung der Methoden der Datenanalyse, München, GRIN Verlag, https://www.grin.com/document/23101

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Systematische Darstellung und Einordnung der Methoden der Datenanalyse



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden