Die Clusteranalyse ist ein multivariates statistisches Verfahren zur Klassenbildung. Das Ziel der Clusteranalyse besteht darin, möglichst homogene Gruppen aus einer Menge von Objekten zu klassifizieren, wobei sich die Gruppen möglichst heterogen voneinander unterscheiden sollen.
[...]
Bei der Auswahl des Clusteralgorithmus unterscheidet man zwischen den Hierarchischen Clusterverfahren und den Partitionierenden Clusterverfahren. Dabei werden die Hierarchische Clustermethoden in agglomerative und divisive Clusterverfahren unterteilt. Die agglomerativen hierarchischen Clusterverfahren beginnen mit der feinsten Partition [...]. Bei divisiven hierarchischen Clusterverfahren wird mit der gröbsten Partition gestartet [...].
Die partitionierenden Clusterverfahren beginnen mit einer fest vorgegebenen Anfangspartition, die im Bezug auf ein bestimmtes Gütekriterium, wie z.B. das Varianzkriterium, sukzessive verbessert wird. [...] Die partitionierenden Clusterverfahren unterscheiden sich in optimierende Austauschverfahren und Minimal-Distanz-Verfahren. [...]

Der Two-Step-Clusteralgorithmus ist ein zweistufiges Clusterverfahren zur Klassenbildung. In der ersten Stufe des Verfahrens wird zunächst eine grobe und vereinfachte Clusterung aller Objekte vorgenommen, die dann in der zweiten
Stufe mit einer rechenaufwändigeren hierarchischen Clusteranalyse zu präziseren Clustern verdichtet wird. [...]
Dabei unterscheidet sich der Two-Step-Clusteralgorithmus in SPSS im Vergleich zu den anderen Clusterverfahren insbesondere im Algorithmus, nach dem die Clusterbildung vorgenommen wird. [...]
Das Verfahren des Two-Step-Clusteralgorithmus basiert auf dem so genannten BIRCH-Algorithmus, der vorwiegend für die Clusterung sehr umfangreicher Datensätze angewendet wird.
Im Folgenden wird ganz kurz der Ablauf des BIRCH-Algorithmus dargestellt. [...]

Excerpt

Inhaltsverzeichnis

1 Einführung in die Clusteranalyse

1.1 Problemstellung der Clusteranalyse

1.2 Ablauf der Clusteranalyse

2 Der Two-Step-Clusteralgorithmus in SPSS

2.1 Problemstellung des Verfahrens

2.2 Ablauf der zweistufigen Clusteranalyse

2.2.1 Erste Stufe: Vorläufige Clusterung aller Objekte

2.2.2 Zweite Stufe: Hierarchische Clusterung der Sub-Cluster

2.2.3 Distanzmaße des Two-Step-Clusteralgorithmus

3 Anwendung des Two-Step-Clusteralgorithmus in der Praxis

3.1 Beschreibung des empirischen Datensatzes

3.2 Durchführung der Two-Step-Clusteranalyse

3.3 Auswertung der Ergebnisse des Clusterverfahrens

4 k-Means-Clusteranalyse

4.1 Beschreibung und Problemstellung der k-Means-Methode

4.2 Ablaufschema der k-Means-Clusteranalyse

5 Anwendung der k-Means-Methode in der Praxis

5.1 Problematik des empirischen Datensatzes

5.2 Durchführung der k-Means-Clusteranalyse

5.3 Auswertung der Ergebnisse der Clusteranalyse

6 Vergleich der beiden Clusterverfahren

6.1 Theoretischer Vergleich

6.2 Vergleich der SPSS-Ergebnisse

6.3 Schlussfolgerung

Zielsetzung & Themen

Die vorliegende Arbeit untersucht und vergleicht den Two-Step-Clusteralgorithmus und die k-Means-Clusteranalyse in SPSS anhand eines empirischen Datensatzes zur Parfümnutzung von 2000 Frauen, um die Eignung und methodischen Unterschiede beider Verfahren in der Marktforschungspraxis zu bewerten.

Methodische Grundlagen der Clusteranalyse
Funktionsweise des Two-Step-Clusteralgorithmus
Anwendung der k-Means-Clusteranalyse
Empirische Untersuchung des Parfümnutzungsverhaltens
Vergleichende Analyse beider Clusterverfahren

Auszug aus dem Buch

1.1 Problemstellung der Clusteranalyse

Die Zuordnung der Objekte in die Cluster erfolgt so, dass genau jedes Objekt genau einem von g Clustern (C1, C2, ..., Cg) zugewiesen wird. Eine solche Clusterzuordnung wird auch Partition P = (C1, C2, ..., Cg) genannt.

Zusammenfassung der Kapitel

1 Einführung in die Clusteranalyse: Grundlagen und Zielsetzung der Clusterbildung sowie eine kurze Darstellung des allgemeinen Ablaufs einer Klassifikationsbildung.

2 Der Two-Step-Clusteralgorithmus in SPSS: Detaillierte Beschreibung der Funktionsweise und der zwei Stufen des Verfahrens inklusive der verwendeten Distanzmaße.

3 Anwendung des Two-Step-Clusteralgorithmus in der Praxis: Praktische Durchführung und Interpretation der Ergebnisse einer Clusteranalyse an einem realen Datensatz zur Parfümnutzung.

4 k-Means-Clusteranalyse: Erläuterung der Methodik und des iterativen Ablaufs der k-Means-Clusteranalyse zur Ermittlung einer optimalen Partition.

5 Anwendung der k-Means-Methode in der Praxis: Anwendung des k-Means-Verfahrens auf den gleichen Datensatz, inklusive Durchführung und ausführlicher Analyse der resultierenden Gruppen.

6 Vergleich der beiden Clusterverfahren: Theoretischer und praktischer Vergleich beider Verfahren hinsichtlich ihrer Eignung, Genauigkeit und Handhabung bei der Analyse umfangreicher Datensätze.

Schlüsselwörter

Clusteranalyse, Two-Step-Clusteralgorithmus, k-Means, SPSS, Parfümnutzung, Datensatz, Klassifizierung, Log-Likelihood, Distanzmaße, Marktsegmentierung, Multivariate Statistik, Partitionierung, Konsumentenverhalten, Clustermethodik.

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Arbeit befasst sich mit der Anwendung und dem methodischen Vergleich zweier statistischer Verfahren zur Klassenbildung, dem Two-Step-Clusteralgorithmus und der k-Means-Clusteranalyse.

Was sind die zentralen Themenfelder der Analyse?

Zentrale Themen sind die theoretischen Grundlagen der Clusteranalyse, die Durchführung beider Algorithmen in SPSS sowie die inhaltliche Interpretation der daraus resultierenden Kundensegmente.

Was ist das primäre Ziel der Untersuchung?

Das primäre Ziel ist es, die Praxistauglichkeit und die unterschiedlichen Ergebnisse beider Clusterverfahren an einem konkreten Datensatz zum Parfümnutzungsverhalten von Frauen zu evaluieren.

Welche wissenschaftliche Methode kommt zum Einsatz?

Es werden multivariate statistische Verfahren verwendet, konkret der Two-Step-Clusteralgorithmus und die k-Means-Clusteranalyse, um Daten zu segmentieren.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil umfasst die detaillierte Beschreibung beider Verfahren, die praktische Anwendung auf einen Datensatz mit 2000 Probandinnen sowie einen direkten Vergleich der erzielten Clusterergebnisse.

Welche Begriffe charakterisieren die Arbeit am besten?

Die Arbeit wird maßgeblich durch Begriffe wie Clusteranalyse, Two-Step-Verfahren, k-Means, SPSS-Anwendung und Marktforschung charakterisiert.

Warum wird der Two-Step-Clusteralgorithmus für den Datensatz bevorzugt?

Der Algorithmus gilt als besonders effizient bei sehr umfangreichen Datensätzen und kann zudem mit einer Mischung aus kategorialen und metrischen Variablen umgehen.

Was ist das zentrale Ergebnis beim Vergleich der beiden Verfahren?

Während beide Verfahren inhaltlich ähnliche Typen identifizieren, liefert der Two-Step-Algorithmus tendenziell homogenere Cluster, wobei die k-Means-Methode bei einer vorgegebenen Clusteranzahl zielgerichteter interpretiert werden kann.

Excerpt out of 71 pages - scroll top

Details

Title: Der Two-Step-Clusteralgorithmus in SPSS: Methodenbeschreibung und Vergleich mit der k-Means Clusteranalyse
College: University of Passau (Wissenschaftliche Fakultät)
Grade: 1,7
Author: Josef Seibold (Author)
Publication Year: 2008
Pages: 71
Catalog Number: V129422
ISBN (eBook): 9783640366934
ISBN (Book): 9783640367184
Language: German
Tags: Two-Step-Clusteralgorithmus SPSS Methodenbeschreibung Vergleich Clusteranalyse
Product Safety: GRIN Publishing GmbH

Quote paper: Josef Seibold (Author), 2008, Der Two-Step-Clusteralgorithmus in SPSS: Methodenbeschreibung und Vergleich mit der k-Means Clusteranalyse, Munich, GRIN Verlag, https://www.grin.com/document/129422

Der Two-Step-Clusteralgorithmus in SPSS: Methodenbeschreibung und Vergleich mit der k-Means Clusteranalyse