1. Einführung
Die vorliegende Arbeit gibt einen Überblick über die Clusteranalyse und ihre gängigsten Methoden. Sie gibt einen Einblick in die Anwendungsbereiche, wie z.B. in der Marketingabteilung eines Unternehmens, und die Anwendungsarten.
Besonders wird, im letzten Kapitel, auf die Möglichkeit eingegangen eine Clusteranalyse mit Excel zu erstellen.[...]
Inhaltsverzeichnis
1. Einführung
2. Definition
3. Einsatzgebiete
4. Proximitätsmaße
4.1 Distanzmaße
4.2 Ähnlichkeitsmaße
5. Klassifikationen
5.1 Scharfe Klassifikation
5.1.1 Allgemeine Information
5.1.2 Hierarchische Verfahren
5.1.3 Partitionierte Verfahren
5.2 Unscharfe Klassifikation
6. Vereinfachte Clusteranalyse mit Excel
7. Fazit
Zielsetzung & Themen
Die vorliegende Arbeit gibt einen strukturierten Überblick über das Verfahren der Clusteranalyse, erläutert die theoretischen Grundlagen der Proximitätsmessung und Klassifikationsverfahren und zeigt praxisnah auf, wie eine Clusteranalyse mit Microsoft Excel umgesetzt werden kann.
- Grundlagen und Definitionen der Clusteranalyse
- Distanz- und Ähnlichkeitsmaße zur Objektbewertung
- Unterscheidung zwischen scharfen und unscharfen Klassifikationsverfahren
- Hierarchische versus partitionierte Clusteranalyseverfahren
- Praktische Implementierung mittels Tabellenkalkulation (Excel)
Auszug aus dem Buch
5.1.2 Hierarchische Verfahren
Das hierarchische Verfahren wird in 2 weitere Verfahren unterteilt. Das agglomerative Verfahren und das divisive Verfahren 18 Das agglomerative Verfahren fasst die einzelnen Objekte nach und nach in immer größere Cluster zusammen (Bottom-up) während beim divisivem Verfahren die Gesamtmenge in immer kleinere Cluster aufgeteilt wird (Top-down).19
Das agglomerative Verfahren lässt sich noch weiter in die Linkage-Verfahren und das Varianz-Verfahren aufteilen. Die Linkage-Verfahren sind:
- Single-Linkage Vefahren: o Beim Single Linkage Verfahren wird ein Objekt-Paar aus 2 Clustern gebildet, welches die kürzeste Distanz zwischen den beiden Clustern bildet. o Diese Distanz wird als Distanz zwischen den beiden Clustern gewertet. 20
Zusammenfassung der Kapitel
1. Einführung: Die Einleitung skizziert die Relevanz der Clusteranalyse und kündigt die praktische Anwendung in Excel an.
2. Definition: Das Kapitel erläutert den Clusterbegriff als Methode zur Identifikation homogener Teilmengen aus einer heterogenen Grundgesamtheit.
3. Einsatzgebiete: Hier werden die Anwendungsbereiche der Analyse, insbesondere im Bereich Marketing und Reisebranche, dargelegt.
4. Proximitätsmaße: Es wird die mathematische Messung von Unähnlichkeiten mittels Distanzmaßen sowie Ähnlichkeiten erläutert.
5. Klassifikationen: Dieses Kapitel differenziert zwischen scharfen und unscharfen Klassifikationsmodellen sowie hierarchischen und partitionierten Verfahren.
6. Vereinfachte Clusteranalyse mit Excel: Eine Anleitung zur rechnerischen Umsetzung der Clusteranalyse unter Verwendung spezifischer Excel-Funktionen.
7. Fazit: Die Arbeit schließt mit einer Bewertung der Flexibilität und Effektivität des Verfahrens für wirtschaftliche Analysen.
Schlüsselwörter
Clusteranalyse, Euklidische Distanz, Klassifikation, Single Linkage, Complete Linkage, Average Linkage, Ward Verfahren, k-means Verfahren, Agglomerativ, Divisiv, Proximitätsmaße, Distanzmatrix, Datenanalyse, Marketing, Excel
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit behandelt die theoretischen Grundlagen und methodischen Ansätze der Clusteranalyse sowie deren praktische Anwendung.
Welche zentralen Themenfelder werden abgedeckt?
Zu den Schwerpunkten zählen Proximitätsmaße, verschiedene Klassifikationsverfahren und deren Umsetzung in der Marketingpraxis.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, dem Leser einen Überblick über die Methoden zu geben und die Anwendbarkeit des Verfahrens mittels Excel zu demonstrieren.
Welche wissenschaftliche Methode wird verwendet?
Es handelt sich um eine systematische Literaturanalyse sowie eine methodische Darstellung statistischer Berechnungsverfahren.
Was wird im Hauptteil detailliert behandelt?
Der Hauptteil erläutert mathematische Distanzberechnungen, hierarchische und partitionierte Clusterverfahren sowie deren grafische Interpretation.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wesentliche Begriffe sind Clusteranalyse, Distanzmaße, Klassifikation, Algorithmen wie k-means und die praktische Umsetzung in Tabellenkalkulationen.
Wie unterscheiden sich scharfe und unscharfe Klassifikationen?
Bei der scharfen Klassifikation wird ein Objekt eindeutig einem Cluster zugeordnet, während bei der unscharfen Klassifikation eine anteilige Zugehörigkeit möglich ist.
Was besagt der "Ellenbogen" bei der Clusteranalyse?
Der "Ellenbogen" ist ein grafisches Hilfsmittel, um anhand der Verschlechterung der Gütekriterien die optimale Anzahl an Clustern zu bestimmen.
- Quote paper
- Benjamin Breuer (Author), 2009, Clusteranalyse - Eine kurze Einführung, Munich, GRIN Verlag, https://www.grin.com/document/138819