Grin logo
de en es fr
Shop
GRIN Website
Texte veröffentlichen, Rundum-Service genießen
Zur Shop-Startseite › Mathematik - Statistik

Multivariate Analysemethoden. Anwendung am Beispiel von Clusteranalysen

Titel: Multivariate Analysemethoden. Anwendung am Beispiel von Clusteranalysen

Hausarbeit , 2020 , 40 Seiten , Note: 1,8

Autor:in: Stefanie Hanschkatz (Autor:in)

Mathematik - Statistik
Leseprobe & Details   Blick ins Buch
Zusammenfassung Leseprobe Details

Die vorliegende Projektstudienarbeit soll multivariate Analysemethoden aufzeigen und erklären, welche sich mit der Auswertung mehrerer Merkmale auseinandersetzen. In Kapitel 2 werden hierzu die grundlegenden Verfahren gezeigt. Im anschließenden Kapitel 3 wird die Clusteranalyse eingehend betrachtet. Hier sollen verschiedene praxisrelevante Verfahren aufgezeigt und eine Vorgehensweise bei Analysen skizziert werden. In einem Fallbeispiel wir die Anwendung der Clusteranalyse vorgeführt, dabei werden die Hürden des Analyseverfahren dargestellt und erläutert.

Die Verbreitung von leistungsstarken Rechnern führte in den vergangen Jahrzehnten dazu, dass große Mengen an Daten gespeichert werden können. Diese stellen mittlerweile ein Kapitalgut dar, auf dessen sich gesamte Firmenkonzepte beziehen. Beispielsweise gründet sich das Konzept der der Firma Payback auf die Kundendatenauswertung für ihre Partner. Diese Menge an Daten kann nicht ohne geeignete Werkzeuge überschaubar gemacht werden. Die Statistik hat dabei die Aufgabe Daten zu erfassen, zusammenzufassen, zu analysieren und darzustellen und bietet eine Methode zur Entscheidungsfindung. Abhängig von der Anzahl der zu untersuchenden Merkmale unterscheidet man zwischen uni- und multivariater Analyse. Univariat sind dabei Analysen, für die nur ein Objekt untersucht wird. Diese dienen auch später als Grundlage zur multivariaten Analyse.

Leseprobe


Inhaltsverzeichnis

1 Ziel der Arbeit

2 Multivariate Analysemethoden

2.1 Analyseverfahren

3 Clusteranalyse

3.1 Beschreibung des Verfahrens

3.1.1 Bestimmung von Ähnlichkeiten und Distanzen

3.1.2 Auswahl des Fusionierungs-und Partitionierungsalgorithmus

3.1.3 Bestimmung der optimalen Clusteranzahl

3.2 Anwendungsbeispiel Clusteranalyse

4 Fazit

5 Quellenverzeichnis

Anlage 1

Anlage 2

Anlage 3

Anlage 4

Zielsetzung & Themen

Die vorliegende Arbeit zielt darauf ab, multivariate Analysemethoden theoretisch zu erläutern und deren praktische Anwendung, insbesondere mittels Clusteranalysen, anhand eines biologischen Datensatzes zur Taxierung von Irisblüten zu demonstrieren.

  • Grundlagen multivariater Analyseverfahren
  • Methodik der Clusteranalyse (Distanzmaße und Algorithmen)
  • Bestimmung der optimalen Clusteranzahl
  • Empirische Anwendung am Fischer-Iris-Datensatz
  • Kritische Würdigung der Analyseergebnisse

Auszug aus dem Buch

3.1 Beschreibung des Verfahrens

Soll untersucht werden welche Ähnlichkeiten in einem Datensatz bestehen, um diese zu Gruppen zu bündeln, so wird die Clusteranalyse angewendet. Demnach handelt es sich bei Clustern (engl.: to cluster around sth. – dt.: sich um etwas drängen oder zusammenhäufen) um Gruppen aus Subjekten und Objekten, die besonders dicht beieinander sind oder sich von ihrer Position kaum unterscheiden.

Ein Anwendungsbeispiel der Clusteranalyse ist die Erforschung von psychischen Erkrankungen, um Symptome einem gemeinsamen Ursprung zuzuordnen. Dies ermöglicht in der Behandlung den Einsatz verbesserter Methoden.

Der Begriff Clusteranalyse beschreibt dabei viele unterschiedliche Verfahren, die sich vor allem durch zwei Aspekte im Wesentlichen unterscheiden:

• Proximitätsmaße: diese messen Ähnlichkeiten/Nähe zwischen Beobachtungen; je homogener die Gruppen, desto höher die Proximität.

• Gruppierungsverfahren: ein Vorgehen, bei dem ähnliche Objekte zusammengefasst werden zu Gruppen (Fusionierungsalgorithmen); oder aber die Zerlegung einer Erhebungsgesamtheit in Gruppen (Partitionierungsalgorithmen).

Zusammenfassung der Kapitel

1 Ziel der Arbeit: Diese Einleitung führt in die Bedeutung der Datenanalyse bei wachsenden Datenmengen ein und erläutert die Zielsetzung der Arbeit, multivariate Methoden zu erklären.

2 Multivariate Analysemethoden: Das Kapitel bietet einen Überblick über verschiedene statistische Verfahren, insbesondere Regressions- und Varianzanalysen, und unterscheidet zwischen strukturprüfenden und strukturentdeckenden Ansätzen.

3 Clusteranalyse: Hier werden theoretische Grundlagen wie Proximitätsmaße, verschiedene Gruppierungsalgorithmen und Kriterien zur Bestimmung der optimalen Clusteranzahl sowie ein praktisches Fallbeispiel detailliert dargelegt.

4 Fazit: Das Fazit fasst zusammen, dass Clusteranalysen wertvolle Werkzeuge zur Datenverdichtung sind, jedoch aufgrund des inhärenten Informationsverlustes einer sorgfältigen methodischen Auswahl bedürfen.

Schlüsselwörter

Multivariate Statistik, Clusteranalyse, Regressionsanalyse, Varianzanalyse, Distanzmaße, Ward-Methode, K-Means, Iris-Datensatz, Datentaxierung, Proximitätsmaße, Datenverdichtung, Strukturentdeckende Verfahren, Korrelationskoeffizient, Gruppierungsalgorithmen, Informationsverlust.

Häufig gestellte Fragen

Worum geht es in dieser Projektstudienarbeit grundlegend?

Die Arbeit befasst sich mit der Anwendung multivariater Analysemethoden, wobei ein besonderer Fokus auf der Clusteranalyse zur Gruppierung von Objekten liegt.

Welche zentralen Themenfelder werden behandelt?

Zu den Schwerpunkten zählen die theoretischen Grundlagen der multivariaten Statistik, die mathematische Bestimmung von Ähnlichkeiten sowie verschiedene Linkage-Methoden für Clusteranalysen.

Was ist das primäre Ziel der Untersuchung?

Ziel ist es, multivariate Verfahren aufzuzeigen und deren praktische Eignung sowie Hürden am Beispiel einer systematischen Klassifizierung des klassischen Iris-Datensatzes zu verdeutlichen.

Welche wissenschaftliche Methode wird primär angewandt?

Es werden verschiedene statistische Verfahren verwendet, insbesondere die hierarchisch-agglomerative Clusteranalyse nach Ward sowie zum Vergleich der partitionierende K-Means-Algorithmus.

Was wird im Hauptteil der Arbeit konkret behandelt?

Im Hauptteil wird zunächst die theoretische Herleitung von Distanzmaßen und Algorithmen vollzogen, gefolgt von der Durchführung und Interpretation einer Clusteranalyse anhand eines realen biologischen Datensatzes.

Welche Schlagworte charakterisieren die Arbeit am besten?

Die Arbeit lässt sich am besten durch Begriffe wie multivariate Statistik, Clusteranalyse, Iris-Datensatz, Ward-Methode und Datentaxierung beschreiben.

Warum wird im Rahmen der Analyse der Iris-Datensatz verwendet?

Der Iris-Datensatz dient als klassisches Fallbeispiel, da er bereits bekannte Klassen besitzt, was eine einfache Validierung der Ergebnisse der Clusteranalyse ermöglicht.

Welche Erkenntnis lässt sich aus dem praktischen Vergleich der Methoden ziehen?

Es zeigt sich, dass die Wahl des Algorithmus (z. B. Ward vs. Single-Linkage) massiven Einfluss auf die Güte der Gruppierung hat und die Clusteranalyse nicht in jedem Fall eine perfekte, automatische Taxierung ohne Vorwissen garantiert.

Ende der Leseprobe aus 40 Seiten  - nach oben

Details

Titel
Multivariate Analysemethoden. Anwendung am Beispiel von Clusteranalysen
Hochschule
Steinbeis-Hochschule Berlin  (CRES)
Veranstaltung
Multivariate Analysemethoden
Note
1,8
Autor
Stefanie Hanschkatz (Autor:in)
Erscheinungsjahr
2020
Seiten
40
Katalognummer
V988009
ISBN (eBook)
9783346346926
ISBN (Buch)
9783346346933
Sprache
Deutsch
Schlagworte
statistik clusteranalyse multivariate analysemethoden irisblütendatensatz
Produktsicherheit
GRIN Publishing GmbH
Arbeit zitieren
Stefanie Hanschkatz (Autor:in), 2020, Multivariate Analysemethoden. Anwendung am Beispiel von Clusteranalysen, München, GRIN Verlag, https://www.grin.com/document/988009
Blick ins Buch
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
Leseprobe aus  40  Seiten
Grin logo
  • Grin.com
  • Versand
  • Kontakt
  • Datenschutz
  • AGB
  • Impressum