Ziel dieser Ausarbeitung ist es, die Eigenschaften der gefahrenen Strecken zu untersuchen und mit den Ergebnissen geeignete Maßnahmen zur Optimierung der Entscheidungen und Prozesse durchführen zu können. Die Untersuchung soll durch eine Clusteranalyse mithilfe von RStudio durchgeführt werden. Allgemein hat die Clusteranalyse das Ziel, innerhalb der bestehenden Datenbestände verschiedene Gruppierungen zu ermitteln.
In Zeiten der Globalisierung und der damit einhergehenden hohen Marktkonkurrenz ist es wichtiger als je zuvor innovative Produkte am Markt zu etablieren. Ein Fahrradhersteller, welcher Fahrräder produziert und erfolgreich verkauft, steht vor der Aufgabe seine Produkte und Prozesse zu verbessern, um den Bedürfnissen der Nutzer gerecht zu werden und nutzt dafür einen
Inhaltsverzeichnis
1 Einleitung
1.1 Problemstellung
1.2 Zielsetzung
1.3 Gang der Untersuchung
2 Deskriptive Datenanalyse
2.1 Beschreibung Datensatz
2.2 Beschreibung der Variablen und grafische Datenanalyse
2.3 Streudiagramme
3 Clusteranalyse
3.1 Grundidee der Clusteranalyse
3.2 Abstandsfunktion
3.3 Durchführung der hierarchischen Clusteranalyse
3.4 Ausreißer
4 Fazit
Zielsetzung & Themen
Ziel dieser Arbeit ist die Analyse von Fahrradstrecken-Eigenschaften mittels einer Clusteranalyse in RStudio, um für einen Fahrradhersteller Erkenntnisse über die Nutzungsgewohnheiten der Kunden zu gewinnen und Optimierungspotenziale in Prozessen zu identifizieren.
- Analyse relevanter Streckenvariablen (Länge, Steigung, Höhenmeter, Schotteranteil)
- Durchführung einer hierarchischen Clusteranalyse zur Segmentierung
- Identifikation und Benennung von Nutzungstypen (Tourenbike, Mountainbike, Rennrad)
- Visualisierung und Interpretation von statistischen Daten und Ausreißern
Auszug aus dem Buch
3.3 Durchführung der hierarchischen Clusteranalyse
Wie bereits erwähnt zählt die Clusteranalyse zu den explorativen Verfahren, mit welchen es möglich ist Ähnlichkeitsstrukturen in Daten oder Datensätzen zu erkennen. Um eine sinnvolle Clusteranzahl für den Fahrradhersteller ermitteln zu können wurde die hierarchische Clusteranalyse gewählt. Zu Beginn der hierarchischen Clusteranalyse bildet jeder Fall ein eigenes Cluster. Fortgesetzt werden kann dieses Vorgehen so lange, bis am Ende nur noch eine Gruppe übrig bleibt.9
Im ersten Schritt wurde mit Hilfe von RStudio eine hierarchische Clusteranalyse durchgeführt. Die nachfolgende Abbildung zeigt das Ergebnis der hierarchischen Clusteranalyse.
Zusammenfassung der Kapitel
1 Einleitung: Hier wird das Problem und das Ziel der Arbeit vorgestellt, wobei der Fokus auf der Analyse von Strava-Daten für einen Fahrradhersteller liegt.
2 Deskriptive Datenanalyse: In diesem Kapitel werden die verwendeten Variablen des Datensatzes definiert, grafisch aufbereitet und statistische Kennzahlen ermittelt.
3 Clusteranalyse: Der theoretische Rahmen der Clusteranalyse wird erläutert, gefolgt von der praktischen Durchführung und Segmentierung der Strecken.
4 Fazit: Das Fazit fasst die Ergebnisse der Clusteranalyse zusammen und gibt Empfehlungen zur weiteren Vorgehensweise für den Fahrradhersteller.
Schlüsselwörter
Clusteranalyse, Strava, Fahrradstrecken, Datenanalyse, RStudio, Tourenbike, Mountainbike, Rennrad, hierarchische Clusteranalyse, Streudiagramm, Ausreißer, Statistik, Boxplot, Datensatz, Klassifizierung
Häufig gestellte Fragen
Worum geht es in dieser Hausarbeit grundsätzlich?
Die Arbeit beschäftigt sich mit der statistischen Auswertung von Fahrradstrecken-Daten, um Einflussfaktoren für deren Beliebtheit zu bestimmen.
Welche zentralen Themenfelder werden behandelt?
Die zentralen Themen sind die explorative Datenanalyse, die Anwendung hierarchischer Clusterverfahren und die Segmentierung von Nutzungstypen.
Was ist das primäre Ziel der Untersuchung?
Das Ziel ist es, für einen Fahrradhersteller ein besseres Verständnis über die Art und Intensität der Fahrradnutzung durch Kunden zu gewinnen.
Welche wissenschaftliche Methode kommt zum Einsatz?
Es wird eine quantitative Datenanalyse unter Verwendung der Software RStudio durchgeführt, insbesondere die hierarchische Clusteranalyse.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die deskriptive Analyse der Variablen sowie die Durchführung und Interpretation einer Clusteranalyse.
Durch welche Schlüsselwörter wird die Arbeit charakterisiert?
Wichtige Begriffe sind unter anderem Clusteranalyse, Strava-Datensatz, Tourenbike, Mountainbike und Rennrad.
Wie wurden die Cluster benannt?
Die Benennung erfolgte basierend auf den statistischen Merkmalen der Strecken, wie z.B. Schotteranteil und Länge, welche den Kategorien Tourenbike, Mountainbike und Rennrad zugeordnet wurden.
Wie geht die Arbeit mit Ausreißern im Datensatz um?
Ausreißer wurden identifiziert und analysiert; aufgrund ihrer geringen Anzahl und der Vermutung, dass es sich um Messfehler oder Extremsportler handelt, wurden sie von der weiteren Auswertung für das Modell ausgeschlossen.
- Arbeit zitieren
- Manuel Bullinger (Autor:in), 2021, Einflussfaktoren für die Beliebtheit von Fahrradstrecken. Statistische Analyse mit R, München, GRIN Verlag, https://www.grin.com/document/1224503