Ziel der Fallstudie ist der geeignete Transfer von Theorie in die Praxis, anhand eines konkreten Beispiels. In dieser Arbeit liegt der Fokus auf der praktischen Anwendung der Statistik-Software R. Es werden Daten in die Anwendung R integriert und mit entsprechenden Auswertungsmethoden analysiert. Als Ergebnis soll ein Ort präsentiert werden, die den gewählten Kriterien für eine geringe Wettervariabilität entsprechen sowie eine Vorhersage zu den Wetterdaten der kommenden drei Jahre.
Im Rahmen des Studiums "Digital Business Management" mit dem Schwerpunkt "Data Science" wird eine Fallstudie bearbeitet. Die iu – internationale Hochschule stellt drei Varianten zur Bearbeitung des Moduls „Statistical Computing“ zur Verfügung. Statistical Computing verbindet zwei wissenschaftliche Disziplinen, die der Statistik und der Informationstechnologie. Für das wissenschaftliche Rechnen werden computergestützte Anwendungen verwendet und auch Teilgebiete der Mathematik eingesetzt. In dieser Arbeit wird die "Aufgabenstellung 2: Der ideale Wohnort" bearbeitet. Es handelt sich um eine fiktive Aufgabenstellung, die eine praxisnahe Erarbeitung ermöglichen soll.
Der Studierende und seine Lebenspartnerin haben die Möglichkeit den Beruf vollständig im Home-Office auszuüben. Beide Parteien sind daher sehr flexibel und wollen einen neuen Wohnort in Deutschland suchen. Es werden Überlegungen angestellt, welcher Ort hierfür in Frage kommt. Die Wettervariabilität spielt eine zentrale Rolle bei der Wahl des neuen Wohnorts. Das Wetter soll so konstant wie möglich sein. Der Deutsche Wetterdienst stellt auf seiner Website frei verfügbare Wetterdaten bereit, die verwendet werden, um die Klimadaten der letzten Jahre zu analysieren.
Inhaltsverzeichnis
1. Einleitung
1.1 Themenstellung
1.2 Zielsetzung
1.3 Vorgehensweise
2. Fallvorstellung
2.1 Auswahl der Kriterien
2.2 Forschungsfrage
2.3 Heuristik
3. Forschungsdesign und Datensammlung
3.1 Forschungsdesign
3.2 Datensammlung
4. Statistische Berechnung in R
4.1 Der perfekte Wohnort anhand der geringsten Wettervariabilität
4.1.1 Datenbereinigung
4.1.2 Datenimport in R
4.1.3 Datenaufbereitung in R
4.2 Wettervorhersage für drei Jahre
4.2.1 Datenbereinigung
4.2.2 Datenimport und -aufbereitung in R
4.3 Analyse
5. Fazit
Zielsetzung & Themen
Ziel der Fallstudie ist der Transfer theoretischer Kenntnisse in die praktische Anwendung der Statistik-Software R unter Verwendung realer Klimadaten, um basierend auf einem Variabilitätsscore den idealen Wohnort hinsichtlich konstanter Wetterbedingungen in Deutschland zu identifizieren sowie eine Wetterprognose für die kommenden drei Jahre zu erstellen.
- Anwendung der Statistik-Software R für numerische und grafische Analysen
- Methodik zur Bestimmung geringer Wettervariabilität mittels Variabilitätsscore
- Extraktion und Aufbereitung von Klimadaten aus dem CDC-Portal des Deutschen Wetterdienstes
- Durchführung einer Zeitreihenanalyse zur Wettervorhersage
Auszug aus dem Buch
4.3 Analyse
Die Aufbereitung der Wetterdaten in der Anwendung R liefert verschiedene Ergebnisse. In einem ersten Schritt wurden die Mittelwerte und Standardabweichungen für die Sonnenscheindauer an einem Tag, das gemessene Minimum der Temperatur an einem Tag und die mittlere Windgeschwindigkeit an einem Tag für den Zeitraum von 01.01.2013 bis 31.12.2022 berechnet. Bei der durchschnittlichen Anzahl der Sonnenstunden unterscheiden sich die Orte nur geringfügig. Die Orte mit den meisten Sonnenstunden besitzen auch die größte Standardabweichung (Abbildung 6). Hingegen weisen die Orte mit den durchschnittlich höchsten Temperaturen die niedrigste Standardabweichung auf. Werden die Orte nach der mittleren Temperatur absteigend sortiert, fällt auf, dass sich die Orte in einer West nach Ost Sortierung darstellen lassen. Die Orte im Westen Deutschlands zeigen eine höhere mittlere Temperatur, als Orte in Ostdeutschland (Anhang 9). Bei der Windgeschwindigkeit ist auffällig, dass die mittlere Windgeschwindigkeit mit der Standardabweichung korreliert. Je niedriger die Windgeschwindigkeit, desto geringer die Standardabweichung der jeweiligen Orte (Anhang 14). Für die Auswahl eines geeigneten Wohnortes anhand der geringsten Wettervariabilität wurde ein Score aus dem Mittelwert der drei Standardabweichungen gebildet. Dadurch ist eine endgültige Vergleichbarkeit der zehn Orte möglich. Der Ort Essen verfügt insgesamt über die geringste Variabilität bei den Parametern Sonnenscheindauer, Temperatur und Windgeschwindigkeit (Abbildung 10).
Zusammenfassung der Kapitel
1. Einleitung: Dieses Kapitel erläutert den Kontext der Fallstudie, die Aufgabenstellung zur Bestimmung des idealen Wohnortes und die wissenschaftliche Vorgehensweise.
2. Fallvorstellung: Hier werden die Auswahlkriterien, die Forschungsfrage und die Heuristik zur räumlichen Eingrenzung auf Großstädte in Mitteldeutschland definiert.
3. Forschungsdesign und Datensammlung: Dieser Abschnitt beschreibt das methodische Vorgehen, von der Extraktion der Klimadaten aus dem CDC-Portal bis zur statistischen Vorbereitung in R.
4. Statistische Berechnung in R: Dieses umfangreiche Kapitel detailliert die Datenbereinigung, den Import in R und die Analyse zur Bestimmung des Wohnortes sowie die Zeitreihenanalyse für die Zukunftsprognose.
5. Fazit: Das Fazit fasst die Analyseergebnisse zusammen, identifiziert Essen als optimalen Wohnort und diskutiert Verbesserungspotenziale für die Vorhersagegenauigkeit.
Schlüsselwörter
Statistical Computing, R, Wettervariabilität, Datenanalyse, Klimadaten, CDC-Portal, Wohnortwahl, Zeitreihenanalyse, statistische Auswertung, Standardabweichung, Wettervorhersage, Datenaufbereitung, Datenimport, Mitteldeutschland, Fallstudie
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der Bestimmung des idealen Wohnortes innerhalb Deutschlands unter dem Gesichtspunkt einer geringen Wettervariabilität, wobei reale Klimadaten des Deutschen Wetterdienstes analysiert werden.
Was sind die zentralen Themenfelder der Studie?
Die zentralen Themenfelder umfassen Data Science, Statistik-Software R, Klimatologie, Datenaufbereitung sowie die Anwendung von statistischen Methoden zur Entscheidungsfindung.
Was ist das primäre Ziel oder die Forschungsfrage?
Die Forschungsfrage lautet: Welcher Wohnort in Deutschland weist die geringste Wettervariabilität in Bezug auf Sonnenstunden, Windgeschwindigkeit und Temperatur auf, um den Alltag (z.B. Lebensmitteleinkauf mit dem Fahrrad) möglichst konstant zu gestalten?
Welche wissenschaftliche Methode wird verwendet?
Es wird eine quantitative Datenanalyse in R durchgeführt, die eine deskriptive Statistik (Mittelwert, Standardabweichung), die Bildung eines Variabilitätsscores und eine Zeitreihenanalyse für zukünftige Wetterprognosen beinhaltet.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die praktische Datenerhebung aus dem CDC-Portal, die datentechnische Bereinigung und Transformation in Excel sowie die statistische Modellierung und Visualisierung mittels R-Skripten.
Welche Schlüsselwörter charakterisieren das Dokument?
Die wesentlichen Begriffe sind Statistical Computing, R, Wettervariabilität, Datenanalyse, Klimadaten, Zeitreihenanalyse und Standardabweichung.
Warum wurde der Ort Essen als Ergebnis identifiziert?
Durch die Bildung eines gewichteten Mittelwerts aus den drei untersuchten Standardabweichungen (Sonnenstunden, Temperatur, Windgeschwindigkeit) konnte Essen als der Ort mit der geringsten Gesamtvariabilität identifiziert werden.
Welche Rolle spielt die Software R in dieser Fallstudie?
R dient als zentrales Werkzeug zur statistischen Aufbereitung, zur Berechnung der Variabilitätsscores sowie zur Modellierung und Visualisierung der Wettervorhersagen für die Jahre 2023 bis 2025.
- Quote paper
- Daniel Falkner (Author), 2023, Statistical Computing mit R. Der perfekte Wohnort anhand der Wettervariabilität, Munich, GRIN Verlag, https://www.grin.com/document/1350792