Bei der Betrachtung der gemessenen Corona-Fallzahlen in Deutschland aus dem Jahr 2020 wird deutlich, dass die Fallzahlen in der kälteren Jahreszeit gestiegen und in der wärmeren Jahreszeit trotz weniger Restriktionen niedrig geblieben sind. Ausgehend von der vermutlichen Relevanz der Jahreszeiten wirft sich an dieser Stelle die Frage auf, inwiefern das Klima den Fallzahlenverlauf beeinflusst.
Die Beantwortung dieser Frage erfolgt in dieser Projektarbeit durch die Durchführung der Sekundärforschung, wobei die Datenbestände vom Datenportal der EU sowie der New York Times entnommen wurden. Die Datenbestände werden durch die Anwendung des Vorgehensmodells zur Datenbereinigung nach Apel bereinigt und durch das Sisense BI-Tool ausgewertet. Die Themenbehandlung erfolgt unter Berücksichtigung von praktischen und wissenschaftlichen Erkenntnissen sowie Methoden wie die Quellenanalyse.
Die tägliche Berichterstattung über die Anzahl der Neu-Infektionen sowie die täglichen Todeszahlen durch Corona stehen für Gegebenheiten, die in den heutigen Medien zu beobachten sind. Die weltweit unterschiedliche Zu- und Abnahme der Corona-Fallzahlen und die damit verbundenen Maßnahmen zugunsten der Nachverfolgung des Virus hat die Notwendigkeit der Ermittlung von weiteren Einflussfaktoren auf die Fallzahlenentwicklung stark an Bedeutung gewinnen lassen.
Inhaltsverzeichnis
1. Einleitung
2. Einführung in das Projekt
2.1 Begriffsbestimmungen von „Business Intelligence“ und „Covid-19“
2.2 Einführung in das Sisense BI-Tool
2.3 Grundlegende Planung und Arbeitsweise
2.4 Vorstellung der Corona-Datenbestände
3. Auswertung von Corona-Datenbeständen mithilfe des Sisense BI-Tools
3.1 Angewandtes Vorgehensmodell zur Datenbereinigung
3.2 Durchführung der Datenbereinigung
3.3 Vorgehensweise bei der Datenauswertung mit dem Sisense BI-Tool
3.4 Zwischenergebnisse der Datenauswertung
3.4.1 Polare & Subpolare Zone
3.4.2 Gemäßigte Zone
3.4.3 Subtropische Zone
3.4.4 Tropische Zone
3.5 Ergebnisse der Datenauswertung
4. Kritische Betrachtung der Ergebnisse
5. Fazit und Ausblick
Zielsetzung & Themen
Das Hauptziel dieser Arbeit besteht darin, den möglichen Zusammenhang zwischen dem Klima und dem Fallzahlenverlauf von Corona-Infektionen zu untersuchen, wobei die Forschungsfrage darauf fokussiert, ob klimatische Bedingungen die Verbreitung des Virus beeinflussen.
- Anwendung des BI-Tools Sisense zur Datenanalyse
- Datenbereinigungsprozess nach dem Vorgehensmodell von Apel
- Einteilung der weltweiten Fallzahlen in klimatische Zonen
- Vergleichende Analyse von Infektionszahlen, Testanzahl und Temperaturverläufen
Auszug aus dem Buch
Angewandtes Vorgehensmodell zur Datenbereinigung
Der in diesem Projekt durchgeführte Prozess zur Datenbereinigung erfolgt nach dem Vorgehensmodell von Apel und gliedert sich in fünf Schritte (siehe Abb. 2):
Der erste Schritt ist die Erstellung einer Sicherungskopie der Datei auf einem Speichermedium, um im Falle eines Datenverlusts die Daten zurückkopieren zu können. Der zweite Schritt ist die Definition von Anforderungen an die Daten mit dem Ziel, eine hohe Datenqualität zu gewährleisten. Eine hohe Datenqualität wird beispielsweise durch die Vollständigkeit, Konsistenz und Aktualität der Daten erreicht. Anschließend werden die Daten hinsichtlich der Erfüllung der Anforderungen analysiert und im Rahmen der Standardisierung vereinheitlicht. Die Datensätze werden standardisiert, indem beispielsweise alle Datensätze die gleichen Attribute aufweisen, die einer bestimmten Normierung unterliegen. Die Normierung legt u.a. fest, dass ein Datum in ein einheitliches Format wie TT.MM.JJJJ oder JJJJ-MM-TT gebracht wird. Nach der Standardisierung werden die bei der Analyse als fehlerhaft erkannten Daten mittels sechs Methoden bereinigt: Eine Methode ist das Entfernen von fehlerhaften Daten die zum Einsatz kommt, wenn keine Korrektur der Daten möglich ist. Beispielsweise werden Daten wie Artikel-Stammdatensätze ohne Artikelnummer und -bezeichnung herausgefiltert und nicht weiterverarbeitet. Eine weitere Methode ist das Ersetzen von fehlerhaften Daten durch andere Daten aus anderen Systemen, indem beispielsweise eine fehlende Kundennummer durch den Zugriff auf den Kundennamen aus der Kunden-Stammtabelle bestimmt und eingefügt wird.
Zusammenfassung der Kapitel
1. Einleitung: Diese Einleitung führt in die Problematik der Corona-Fallzahlen im Kontext von jahreszeitlichen klimatischen Einflüssen ein und erläutert die Zielsetzung der Arbeit sowie die aufgestellten Hypothesen.
2. Einführung in das Projekt: Dieses Kapitel definiert die grundlegenden Begriffe "Business Intelligence" und "Covid-19", stellt das verwendete Sisense BI-Tool vor und erläutert die methodische Projektplanung.
3. Auswertung von Corona-Datenbeständen mithilfe des Sisense BI-Tools: Hier erfolgt die detaillierte Darstellung des Datenbereinigungsprozesses nach Apel sowie die konkrete Auswertung der Fallzahlen in vier verschiedenen Klimazonen mittels BI-Software.
4. Kritische Betrachtung der Ergebnisse: Dieses Kapitel reflektiert die Validität, Reliabilität und Objektivität der durchgeführten Analyse und diskutiert die Grenzen der Datenvisualisierung und Klimaeinteilung.
5. Fazit und Ausblick: Das Fazit fasst die Ergebnisse hinsichtlich der aufgestellten Hypothesen zusammen und diskutiert mögliche Erklärungsansätze für den beobachteten Zusammenhang zwischen Klima und Infektionsverlauf.
Schlüsselwörter
Business Intelligence, Sisense, Covid-19, Datenbereinigung, Klimazonen, Fallzahlen, Datenqualität, Datenanalyse, Statistik, Infektionsverlauf, Validität, Korrelation, Testanzahl, Temperaturverlauf, Datenmodellierung
Häufig gestellte Fragen
Worum geht es in der vorliegenden Arbeit im Kern?
Die Projektarbeit untersucht, ob ein statistischer Zusammenhang zwischen klimatischen Bedingungen (verschiedene Klimazonen) und dem Verlauf der Corona-Fallzahlen besteht.
Welche zentralen Themenfelder werden bearbeitet?
Die Arbeit verknüpft die Felder Business Intelligence, Datenmanagement, Statistik und Infektiologie, um Muster in komplexen Datensätzen zu identifizieren.
Was ist die primäre Forschungsfrage?
Die zentrale Leitfrage ist, inwiefern das Klima den Fallzahlenverlauf beeinflusst und ob sich signifikante Korrelationen zwischen Temperaturverläufen und Infektionsgeschehen nachweisen lassen.
Welche wissenschaftliche Methode kommt zur Anwendung?
Es wird eine Sekundärforschung durchgeführt, wobei Daten des EU-Portals und der New York Times durch ein strukturiertes Vorgehensmodell zur Datenbereinigung nach Apel aufbereitet und mit dem BI-Tool Sisense analysiert werden.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil befasst sich mit der Aufbereitung der Daten, der Einteilung der Weltkarte in Klimazonen und der detaillierten Auswertung der positiven Testraten in Relation zur Testanzahl und Temperatur.
Welche Schlüsselwörter charakterisieren die Arbeit am besten?
Die Arbeit wird maßgeblich durch Begriffe wie Business Intelligence, Sisense, Klimazonen, Fallzahlenanalyse und Datenqualität definiert.
Warum spielt das ElastiCube-Modell in dieser Arbeit eine wichtige Rolle?
Das ElastiCube-Modell dient als leistungsstarke Analysedatenbank im Sisense BI-Tool, die es ermöglicht, große und komplexe Datensätze für eine schnelle Visualisierung und Abfrage effizient zu importieren.
Zu welchem Schluss kommt der Autor bezüglich der Hypothesen?
Während Hypothesen zur Bevölkerungsgröße und Testanzahl als gültig angesehen werden, konnte ein direkter Zusammenhang zwischen Temperatur und Fallzahlen nicht eindeutig bewiesen werden, weshalb die entsprechende Hypothese verworfen wurde.
- Arbeit zitieren
- Anonym (Autor:in), 2021, Auswertung von Corona-Datenbeständen mithilfe eines BI-Tools, München, GRIN Verlag, https://www.grin.com/document/1024641