Diese Arbeit untersucht, ob ältere Menschen tatsächlich gefährdeter durch COVID-19 sind. Ziel ist es, mithilfe einer statistischen Datenanalyse herauszufinden, ob ältere Menschen somit einem höheren Risiko ausgesetzt sind, an einer Infektion zu versterben. Nach einer Einführung in die Thematik folgt die Vorstellung des Datenmaterials. Anschließend wird die Durchführung der statistischen Analyse dargelegt. Hierbei wird insbesondere auch auf die Methodenauswahl eingegangen.
Die Lungenkrankheit COVID-19, ausgelöst durch das Virus SARS-CoV-2 der Familie der Coronaviren, stellt im Jahre 2020 die gesamte Welt auf den Kopf. Der neuartige Erreger verursacht Krankheitssymptome vergleichbar einer Lungenentzündung und kann einen gefährlichen, unter Umständen sogar tödlichen Krankheitsverlauf hervorrufen. Das Virus wird überwiegend über die sogenannte Tröpfcheninfektion übertragen und verbreitet sich aufgrund der fehlenden Immunität rasant sowie weltweit und stellt demnach eine große Gefahr für die Menschheit dar.
Über den exakten Auslöser der Viren existieren bislang nur Vermutungen, es wird jedoch von einem Ursprung auf dem Lebensmittelmarkt in Wuhan, der Hauptstadt der chinesischen Provinz Hubei, ausgegangen. Bereits nach kurzer Zeit sprachen diverse Lungenfachärzte von Abhängigkeiten auf Krankheitsverläufe und formulierten in diesem Zuge sogenannte Risikogruppen. Personen dieser Gruppen sollen anfälliger sein und einem erhöhten Risiko unterliegen, schwere Konsequenzen von einer Infektion davonzutragen. Beispiele für Risikofaktoren sind Vorerkrankungen, vor allem Erkrankungen der Atemwege, oder auch das Alter und Geschlecht der Patienten.
Inhaltsverzeichnis
1 Einleitung
1.1 Fragestellung und Zielsetzung
1.2 Gang der Arbeit
2 Vorstellung des Datenmaterials
2.1 Datenmaterial und Aufbereitung
2.2 Darstellung des Datensatzes
3 Statistische Analyse
3.1 Auswahl der Methoden
3.2 Durchführung der Analyse
4 Fazit und Ausblick
Zielsetzung & Themen
Das primäre Ziel dieser Arbeit ist die statistische Überprüfung der Forschungsfrage, ob eine signifikante Abhängigkeit zwischen der Altersklasse und der Sterblichkeit an COVID-19 besteht. Dabei wird untersucht, ob ältere Bevölkerungsgruppen tatsächlich ein höheres Risiko für einen tödlichen Krankheitsverlauf aufweisen, wie von Fachärzten in der Frühphase der Pandemie postuliert.
- Deskriptive Datenanalyse und Aufbereitung von RKI-Daten
- Anwendung des Chi-Quadrat-Unabhängigkeitstests nach Pearson
- Berechnung und Interpretation des Kontingenzkoeffizienten
- Statistische Validierung der Altersabhängigkeit bei COVID-19-Todesfällen
- Visualisierung der Daten mittels RStudio
Auszug aus dem Buch
3.1 Auswahl der Methoden
Für die Prüfung von Abhängigkeiten existieren diverse statistische Methoden. Dieser Datensatz wird analysiert mit dem Chi-Quadrat-Unabhängigkeitstest nach Pearson, welcher die Abhängigkeit zweier Merkmale zueinander innerhalb eines Hypothesentests stochastisch untersucht. Der Chi-Quadrat-Test ist unter Anderem geeignet für nominalskalierte Variablen und einer der meist verwendeten Verteilungen in der Interferenzstatistik.5
Innerhalb der Analyse wird eine bestehende Kontingenztabelle zunächst mithilfe der Chi-Quadrat-Verteilung neu verteilt. Im weiteren Verlauf werden die Abweichungen der jeweiligen Werte berechnet und anschließend quadriert, um positive Ergebnisse zu gewährleisten. Das ist von fundamentaler Bedeutung, da die Summe aller Abweichungen als Ganzes berücksichtigt werden müssen. Das Ergebnis des Tests ist der Chi-Quadrat-Koeffizient.6
Unter Berücksichtigung der Dimensionen der Datenmatrix sowie des vorher festzulegenden Signifikanzniveaus kann nun ein Vergleichswert berechnet werden, welcher einen kritischen Bereich festlegt. Dieser dient als Grenzrichtwert und zeigt im Vergleich zum Chi-Quadrat-Koeffizienten ob eine Abhängigkeit vorliegt. Ist der errechnete Wert kleiner oder gleich hoch, ist nicht von einer Abhängigkeit auszugehen, was die Hypothese auf Unabhängigkeit belegt.7
Das Ergebnis des Tests trifft demnach eine Aussage darüber, ob eine Abhängigkeit herrscht. Jedoch kann er keine Aussage darüber treffen, in welchem Ausmaß oder in welche Richtung die Abhängigkeit beeinflusst. Ursache dafür ist die Abhängigkeit vom Stichprobenumfang sowie der Dimensionen der Datenmatrix. Aufgrund dessen wird der Analyse bei vorhandener Abhängigkeit zusätzlich der Kontingenzkoeffizient von Pearson hinzugezogen.8
Zusammenfassung der Kapitel
1 Einleitung: Einführung in die Thematik der COVID-19-Pandemie und Formulierung der Forschungsfrage zur Altersabhängigkeit von Todesfällen.
2 Vorstellung des Datenmaterials: Beschreibung der Datenquelle vom Robert-Koch-Institut sowie die methodische Aufbereitung und Filterung des Datensatzes in RStudio.
3 Statistische Analyse: Anwendung statistischer Testverfahren (Chi-Quadrat-Test und Kontingenzkoeffizient) zur Prüfung der Hypothesen.
4 Fazit und Ausblick: Zusammenfassung der Ergebnisse und kritische Reflexion über die Aussagekraft der Analyse hinsichtlich weiterer Einflussfaktoren.
Schlüsselwörter
COVID-19, SARS-CoV-2, statistische Analyse, RStudio, Chi-Quadrat-Test, Kontingenzkoeffizient, Sterblichkeit, Altersabhängigkeit, Risikogruppen, Datenaufbereitung, Hypothesentest, Pandemie, Robert-Koch-Institut, Signifikanzniveau, deskriptive Statistik.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit einer quantitativen statistischen Untersuchung des Zusammenhangs zwischen dem Alter von Patienten und der Sterblichkeit im Kontext der COVID-19-Pandemie im Jahr 2020.
Was sind die zentralen Themenfelder?
Die zentralen Themen sind die statistische Datenanalyse mittels RStudio, die Prüfung von Abhängigkeiten bei nominalskalierten Daten und die medizinisch-statistische Bewertung von Risikogruppen.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist die Beantwortung der Frage, ob eine statistisch nachweisbare Abhängigkeit zwischen der Altersklasse und der Sterblichkeit an COVID-19 existiert.
Welche wissenschaftliche Methode wird verwendet?
Es werden der Chi-Quadrat-Unabhängigkeitstest nach Pearson zur Prüfung der Signifikanz sowie der Kontingenzkoeffizient zur Bestimmung der Effektstärke eingesetzt.
Was wird im Hauptteil behandelt?
Der Hauptteil umfasst die Vorstellung und Filterung des RKI-Datensatzes, die Durchführung der Hypothesentests sowie die visuelle Aufbereitung der Ergebnisse in Form von Tabellen und Diagrammen.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wichtige Begriffe sind COVID-19, Chi-Quadrat-Test, RStudio, Altersabhängigkeit und statistische Signifikanz.
Warum wurde die Variable „Geschlecht“ für die weiterführende Analyse ausgeschlossen?
Aufgrund der Datenlage konnte kein konsistentes Muster identifiziert werden, das auf einen systematischen Geschlechterunterschied bei den Todesfällen hindeutet, weshalb diese Variable nur zur Illustration diente.
Was ist das Ergebnis der Analyse?
Die Nullhypothese wurde verworfen und eine signifikante Abhängigkeit zwischen dem Alter und der Sterblichkeit durch COVID-19 bestätigt, wobei die Effektstärke als relativ hoch eingestuft wurde.
- Quote paper
- Isabell Blanke (Author), 2020, Abhängigkeit vom Alter zur Sterblichkeit durch COVID-19? Statistische Datenanalyse der bundesweiten Todesfälle, Munich, GRIN Verlag, https://www.grin.com/document/1005087