Ziel dieser Arbeit ist es, die grundlegenden Konzepte der Survivalanalyse, beschränkt auf Daten mit zeitunabhängigen Variablen, zu erläutern. Dabei wird der Fokus auf zwei wesentliche Modellarten, die nicht-parametrischen und die parametrischen Survivalmodelle, gelegt. Darüber hinaus soll anhand einer kritischen Auseinandersetzung mit den Modellvarianten eine Vorstellung sowohl über die unterschiedlichen Ansätze der Modellarten als auch über die Wahl eines adäquaten Modells und etwaige Weiterentwicklungen oder Vertiefungen der erläuterten Methoden zur Survivalanalyse entwickelt werden. Die Arbeit gliedert sich dabei in sieben Kapitel. Sich an die Einleitung anschließend folgt eine Erläuterung der Survivalanalyse zugrundeliegenden Konzepte sowie der Beschreibung des wichtigen Charakteristikums der Zensierung. In den weiteren Kapiteln wird deutlich, dass die Ereigniszeitanalyse aufgrund zahlreicher Unterschiede in der Art der Datenerhebung reich an Verfahren und Methoden zur Modellschätzung ist. So werden im Kapitel 3 zunächst populäre nicht-parametrische Modelle dargelegt, welche als Ausgangspunkt für die in Kapitel 4 beschriebenen parametrischen Modelle, die die Kenntnis einer Verteilung der Daten voraussetzen, dienen können. Ergänzend werden die Erkenntnisse aus den vorangegangenen Kapiteln im fünften Kapitel durch ein in der Softwareumgebung R angewandtes Beispiel veranschaulicht und einer kritischen Betrachtung unterzogen, bevor in der Schlussbetrachtung (Kapitel 6) die wichtigsten Erkenntnisse zusammengefasst und reflektiert werden. Abschließend gibt das Kapitel 7 einen Ausblick für weitere mögliche Modifikationen und Lösungsansätze, die zu einer Modellverbesserung dienen können.
Inhaltsverzeichnis
1 Einleitung
2 Grundlegende Begriffe
2.1 Die Survivalfunktion S(t)
2.2 Die Hazardrate λ(t)
2.3 Verknüpfungen von S(t) und λ(t)
2.4 Zensierung
2.4.1 Rechtszensur
2.4.2 Links- und Intervallzensur
2.4.3 Statistische Inferenz der Datenzensur
3 Nicht-parametrische Modelle
3.1 Die Sterbetafelmethode
3.2 Der Kaplan-Meier Schätzer
4 Parametrische Modelle
4.1 Parametrische Proportional Hazard Modelle
4.1.1 Die Weibullverteilung als PH Modell
4.1.2 Der Maximum Likelihood Schätzer der Weibullverteilung als PH Modell
4.2 Accelerated Failure Time Modelle
4.2.1 Die Weibullverteilung als AFT Modell
4.2.2 Der Maximum Likelihood Schätzer des AFT Weibullmodells
4.2.3 Die Generalisierte Gamma-Verteilung
4.2.4 Maximum Likelihood Schätzer des generalisierten Gamma Modells
5 Anwendungsbeispiel der vorgestellten Modelle
5.1 Anwendung ausgewählter nicht-parametrischer und parametrischer Verfahren
5.2 Kritische Betrachtung des Rechenbeispiels
6 Schlussbetrachtung
7 Ausblick
Zielsetzung & Themen der Arbeit
Diese Arbeit befasst sich mit der Survivalanalyse als Regressionsmodell zur statistischen Auswertung von Zeitdauern bis zum Eintritt eines definierten Ereignisses, wobei der Schwerpunkt auf dem Umgang mit rechtszensierten Daten liegt. Ziel ist der Vergleich von nicht-parametrischen Ansätzen, wie dem Kaplan-Meier Schätzer, mit parametrischen Modellen wie den Proportional Hazard und Accelerated Failure Time Modellen unter Verwendung der Weibull- und der generalisierten Gamma-Verteilung.
- Grundlegende Konzepte der Survivalanalyse und Zensierung
- Nicht-parametrische Schätzverfahren
- Parametrische Modellklassen (PH und AFT)
- Maximale Likelihood-Schätzung
- Praktische Anwendung und Modellauswahl mittels Softwareumgebung R
Auszug aus dem Buch
2.4.1 Rechtszensur
Wenn das interessierende Ereignis bei Untersuchungseinheiten nicht beobachtet werden kann, da die Studie vor Eintritt des Ereignisses beendet wurde oder die zu untersuchenden Elemente aus anderen Gründen aus der Studie ausgeschieden sind, spricht man von einer Rechtszensur der Daten.
Dieser Zensurstyp kann grob in zwei Klassen unterteilt werden. Man unterscheidet zwischen der fixen und der zufälligen Zensur.
Die fixe Zensur trifft zu, wenn die Zensierungszeiten für alle Elemente dieses Zensurtyps im Vorhinein bekannt und in der Regel gleich sind. Denn für gewöhnlich legt das Studienende die Zensierungszeit fest, sofern das interessierende Ereignis bis zum Studienende bei dem betrachteten Individuum nicht beobachtet wird. Untersucht man beispielsweise während eines fünfjährigen Zeitraumes die Zeit bis ein Mitarbeiter befördert wird, die Person jedoch innerhalb des Zeitrahmens keine Beförderung erhält, so ist die tatsächliche Zeit bis zur Beförderung zensiert, da die Studie nach 5 Jahren endet. Wird eine Gruppe von Mitarbeitern untersucht, beträgt die Zensierungszeit all jener, die nach Studienende nicht beruflich aufgestiegen sind, fünf Jahre.
Im Falle der zufälligen Zensur entfallen die jeweiligen Untersuchungseinheiten aus der Untersuchungsmenge vor Eintritt des interessierenden Ereignisses und weisen individuelle Zensierungszeiten auf. Dabei kann das Ausscheiden aus der Zielgruppe verschiedene Gründe haben, wie z.B. Ablehnung der weiteren Teilnahme an der Studie, Umzug in eine andere Region oder im technischen Bereich der Ausfall einer Maschine aufgrund einer anderen Komponente als derjenigen, die getestet wird. In dem oben genannten Beispiel der Beförderungsstudie könnte eine zufällige Zensur vorkommen, wenn eine Person das Unternehmen verlässt, bevor diesie befördert wird.
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung führt in die Problematik ein, dass bei Ereigniszeitanalysen oft nicht alle Daten vollständig erhoben werden können, und stellt das Ziel der Arbeit, diese Zensierung methodisch zu behandeln, vor.
2 Grundlegende Begriffe: Hier werden die mathematischen Kernkonzepte der Survivalanalyse wie die Survivalfunktion S(t), die Hazardrate λ(t) sowie die verschiedenen Arten der Zensierung definiert.
3 Nicht-parametrische Modelle: Dieses Kapitel erläutert Verfahren, die ohne eine konkrete Verteilungsannahme auskommen, namentlich die Sterbetafelmethode und den Kaplan-Meier Schätzer.
4 Parametrische Modelle: Es werden Methoden vorgestellt, die eine Verteilung der Zeit T voraussetzen, unterteilt in Proportional Hazard Modelle sowie Accelerated Failure Time Modelle, inklusive der Maximum Likelihood Schätzung.
5 Anwendungsbeispiel der vorgestellten Modelle: In diesem Kapitel werden die theoretischen Modelle anhand eines R-Datensatzes zur Rückfälligkeit von Straftätern praktisch angewendet und die Modellergebnisse kritisch evaluiert.
6 Schlussbetrachtung: Diese Zusammenfassung reflektiert die Erkenntnisse über die verschiedenen Modellierungsansätze und betont die Notwendigkeit, bei der Wahl des passenden Modells stets einen Kompromiss zwischen Stärke und Restriktion einzugehen.
7 Ausblick: Der abschließende Abschnitt weist auf weiterführende fortgeschrittene Themen der Ereignisanalyse hin, wie das Cox-Modell oder die Analyse von Zeit-abhängigen Kovariablen.
Schlüsselwörter
Survivalanalyse, Zensierung, Rechtszensur, Hazardrate, Survivalfunktion, Kaplan-Meier Schätzer, Proportional Hazard Modelle, Accelerated Failure Time Modelle, Weibull-Verteilung, Generalisierte Gamma-Verteilung, Maximum Likelihood Schätzung, Ereigniszeitanalyse, Statistik, Modellanpassung, Regressionsanalyse.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit der mathematischen Modellierung der Zeitdauer bis zum Eintritt eines definierten Ereignisses, insbesondere unter der Herausforderung unvollständig erhobener Daten, der sogenannten Zensierung.
Was sind die zentralen Themenfelder?
Die zentralen Felder sind die Definition theoretischer Grundlagen der Überlebensanalyse, der Vergleich zwischen nicht-parametrischen und parametrischen statistischen Modellen sowie die praktische Anwendung dieser Verfahren in der Softwareumgebung R.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist es, die grundlegenden Konzepte der Survivalanalyse zu erläutern und eine kritische Vorstellung über die Wahl adäquater Modellvarianten bei zeitunabhängigen Variablen zu entwickeln.
Welche wissenschaftlichen Methoden werden verwendet?
Es werden mathematische Schätzverfahren (nicht-parametrisch via Kaplan-Meier und parametrisch via Maximum Likelihood) sowie statistische Gütekriterien wie das AIC zum Vergleich der Modellanpassung beschrieben.
Was wird im Hauptteil behandelt?
Im Hauptteil werden nach einer Einführung in die mathematischen Survival-Begriffe die nicht-parametrische Sterbetafel- und Kaplan-Meier-Methode, die Proportional Hazard (PH) Modelle und die Accelerated Failure Time (AFT) Modelle inklusive der Weibull- und Gamma-Verteilungen detailliert analyisiert.
Welche Schlüsselwörter charakterisieren die Arbeit?
Zu den prägenden Begriffen zählen Survivalanalyse, Zensierung, Hazardrate, Kaplan-Meier, Proportional Hazard Modelle, Accelerated Failure Time, Weibull-Verteilung, Maximum Likelihood und Modellgüte.
Warum ist das Weibullmodell in der Arbeit so prominent?
Das Weibullmodell ist eine der verbreitetsten parametrischen Methoden, da es als einzige Verteilung sowohl als PH-Modell als auch als AFT-Modell darstellbar ist und zudem die Exponentialverteilung als Spezialfall enthält.
Was ist das Ergebnis der Analyse des Beispieldatensatzes?
Die Analyse zeigt, dass bei den untersuchten Straftäterdaten das AFT-Weibullmodell die beste Anpassung liefert und Variablen wie finanzielle Unterstützung die Zeit bis zur Rückfälligkeit signifikant beeinflussen.
- Citar trabajo
- Elisabeth Barheine (Autor), 2016, Parametrische und nicht-parametrische Modelle in der Survivalanalyse, Múnich, GRIN Verlag, https://www.grin.com/document/1438764