In den meisten Ländern benötigt jeder, der ein Fahrzeug im Straßenverkehr führt, eine Kraftfahrzeugversicherung. Jeder Kraftfahrzeugversicherer verfolgt das Ziel, den größtmöglichen Profit zu erwirtschaften. Um dies zu bewerkstelligen, muss die Höhe der von den Versicherten zu zahlenden Prämie genauestens bestimmt werden. Deshalb werden Tarifzellen gebildet, um eine individuelle Risikoeinstufung der Versicherungsnehmer monetär zu bewerten und ihnen dann eine auf sie zugeschnittene Prämienhöhe zu berechnen. Nach Kruse (1997). wird das Risiko für ein Individuum oder ein Kollektiv in einer Zeitperiode durch eine Schadenbedarfsanalyse ermittelt, welche sich in der Praxis meist indirekt, über die separate Berechnung der Schadenfrequenz und der Schadenhöhe und der anschließenden multiplikativen Zusammenführung beider Größen bestimmen lässt. [...]
Diese Arbeit gliedert sich in drei Themengebiete. Zuerst werden die linearen Modelle und die GLM's (Generalisierte lineare Modelle) im Rahmen der parametrischen Regression vorgestellt. Darauf aufbauend werden im zweiten Teil die additiven Modelle und ihre Erweiterungen, die GAM's (Generalisierte additive Modelle), im Zusammenhang mit der nichtparametrischen Regression vorgestellt. Schließlich werden die GLM's und GAM's angewendet, um die Schadenfrequenz mit Hilfe eines Datensatzes einer Kraftfahrzeugversicherung in Australien zu modellieren und auszuwerten. Dabei liegt der Kern dieser Arbeit im Vergleich der Modellgüte und -qualität zwischen den GLM's und GAM's.
Inhaltsverzeichnis
1 Einleitung
2 Parametrische Regression: Generalisierte Lineare Modelle
2.1 Das einfache und das multiple lineare Regressionsmodell
2.1.1 Das einfache lineare Modell
2.1.2 Das multiple lineare Modell
2.2 Generalisierte Lineare Modelle
2.2.1 Komponenten der GLM's
2.2.2 Parameterschätzung
2.2.3 Goodness of fit
2.2.4 Modelle für Zähldaten 1 - Poisson-verteiltes GLM
2.2.5 Modelle für Zähldaten 2 - NB-verteiltes GLM
3 Nichtparametrische Regression: Generalisierte additive Modelle
3.1 Smoothing
3.2 Regression-Splines und Basisfunktionsansätze
3.3 Kubische Smoothing-Splines
3.4 Einfluss und Wahl des Glättungsparameters
3.5 Additive Modelle
3.5.1 Modellbeschreibung
3.5.2 Backfitting-Algorithmus
3.5.3 Wahl der Glättungsparameter mittels Kreuzvalidierung
3.6 Generalisierte additive Modelle
3.6.1 Modellbeschreibung
3.6.2 Local Scoring Algorithmus
3.6.3 Wahl der Glättungsparameter mittels generalisierter Kreuzvalidierung
4 Fallstudie: Kraftfahrzeugversicherung in Australien
4.1 Datengrundlage und Modellbeschreibung
4.2 Schadenfrequenzanalyse mit Hilfe der GLM's
4.2.1 Poisson-verteiltes GLM
4.2.2 NB-verteiltes GLM
4.3 Schadenfrequenzanalyse mit Hilfe der GAM's
4.3.1 Poisson-verteiltes GAM
4.3.2 NB-verteiltes GAM
4.4 Gegenüberstellung der Ergebnisse
5 Fazit
Zielsetzung & Themen
Die Arbeit untersucht und vergleicht Generalisierte Lineare Modelle (GLM's) und Generalisierte Additive Modelle (GAM's) im Kontext der Schadenfrequenzanalyse in der Kraftfahrzeugversicherung, um eine fundierte Entscheidungshilfe für die Modellwahl zu bieten.
- Methodische Grundlagen der GLM's als Erweiterung des linearen Regressionsmodells.
- Theoretische Herleitung nichtparametrischer GAM's zur flexiblen Modellierung.
- Praktische Anwendung auf einen australischen Kfz-Versicherungsdatensatz.
- Detaillierter Vergleich der Modellgüte und -qualität zwischen den Ansätzen.
- Empfehlung für das effizienteste Modell zur Prognose der Schadenfrequenz.
Auszug aus dem Buch
3.1 Smoothing
Ein Smoother ist ein mathematisches Werkzeug, das den Verlauf einer Zielvariablen y als Funktion eines oder mehrerer Regressoren x1, …, xp zusammenfasst, indem es einen Schätzer für die Funktion generiert, der weniger Variabilität als y selbst aufweist. Darüber hinaus wird keine explizite Form der Abhängigkeit von y auf x1, …, xp vorausgesetzt, weshalb Smoother gebräuchliche Instrumente in der nichtparametrischen Regression darstellen (vgl. Hastie et al. (1990), S. 9).
Univariate Glättung
Streudiagramm-Glätter (Scatterplotsmoother) sind Verfahren, die eine flexible Modellierung der Wirkung eines metrischen Regressors auf eine als metrisch angenommene Zielvariable erlauben. Diese Bezeichnung als Streudiagramm-Glätter beruht darauf, dass sich bei diesen Verfahren die zugrunde liegenden Daten sehr gut in einem Streudiagramm darstellen lassen. Dabei verfolgen sie das Ziel, eine tunlichst glatte Funktion f zu bestimmen. Das Standardmodell der univariaten nichtparametrischen Regression mit den metrischen Variablen (yi, xi), i = 1,…, n, hat die Form
yi = f(xi) + ɛi.
Darüber hinaus gilt E[ɛi] = 0 und Var[ɛi] = σ2.
Zudem ist der Störterm εi unabhängig und identisch (standardnormal-)verteilt (u.i.v.)
εi u.i.v. N(0, σ2).
Zusammenfassung der Kapitel
1 Einleitung: Einführung in die Bedeutung der Kraftfahrzeugversicherung und Begründung der Untersuchung von GLM's und GAM's zur Schadenfrequenzanalyse.
2 Parametrische Regression: Generalisierte Lineare Modelle: Darstellung der theoretischen Grundlagen für GLM's, einschließlich Verteilungsannahmen, Linkfunktionen und der Problematik der Überdispersion.
3 Nichtparametrische Regression: Generalisierte additive Modelle: Erklärung der Erweiterung zu GAM's, die flexiblere, nichtparametrische Schätzungen mittels Smoothern und spezieller Algorithmen ermöglichen.
4 Fallstudie: Kraftfahrzeugversicherung in Australien: Anwendung der Modelle auf einen realen Datensatz zur Analyse der Schadenfrequenz und detaillierter Vergleich der Ergebnisse.
5 Fazit: Zusammenfassende Bewertung der Ergebnisse und Empfehlung für die Wahl des Modells in der Praxis basierend auf Einfachheit und Modellgüte.
Schlüsselwörter
GLM, GAM, Schadenfrequenz, Kraftfahrzeugversicherung, Poisson-Verteilung, Negative Binomialverteilung, Überdispersion, Smoothing-Splines, Regressions-Splines, Backfitting-Algorithmus, Local Scoring, Modellgüte, AIC, Statistik, Versicherungsmathematik.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit vergleicht statistische Verfahren zur Analyse der Schadenfrequenz in der Kraftfahrzeugversicherung, wobei der Fokus auf dem Vergleich zwischen GLM's und GAM's liegt.
Was sind die zentralen Themenfelder?
Die Arbeit behandelt die parametrische Regression mittels generalisierter linearer Modelle und die nichtparametrische Regression mittels generalisierter additiver Modelle sowie deren Anwendung zur Modellierung von Zähldaten.
Was ist das primäre Ziel der Arbeit?
Ziel ist es, die Modellgüte und -qualität beider Ansätze bei der Analyse der Schadenfrequenz zu vergleichen und zu beurteilen, welches Modell für eine zuverlässige Prognose am besten geeignet ist.
Welche wissenschaftlichen Methoden werden verwendet?
Es werden GLM's mit Poisson- und Negativ-Binomial-Verteilung sowie entsprechende GAM's angewendet und deren Vor- und Nachteile mittels statistischer Tests (z.B. ANOVA) und Modellwahlkriterien (z.B. AIC) evaluiert.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in eine theoretische Einführung der statistischen Modelle und eine anschließende praktische Fallstudie anhand eines australischen Datensatzes.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wichtige Begriffe sind insbesondere GLM, GAM, Schadenfrequenz, Überdispersion, AIC und Modellgüte.
Warum ist das Poisson-Modell für diesen Datensatz problematisch?
Das Poisson-Modell erfordert, dass Varianz und Erwartungswert identisch sind. Da dies bei den betrachteten Daten nicht der Fall ist, tritt eine Überdispersion auf, die zu ungenauen Ergebnissen führt.
Wie konnte das Problem der Überdispersion gelöst werden?
Durch die Verwendung einer Negativ-Binomial-Verteilung (NB-Modell) anstelle der Poisson-Verteilung konnte die Überdispersion signifikant reduziert und die Modellqualität verbessert werden.
Was ist das Hauptergebnis des Modellvergleichs im Fazit?
Obwohl GAM's eine hohe Flexibilität bieten, schneidet das GLM.NB bei vergleichbarer Modellgüte besser ab, da es einfacher zu berechnen und die Ergebnisse leichter zu interpretieren sind.
- Arbeit zitieren
- Anna Kunz (Autor:in), 2017, Vergleich von generalisierten linearen Modellen und generalisierten additiven Modellen anhand einer Schadenfrequenzanalyse in der Kraftfahrzeugversicherung, München, GRIN Verlag, https://www.grin.com/document/540450