Bachelorarbeit, 2017
45 Seiten, Note: 1,7
1 Einleitung
2 Parametrische Regression: Generalisierte Lineare Modelle
2.1 Das einfache und das multiple lineare Regressionsmodell
2.1.1 Das einfache lineare Modell
2.1.2 Das multiple lineare Modell
2.2 Generalisierte Lineare Modelle
2.2.1 Komponenten der GLM's
2.2.2 Parameterschätzung
2.2.3 Goodness of fit
2.2.4 Modelle für Zähldaten 1 - Poisson-verteiltes GLM
2.2.5 Modelle für Zähldaten 2 - NB-verteiltes GLM
3 Nichtparametrische Regression: Generalisierte additive Modelle
3.1 Smoothing
3.2 Regression-Splines und Basisfunktionsansätze
3.3 Kubische Smoothing-Splines
3.4 Einfluss und Wahl des Glättungsparameters
3.5 Additive Modelle
3.5.1 Modellbeschreibung
3.5.2 Backfitting-Algorithmus
3.5.3 Wahl der Glättungsparameter mittels Kreuzvalidierung
3.6 Generalisierte additive Modelle
3.6.1 Modellbeschreibung
3.6.2 Local Scoring Algorithmus
3.6.3 Wahl der Glättungsparameter mittels generalisierter Kreuzvalidierung
4 Fallstudie: Kraftfahrzeugversicherung in Australien
4.1 Datengrundlage und Modellbeschreibung
4.2 Schadenfrequenzanalyse mit Hilfe der GLM's
4.2.1 Poisson-verteiltes GLM
4.2.2 NB-verteiltes GLM
4.3 Schadenfrequenzanalyse mit Hilfe der GAM's
4.3.1 Poisson-verteiltes GAM
4.3.2 NB-verteiltes GAM
4.4 Gegenüberstellung der Ergebnisse
5 Fazit
Die Arbeit untersucht und vergleicht Generalisierte Lineare Modelle (GLM's) und Generalisierte Additive Modelle (GAM's) im Kontext der Schadenfrequenzanalyse in der Kraftfahrzeugversicherung, um eine fundierte Entscheidungshilfe für die Modellwahl zu bieten.
3.1 Smoothing
Ein Smoother ist ein mathematisches Werkzeug, das den Verlauf einer Zielvariablen y als Funktion eines oder mehrerer Regressoren x1, …, xp zusammenfasst, indem es einen Schätzer für die Funktion generiert, der weniger Variabilität als y selbst aufweist. Darüber hinaus wird keine explizite Form der Abhängigkeit von y auf x1, …, xp vorausgesetzt, weshalb Smoother gebräuchliche Instrumente in der nichtparametrischen Regression darstellen (vgl. Hastie et al. (1990), S. 9).
Univariate Glättung
Streudiagramm-Glätter (Scatterplotsmoother) sind Verfahren, die eine flexible Modellierung der Wirkung eines metrischen Regressors auf eine als metrisch angenommene Zielvariable erlauben. Diese Bezeichnung als Streudiagramm-Glätter beruht darauf, dass sich bei diesen Verfahren die zugrunde liegenden Daten sehr gut in einem Streudiagramm darstellen lassen. Dabei verfolgen sie das Ziel, eine tunlichst glatte Funktion f zu bestimmen. Das Standardmodell der univariaten nichtparametrischen Regression mit den metrischen Variablen (yi, xi), i = 1,…, n, hat die Form
yi = f(xi) + ɛi.
Darüber hinaus gilt E[ɛi] = 0 und Var[ɛi] = σ2.
Zudem ist der Störterm εi unabhängig und identisch (standardnormal-)verteilt (u.i.v.)
εi u.i.v. N(0, σ2).
1 Einleitung: Einführung in die Bedeutung der Kraftfahrzeugversicherung und Begründung der Untersuchung von GLM's und GAM's zur Schadenfrequenzanalyse.
2 Parametrische Regression: Generalisierte Lineare Modelle: Darstellung der theoretischen Grundlagen für GLM's, einschließlich Verteilungsannahmen, Linkfunktionen und der Problematik der Überdispersion.
3 Nichtparametrische Regression: Generalisierte additive Modelle: Erklärung der Erweiterung zu GAM's, die flexiblere, nichtparametrische Schätzungen mittels Smoothern und spezieller Algorithmen ermöglichen.
4 Fallstudie: Kraftfahrzeugversicherung in Australien: Anwendung der Modelle auf einen realen Datensatz zur Analyse der Schadenfrequenz und detaillierter Vergleich der Ergebnisse.
5 Fazit: Zusammenfassende Bewertung der Ergebnisse und Empfehlung für die Wahl des Modells in der Praxis basierend auf Einfachheit und Modellgüte.
GLM, GAM, Schadenfrequenz, Kraftfahrzeugversicherung, Poisson-Verteilung, Negative Binomialverteilung, Überdispersion, Smoothing-Splines, Regressions-Splines, Backfitting-Algorithmus, Local Scoring, Modellgüte, AIC, Statistik, Versicherungsmathematik.
Die Arbeit vergleicht statistische Verfahren zur Analyse der Schadenfrequenz in der Kraftfahrzeugversicherung, wobei der Fokus auf dem Vergleich zwischen GLM's und GAM's liegt.
Die Arbeit behandelt die parametrische Regression mittels generalisierter linearer Modelle und die nichtparametrische Regression mittels generalisierter additiver Modelle sowie deren Anwendung zur Modellierung von Zähldaten.
Ziel ist es, die Modellgüte und -qualität beider Ansätze bei der Analyse der Schadenfrequenz zu vergleichen und zu beurteilen, welches Modell für eine zuverlässige Prognose am besten geeignet ist.
Es werden GLM's mit Poisson- und Negativ-Binomial-Verteilung sowie entsprechende GAM's angewendet und deren Vor- und Nachteile mittels statistischer Tests (z.B. ANOVA) und Modellwahlkriterien (z.B. AIC) evaluiert.
Der Hauptteil gliedert sich in eine theoretische Einführung der statistischen Modelle und eine anschließende praktische Fallstudie anhand eines australischen Datensatzes.
Wichtige Begriffe sind insbesondere GLM, GAM, Schadenfrequenz, Überdispersion, AIC und Modellgüte.
Das Poisson-Modell erfordert, dass Varianz und Erwartungswert identisch sind. Da dies bei den betrachteten Daten nicht der Fall ist, tritt eine Überdispersion auf, die zu ungenauen Ergebnissen führt.
Durch die Verwendung einer Negativ-Binomial-Verteilung (NB-Modell) anstelle der Poisson-Verteilung konnte die Überdispersion signifikant reduziert und die Modellqualität verbessert werden.
Obwohl GAM's eine hohe Flexibilität bieten, schneidet das GLM.NB bei vergleichbarer Modellgüte besser ab, da es einfacher zu berechnen und die Ergebnisse leichter zu interpretieren sind.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

