Bachelorarbeit, 2016
47 Seiten, Note: 1,3
1 Einleitung
2 Grundlegende Begriffe
2.1 Die Survivalfunktion S(t)
2.2 Die Hazardrate λ(t)
2.3 Verknüpfungen von S(t) und λ(t)
2.4 Zensierung
2.4.1 Rechtszensur
2.4.2 Links- und Intervallzensur
2.4.3 Statistische Inferenz der Datenzensur
3 Nicht-parametrische Modelle
3.1 Die Sterbetafelmethode
3.2 Der Kaplan-Meier Schätzer
4 Parametrische Modelle
4.1 Parametrische Proportional Hazard Modelle
4.1.1 Die Weibullverteilung als PH Modell
4.1.2 Der Maximum Likelihood Schätzer der Weibullverteilung als PH Modell
4.2 Accelerated Failure Time Modelle
4.2.1 Die Weibullverteilung als AFT Modell
4.2.2 Der Maximum Likelihood Schätzer des AFT Weibullmodells
4.2.3 Die Generalisierte Gamma-Verteilung
4.2.4 Maximum Likelihood Schätzer des generalisierten Gamma Modells
5 Anwendungsbeispiel der vorgestellten Modelle
5.1 Anwendung ausgewählter nicht-parametrischer und parametrischer Verfahren
5.2 Kritische Betrachtung des Rechenbeispiels
6 Schlussbetrachtung
7 Ausblick
Diese Arbeit befasst sich mit der Survivalanalyse als Regressionsmodell zur statistischen Auswertung von Zeitdauern bis zum Eintritt eines definierten Ereignisses, wobei der Schwerpunkt auf dem Umgang mit rechtszensierten Daten liegt. Ziel ist der Vergleich von nicht-parametrischen Ansätzen, wie dem Kaplan-Meier Schätzer, mit parametrischen Modellen wie den Proportional Hazard und Accelerated Failure Time Modellen unter Verwendung der Weibull- und der generalisierten Gamma-Verteilung.
2.4.1 Rechtszensur
Wenn das interessierende Ereignis bei Untersuchungseinheiten nicht beobachtet werden kann, da die Studie vor Eintritt des Ereignisses beendet wurde oder die zu untersuchenden Elemente aus anderen Gründen aus der Studie ausgeschieden sind, spricht man von einer Rechtszensur der Daten.
Dieser Zensurstyp kann grob in zwei Klassen unterteilt werden. Man unterscheidet zwischen der fixen und der zufälligen Zensur.
Die fixe Zensur trifft zu, wenn die Zensierungszeiten für alle Elemente dieses Zensurtyps im Vorhinein bekannt und in der Regel gleich sind. Denn für gewöhnlich legt das Studienende die Zensierungszeit fest, sofern das interessierende Ereignis bis zum Studienende bei dem betrachteten Individuum nicht beobachtet wird. Untersucht man beispielsweise während eines fünfjährigen Zeitraumes die Zeit bis ein Mitarbeiter befördert wird, die Person jedoch innerhalb des Zeitrahmens keine Beförderung erhält, so ist die tatsächliche Zeit bis zur Beförderung zensiert, da die Studie nach 5 Jahren endet. Wird eine Gruppe von Mitarbeitern untersucht, beträgt die Zensierungszeit all jener, die nach Studienende nicht beruflich aufgestiegen sind, fünf Jahre.
Im Falle der zufälligen Zensur entfallen die jeweiligen Untersuchungseinheiten aus der Untersuchungsmenge vor Eintritt des interessierenden Ereignisses und weisen individuelle Zensierungszeiten auf. Dabei kann das Ausscheiden aus der Zielgruppe verschiedene Gründe haben, wie z.B. Ablehnung der weiteren Teilnahme an der Studie, Umzug in eine andere Region oder im technischen Bereich der Ausfall einer Maschine aufgrund einer anderen Komponente als derjenigen, die getestet wird. In dem oben genannten Beispiel der Beförderungsstudie könnte eine zufällige Zensur vorkommen, wenn eine Person das Unternehmen verlässt, bevor diesie befördert wird.
1 Einleitung: Diese Einleitung führt in die Problematik ein, dass bei Ereigniszeitanalysen oft nicht alle Daten vollständig erhoben werden können, und stellt das Ziel der Arbeit, diese Zensierung methodisch zu behandeln, vor.
2 Grundlegende Begriffe: Hier werden die mathematischen Kernkonzepte der Survivalanalyse wie die Survivalfunktion S(t), die Hazardrate λ(t) sowie die verschiedenen Arten der Zensierung definiert.
3 Nicht-parametrische Modelle: Dieses Kapitel erläutert Verfahren, die ohne eine konkrete Verteilungsannahme auskommen, namentlich die Sterbetafelmethode und den Kaplan-Meier Schätzer.
4 Parametrische Modelle: Es werden Methoden vorgestellt, die eine Verteilung der Zeit T voraussetzen, unterteilt in Proportional Hazard Modelle sowie Accelerated Failure Time Modelle, inklusive der Maximum Likelihood Schätzung.
5 Anwendungsbeispiel der vorgestellten Modelle: In diesem Kapitel werden die theoretischen Modelle anhand eines R-Datensatzes zur Rückfälligkeit von Straftätern praktisch angewendet und die Modellergebnisse kritisch evaluiert.
6 Schlussbetrachtung: Diese Zusammenfassung reflektiert die Erkenntnisse über die verschiedenen Modellierungsansätze und betont die Notwendigkeit, bei der Wahl des passenden Modells stets einen Kompromiss zwischen Stärke und Restriktion einzugehen.
7 Ausblick: Der abschließende Abschnitt weist auf weiterführende fortgeschrittene Themen der Ereignisanalyse hin, wie das Cox-Modell oder die Analyse von Zeit-abhängigen Kovariablen.
Survivalanalyse, Zensierung, Rechtszensur, Hazardrate, Survivalfunktion, Kaplan-Meier Schätzer, Proportional Hazard Modelle, Accelerated Failure Time Modelle, Weibull-Verteilung, Generalisierte Gamma-Verteilung, Maximum Likelihood Schätzung, Ereigniszeitanalyse, Statistik, Modellanpassung, Regressionsanalyse.
Die Arbeit beschäftigt sich mit der mathematischen Modellierung der Zeitdauer bis zum Eintritt eines definierten Ereignisses, insbesondere unter der Herausforderung unvollständig erhobener Daten, der sogenannten Zensierung.
Die zentralen Felder sind die Definition theoretischer Grundlagen der Überlebensanalyse, der Vergleich zwischen nicht-parametrischen und parametrischen statistischen Modellen sowie die praktische Anwendung dieser Verfahren in der Softwareumgebung R.
Das Ziel ist es, die grundlegenden Konzepte der Survivalanalyse zu erläutern und eine kritische Vorstellung über die Wahl adäquater Modellvarianten bei zeitunabhängigen Variablen zu entwickeln.
Es werden mathematische Schätzverfahren (nicht-parametrisch via Kaplan-Meier und parametrisch via Maximum Likelihood) sowie statistische Gütekriterien wie das AIC zum Vergleich der Modellanpassung beschrieben.
Im Hauptteil werden nach einer Einführung in die mathematischen Survival-Begriffe die nicht-parametrische Sterbetafel- und Kaplan-Meier-Methode, die Proportional Hazard (PH) Modelle und die Accelerated Failure Time (AFT) Modelle inklusive der Weibull- und Gamma-Verteilungen detailliert analyisiert.
Zu den prägenden Begriffen zählen Survivalanalyse, Zensierung, Hazardrate, Kaplan-Meier, Proportional Hazard Modelle, Accelerated Failure Time, Weibull-Verteilung, Maximum Likelihood und Modellgüte.
Das Weibullmodell ist eine der verbreitetsten parametrischen Methoden, da es als einzige Verteilung sowohl als PH-Modell als auch als AFT-Modell darstellbar ist und zudem die Exponentialverteilung als Spezialfall enthält.
Die Analyse zeigt, dass bei den untersuchten Straftäterdaten das AFT-Weibullmodell die beste Anpassung liefert und Variablen wie finanzielle Unterstützung die Zeit bis zur Rückfälligkeit signifikant beeinflussen.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

