Diplomarbeit, 2002
54 Seiten, Note: 2,3
Einleitung
Bezeichnungen
Kapitel 1: Grundlagen
1.1 Das Klassifikationsproblem
1.2 Der CART-Algorithmus
1.3 Das PAC-Lern-Modell
1.4 Das dynamische Modell und die Integration von Hintergrundwissen
Kapitel 2: Boosting
2.1 Entstehungsgeschichte und Wurzeln von Boosting
2.2 Bisherige Anwendungsgebiete und Bewährung von Boosting
2.3 Erklärung verschiedener Algorithmen
2.4 Gradientenboosting
Kapitel 3: Wirtschaftliches Szenario
3.1 Beschreibung des RWI-Datensatzes
3.2 Problemstellung des Projektes B3 im Rahmen des SFB 475
3.3 Stand der Forschung bei der Auswertung der RWI-Datensatzes
Kapitel 4: Implementierung und Anwendung von MART
4.1 Aufrufparameter von MART
4.2 Anwendung auf den RWI-Datensatz
Kapitel 5: Ergebnis
5.1 Ergebnisdarstellung
5.2 Vergleich von CART und MART
Kapitel 6: Zusammenfassung und Ausblick
Die Arbeit untersucht die Eignung des Boosting-Verfahrens „Multiple Additive Regression Trees“ (MART) zur Analyse und Klassifikation von Konjunkturzyklen auf Basis des RWI-Datensatzes. Ziel ist es, die Performanz dieses Algorithmus im direkten Vergleich zum etablierten CART-Algorithmus unter Anwendung eines speziellen, doppelten Kreuzvalidierungsdesigns zu bewerten.
1.2 Der CART-Algorithmus
Die Abkürzung CART (Classification and Regression Trees) geht zurück auf das gleichnamige wegweisende Buch von Breiman [Breiman et al., 1984] aus dem Jahr 1984. Seitdem ist der darauf aufbauende Algorithmus CART ein weitverbreitetes Werkzeug zur Klassifikation und Regression mittels Entscheidungsbäumen [Salford Systems, 2002].
Die technische Funktionsweise von CART beruht auf binärer rekursiver Partition; d.h. jeder Vaterknoten wird immer in genau zwei Kinderknoten geteilt (binär) und dieser Prozeß kann wiederum auf jeden Kinderknoten angewandt werden (rekursiv). Das Herzstück der CART-Analyse ist eine Menge von Regeln, die sicherstellen, daß:
• jeder Knoten in einen Baum aufgesplittet werden kann,
• eindeutig entschieden werden kann, ob ein Baum vollständig aufgebaut ist (oder ob weitere Splits erforderlich sind) und
• jedem Endknoten eine Klassenzugehörigkeit zugeordnet werden kann (oder einem Vorhersagewert bei Regression).
Splitregeln: Um einen Knoten in zwei Kinder zu spalten, benutzt CART immer eine sogenannte Bool’sche Variable, die nur die Ausprägungen „ja“ und „nein“ kennt. CART-Analyse basiert auf der Methode, alle möglichen Splits für alle in die Analyse involvierten Variablen durchzuführen. Hat man beispielsweise ein Datenset mit 200 Beobachtungen und 13 Variablen, dann wählt CART aus 200⋅13 = 2600 möglichen Splits den ersten Split aus. Jedes Problem hat eine endliche, aber vielleicht auch sehr große Menge möglicher Splits, welche CART konsequent durchgeht.
Kapitel 1: Grundlagen: Einführung in die statistischen Probleme der Klassifikation, die Funktionsweise von Entscheidungsbäumen (CART) sowie das theoretische Fundament des PAC-Lern-Modells.
Kapitel 2: Boosting: Darstellung der Methodik des Boostings zur Erhöhung der Klassifikationsgenauigkeit sowie Erläuterung diverser Boosting-Algorithmen, einschließlich Gradientenboosting.
Kapitel 3: Wirtschaftliches Szenario: Beschreibung der ökonomischen Ausgangslage, des RWI-Datensatzes sowie der Forschungsziele im Rahmen des Projektes B3 des SFB 475.
Kapitel 4: Implementierung und Anwendung von MART: Technische Erläuterung der Konfiguration des MART-Algorithmus und des speziellen Designs der doppelten Leave-one-Cycle-out-Analyse.
Kapitel 5: Ergebnis: Präsentation der Analyseergebnisse und direkter Vergleich der Fehlklassifikationsraten von CART und MART anhand umfangreicher Tabellenwerke.
Kapitel 6: Zusammenfassung und Ausblick: Resümee über die Eignung von Boosting für die Konjunkturanalyse und Reflexion über die erzielten Resultate.
Boosting, Klassifikation, Konjunkturzyklen, CART, MART, Entscheidungsbäume, RWI-Datensatz, Kreuzvalidierung, Gradientenboosting, Wirtschaftsforschung, Statistik, Algorithmus, Klassifikator, Fehlklassifikationsrate, Zeitreihenanalyse.
Die Arbeit beschäftigt sich mit der Anwendung moderner Boosting-Verfahren zur Klassifikation von Konjunkturphasen auf Basis historischer Wirtschaftsdaten.
Zentrale Themen sind die theoretischen Grundlagen der statistischen Klassifikation, die Funktionsweise von Boosting-Algorithmen (insbesondere MART) und deren Anwendung auf einen konkreten ökonomischen Datensatz.
Ziel ist der Vergleich der Performanz des MART-Algorithmus mit dem klassischen CART-Verfahren, um zu evaluieren, ob Boosting bessere Ergebnisse bei der Vorhersage von Konjunkturzyklen liefert.
Die Autorin verwendet ein spezielles Design der doppelten Leave-one-Cycle-out-Analyse, um die Modelle zu validieren und Vorhersagefehler zu berechnen.
Der Hauptteil umfasst die theoretische Herleitung der Algorithmen, die detaillierte Beschreibung des RWI-Datensatzes sowie die technische Implementierung der MART-Analyse.
Die Arbeit lässt sich primär durch Begriffe wie Boosting, Konjunkturzyklen, Klassifikation, MART, CART und Kreuzvalidierung charakterisieren.
MART ist ein leistungsfähiger Vertreter der Boosting-Algorithmen, der auf dem Gradientenboosting beruht und eine vielseitige Anwendung bei Regressions- und Klassifikationsaufgaben bietet.
Die Autorin stellt fest, dass MART bei statischen Vorhersagen zwar Vorteile gegenüber CART zeigen kann, jedoch bei der komplexen HMM-Vorhersage keine signifikanten Verbesserungen erzielt.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

