Boosting bei der Analyse von Konjunkturzyklen

Diplomarbeit, 2002
54 Seiten, Note: 2,3

BWL - Sonstiges

Leseprobe

Inhaltsverzeichnis

Einleitung

Bezeichnungen

Kapitel 1: Grundlagen

1.1 Das Klassifikationsproblem

1.2 Der CART-Algorithmus

1.3 Das PAC-Lern-Modell

1.4 Das dynamische Modell und die Integration von Hintergrundwissen

Kapitel 2: Boosting

2.1 Entstehungsgeschichte und Wurzeln von Boosting

2.2 Bisherige Anwendungsgebiete und Bewährung von Boosting

2.3 Erklärung verschiedener Algorithmen

2.4 Gradientenboosting

Kapitel 3: Wirtschaftliches Szenario

3.1 Beschreibung des RWI-Datensatzes

3.2 Problemstellung des Projektes B3 im Rahmen des SFB 475

3.3 Stand der Forschung bei der Auswertung der RWI-Datensatzes

Kapitel 4: Implementierung und Anwendung von MART

4.1 Aufrufparameter von MART

4.2 Anwendung auf den RWI-Datensatz

Kapitel 5: Ergebnis

5.1 Ergebnisdarstellung

5.2 Vergleich von CART und MART

Kapitel 6: Zusammenfassung und Ausblick

Zielsetzung und Themenfelder

Die Arbeit untersucht die Eignung des Boosting-Verfahrens „Multiple Additive Regression Trees“ (MART) zur Analyse und Klassifikation von Konjunkturzyklen auf Basis des RWI-Datensatzes. Ziel ist es, die Performanz dieses Algorithmus im direkten Vergleich zum etablierten CART-Algorithmus unter Anwendung eines speziellen, doppelten Kreuzvalidierungsdesigns zu bewerten.

Grundlagen der Klassifikation und des CART-Algorithmus
Theorie und Entstehungsgeschichte von Boosting-Algorithmen
Modellierung und Beschreibung des RWI-Datensatzes
Implementierung und Anwendung des MART-Algorithmus
Vergleichende Analyse der Klassifikationsergebnisse

Auszug aus dem Buch

1.2 Der CART-Algorithmus

Die Abkürzung CART (Classification and Regression Trees) geht zurück auf das gleichnamige wegweisende Buch von Breiman [Breiman et al., 1984] aus dem Jahr 1984. Seitdem ist der darauf aufbauende Algorithmus CART ein weitverbreitetes Werkzeug zur Klassifikation und Regression mittels Entscheidungsbäumen [Salford Systems, 2002].

Die technische Funktionsweise von CART beruht auf binärer rekursiver Partition; d.h. jeder Vaterknoten wird immer in genau zwei Kinderknoten geteilt (binär) und dieser Prozeß kann wiederum auf jeden Kinderknoten angewandt werden (rekursiv). Das Herzstück der CART-Analyse ist eine Menge von Regeln, die sicherstellen, daß:

• jeder Knoten in einen Baum aufgesplittet werden kann,

• eindeutig entschieden werden kann, ob ein Baum vollständig aufgebaut ist (oder ob weitere Splits erforderlich sind) und

• jedem Endknoten eine Klassenzugehörigkeit zugeordnet werden kann (oder einem Vorhersagewert bei Regression).

Splitregeln: Um einen Knoten in zwei Kinder zu spalten, benutzt CART immer eine sogenannte Bool’sche Variable, die nur die Ausprägungen „ja“ und „nein“ kennt. CART-Analyse basiert auf der Methode, alle möglichen Splits für alle in die Analyse involvierten Variablen durchzuführen. Hat man beispielsweise ein Datenset mit 200 Beobachtungen und 13 Variablen, dann wählt CART aus 200⋅13 = 2600 möglichen Splits den ersten Split aus. Jedes Problem hat eine endliche, aber vielleicht auch sehr große Menge möglicher Splits, welche CART konsequent durchgeht.

Zusammenfassung der Kapitel

Kapitel 1: Grundlagen: Einführung in die statistischen Probleme der Klassifikation, die Funktionsweise von Entscheidungsbäumen (CART) sowie das theoretische Fundament des PAC-Lern-Modells.

Kapitel 2: Boosting: Darstellung der Methodik des Boostings zur Erhöhung der Klassifikationsgenauigkeit sowie Erläuterung diverser Boosting-Algorithmen, einschließlich Gradientenboosting.

Kapitel 3: Wirtschaftliches Szenario: Beschreibung der ökonomischen Ausgangslage, des RWI-Datensatzes sowie der Forschungsziele im Rahmen des Projektes B3 des SFB 475.

Kapitel 4: Implementierung und Anwendung von MART: Technische Erläuterung der Konfiguration des MART-Algorithmus und des speziellen Designs der doppelten Leave-one-Cycle-out-Analyse.

Kapitel 5: Ergebnis: Präsentation der Analyseergebnisse und direkter Vergleich der Fehlklassifikationsraten von CART und MART anhand umfangreicher Tabellenwerke.

Kapitel 6: Zusammenfassung und Ausblick: Resümee über die Eignung von Boosting für die Konjunkturanalyse und Reflexion über die erzielten Resultate.

Schlüsselwörter

Boosting, Klassifikation, Konjunkturzyklen, CART, MART, Entscheidungsbäume, RWI-Datensatz, Kreuzvalidierung, Gradientenboosting, Wirtschaftsforschung, Statistik, Algorithmus, Klassifikator, Fehlklassifikationsrate, Zeitreihenanalyse.

Häufig gestellte Fragen

Worum geht es in der Diplomarbeit grundsätzlich?

Die Arbeit beschäftigt sich mit der Anwendung moderner Boosting-Verfahren zur Klassifikation von Konjunkturphasen auf Basis historischer Wirtschaftsdaten.

Welche zentralen Themenfelder werden behandelt?

Zentrale Themen sind die theoretischen Grundlagen der statistischen Klassifikation, die Funktionsweise von Boosting-Algorithmen (insbesondere MART) und deren Anwendung auf einen konkreten ökonomischen Datensatz.

Was ist das primäre Ziel der Untersuchung?

Ziel ist der Vergleich der Performanz des MART-Algorithmus mit dem klassischen CART-Verfahren, um zu evaluieren, ob Boosting bessere Ergebnisse bei der Vorhersage von Konjunkturzyklen liefert.

Welche wissenschaftliche Methode wird verwendet?

Die Autorin verwendet ein spezielles Design der doppelten Leave-one-Cycle-out-Analyse, um die Modelle zu validieren und Vorhersagefehler zu berechnen.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil umfasst die theoretische Herleitung der Algorithmen, die detaillierte Beschreibung des RWI-Datensatzes sowie die technische Implementierung der MART-Analyse.

Welche Schlüsselwörter charakterisieren die Arbeit?

Die Arbeit lässt sich primär durch Begriffe wie Boosting, Konjunkturzyklen, Klassifikation, MART, CART und Kreuzvalidierung charakterisieren.

Warum ist der MART-Algorithmus für diese Analyse relevant?

MART ist ein leistungsfähiger Vertreter der Boosting-Algorithmen, der auf dem Gradientenboosting beruht und eine vielseitige Anwendung bei Regressions- und Klassifikationsaufgaben bietet.

Welche Schlussfolgerung zieht die Autorin bezüglich der Ergebnisse?

Die Autorin stellt fest, dass MART bei statischen Vorhersagen zwar Vorteile gegenüber CART zeigen kann, jedoch bei der komplexen HMM-Vorhersage keine signifikanten Verbesserungen erzielt.

Ende der Leseprobe aus 54 Seiten - nach oben

Details

Titel: Boosting bei der Analyse von Konjunkturzyklen
Hochschule: Technische Universität Dortmund (Lehrstuhl für Computergestützte Statistik)
Note: 2,3
Autor: Heike Looks (Autor:in)
Erscheinungsjahr: 2002
Seiten: 54
Katalognummer: V10229
ISBN (eBook): 9783638167215
ISBN (Buch): 9783638697927
Dateigröße: 638 KB
Sprache: Deutsch
Anmerkungen: Interdisziplinäre Diplomarbeit aus den Bereichen Informatik, Statistik und Wirtschaft: Beschreibung der Konjunktur Deutschlands anhand des RWI-Datensatzes, Erklärung des Boosting-Ansatzes, Anwendung des Klassifikationsalgorithmus MART als Beispiel für die Funktionsweise von Boosting im Vergleich zu anderen Algorithmen.
Schlagworte: Klassifikationsalgorithmus MART RWI-Datensatz Konjunkturvorhersage
Produktsicherheit: GRIN Publishing GmbH
Preis (Ebook): US$ 21,99
Preis (Book): US$ 31,99

Arbeit zitieren: Heike Looks (Autor:in), 2002, Boosting bei der Analyse von Konjunkturzyklen, München, Page::Imprint:: GRINVerlagOHG, https://www.diplomarbeiten24.de/document/10229