Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Business economics - Miscellaneous

Boosting bei der Analyse von Konjunkturzyklen

Title: Boosting bei der Analyse von Konjunkturzyklen

Diploma Thesis , 2002 , 54 Pages , Grade: 2,3

Autor:in: Heike Looks (Author)

Business economics - Miscellaneous
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

Boosting (englisch: "verstärken, fördern") ist eine generelle Methode, um die Genauigkeit eines gegebenen Lern- oder Klassifikationsalgorithmus zu erhöhen. Ein sogenannter "schwacher" Lernalgorithmus, der kaum besser und genauer ist als einfaches Raten, wird soweit "verstärkt", das sich ein ziemlich genauer "starker" Lernalgorithmus ergibt. Dabei werden während des wiederholten Durchlaufens des Boostingalgorithmus durch unterschiedliche Gewichtung der Trainingsbeispiele mehrere Klassifikatoren berechnet, deren Linearkombination dann einen verbesserten Klassifikator liefert.

Die Wurzeln und die Enstehungsgeschichte von Boosting finden ebenso Beachtung wie ein Darstellung gängiger Boostingalgorithmen.

Einer der Repräsentanten dieser Algorithmenklasse - MART - wird auf den RWI-Datensatz des Rheinisch-Westfälische Institut für Wirtschaftsforschung (RWI) in Essen angewandt, dessen besondere Bedeutung vor dem Hintergrund des Sonderforschungsbereichs 475 Komplexitätsreduktion in multivariaten Datenstrukturen beleuchtet wird.

Mittels einer doppelten leave-one-Cycle-out-Analyse werden die Analyseergebnisse mit denen des CART-Algorithmus verglichen.

Das statistische Problem der Klassifikation beschäftigt sich mit der Zuordnung von Objekten zu Klassen. Jedes Objekt ist charakterisiert durch eine Anzahl von Variablenausprägungen und soll eindeutig in eine Klasse eingeordnet werden. Ein Klassifikationsalgorithmus oder Klassifikator trainiert zunächst auf einer Menge von bereits klassifizierten Objekten. Dann ordnet er Objekte, von denen nur die Variablenausprägungen, aber nicht die Klassenzugehörigkeiten bekannt sind, einer Klasse zu.

Diese grundlegenden Begriffe der Klassifikation werden zusammen mit dem CART-Algorithmus, dem PAC-Lern-Modell und den Überlegungen über die Einbeziehung von Hintergrundwissen in Klassifikationsalgorithmen erläutert.

Boosting ist ein interessantes Konzept zur Verbesserung von Klassifikatoren. Es wird nicht nur in der Statistik eingesetzt, sondern hat Anwendungen in der Mustererkennung, der Spieltheorie und der Texterkennung gefunden.

Excerpt


Inhaltsverzeichnis

Einleitung

Bezeichnungen

Kapitel 1: Grundlagen

1.1 Das Klassifikationsproblem

1.2 Der CART-Algorithmus

1.3 Das PAC-Lern-Modell

1.4 Das dynamische Modell und die Integration von Hintergrundwissen

Kapitel 2: Boosting

2.1 Entstehungsgeschichte und Wurzeln von Boosting

2.2 Bisherige Anwendungsgebiete und Bewährung von Boosting

2.3 Erklärung verschiedener Algorithmen

2.4 Gradientenboosting

Kapitel 3: Wirtschaftliches Szenario

3.1 Beschreibung des RWI-Datensatzes

3.2 Problemstellung des Projektes B3 im Rahmen des SFB 475

3.3 Stand der Forschung bei der Auswertung der RWI-Datensatzes

Kapitel 4: Implementierung und Anwendung von MART

4.1 Aufrufparameter von MART

4.2 Anwendung auf den RWI-Datensatz

Kapitel 5: Ergebnis

5.1 Ergebnisdarstellung

5.2 Vergleich von CART und MART

Kapitel 6: Zusammenfassung und Ausblick

Zielsetzung und Themenfelder

Die Arbeit untersucht die Eignung des Boosting-Verfahrens „Multiple Additive Regression Trees“ (MART) zur Analyse und Klassifikation von Konjunkturzyklen auf Basis des RWI-Datensatzes. Ziel ist es, die Performanz dieses Algorithmus im direkten Vergleich zum etablierten CART-Algorithmus unter Anwendung eines speziellen, doppelten Kreuzvalidierungsdesigns zu bewerten.

  • Grundlagen der Klassifikation und des CART-Algorithmus
  • Theorie und Entstehungsgeschichte von Boosting-Algorithmen
  • Modellierung und Beschreibung des RWI-Datensatzes
  • Implementierung und Anwendung des MART-Algorithmus
  • Vergleichende Analyse der Klassifikationsergebnisse

Auszug aus dem Buch

1.2 Der CART-Algorithmus

Die Abkürzung CART (Classification and Regression Trees) geht zurück auf das gleichnamige wegweisende Buch von Breiman [Breiman et al., 1984] aus dem Jahr 1984. Seitdem ist der darauf aufbauende Algorithmus CART ein weitverbreitetes Werkzeug zur Klassifikation und Regression mittels Entscheidungsbäumen [Salford Systems, 2002].

Die technische Funktionsweise von CART beruht auf binärer rekursiver Partition; d.h. jeder Vaterknoten wird immer in genau zwei Kinderknoten geteilt (binär) und dieser Prozeß kann wiederum auf jeden Kinderknoten angewandt werden (rekursiv). Das Herzstück der CART-Analyse ist eine Menge von Regeln, die sicherstellen, daß:

• jeder Knoten in einen Baum aufgesplittet werden kann,

• eindeutig entschieden werden kann, ob ein Baum vollständig aufgebaut ist (oder ob weitere Splits erforderlich sind) und

• jedem Endknoten eine Klassenzugehörigkeit zugeordnet werden kann (oder einem Vorhersagewert bei Regression).

Splitregeln: Um einen Knoten in zwei Kinder zu spalten, benutzt CART immer eine sogenannte Bool’sche Variable, die nur die Ausprägungen „ja“ und „nein“ kennt. CART-Analyse basiert auf der Methode, alle möglichen Splits für alle in die Analyse involvierten Variablen durchzuführen. Hat man beispielsweise ein Datenset mit 200 Beobachtungen und 13 Variablen, dann wählt CART aus 200⋅13 = 2600 möglichen Splits den ersten Split aus. Jedes Problem hat eine endliche, aber vielleicht auch sehr große Menge möglicher Splits, welche CART konsequent durchgeht.

Zusammenfassung der Kapitel

Kapitel 1: Grundlagen: Einführung in die statistischen Probleme der Klassifikation, die Funktionsweise von Entscheidungsbäumen (CART) sowie das theoretische Fundament des PAC-Lern-Modells.

Kapitel 2: Boosting: Darstellung der Methodik des Boostings zur Erhöhung der Klassifikationsgenauigkeit sowie Erläuterung diverser Boosting-Algorithmen, einschließlich Gradientenboosting.

Kapitel 3: Wirtschaftliches Szenario: Beschreibung der ökonomischen Ausgangslage, des RWI-Datensatzes sowie der Forschungsziele im Rahmen des Projektes B3 des SFB 475.

Kapitel 4: Implementierung und Anwendung von MART: Technische Erläuterung der Konfiguration des MART-Algorithmus und des speziellen Designs der doppelten Leave-one-Cycle-out-Analyse.

Kapitel 5: Ergebnis: Präsentation der Analyseergebnisse und direkter Vergleich der Fehlklassifikationsraten von CART und MART anhand umfangreicher Tabellenwerke.

Kapitel 6: Zusammenfassung und Ausblick: Resümee über die Eignung von Boosting für die Konjunkturanalyse und Reflexion über die erzielten Resultate.

Schlüsselwörter

Boosting, Klassifikation, Konjunkturzyklen, CART, MART, Entscheidungsbäume, RWI-Datensatz, Kreuzvalidierung, Gradientenboosting, Wirtschaftsforschung, Statistik, Algorithmus, Klassifikator, Fehlklassifikationsrate, Zeitreihenanalyse.

Häufig gestellte Fragen

Worum geht es in der Diplomarbeit grundsätzlich?

Die Arbeit beschäftigt sich mit der Anwendung moderner Boosting-Verfahren zur Klassifikation von Konjunkturphasen auf Basis historischer Wirtschaftsdaten.

Welche zentralen Themenfelder werden behandelt?

Zentrale Themen sind die theoretischen Grundlagen der statistischen Klassifikation, die Funktionsweise von Boosting-Algorithmen (insbesondere MART) und deren Anwendung auf einen konkreten ökonomischen Datensatz.

Was ist das primäre Ziel der Untersuchung?

Ziel ist der Vergleich der Performanz des MART-Algorithmus mit dem klassischen CART-Verfahren, um zu evaluieren, ob Boosting bessere Ergebnisse bei der Vorhersage von Konjunkturzyklen liefert.

Welche wissenschaftliche Methode wird verwendet?

Die Autorin verwendet ein spezielles Design der doppelten Leave-one-Cycle-out-Analyse, um die Modelle zu validieren und Vorhersagefehler zu berechnen.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil umfasst die theoretische Herleitung der Algorithmen, die detaillierte Beschreibung des RWI-Datensatzes sowie die technische Implementierung der MART-Analyse.

Welche Schlüsselwörter charakterisieren die Arbeit?

Die Arbeit lässt sich primär durch Begriffe wie Boosting, Konjunkturzyklen, Klassifikation, MART, CART und Kreuzvalidierung charakterisieren.

Warum ist der MART-Algorithmus für diese Analyse relevant?

MART ist ein leistungsfähiger Vertreter der Boosting-Algorithmen, der auf dem Gradientenboosting beruht und eine vielseitige Anwendung bei Regressions- und Klassifikationsaufgaben bietet.

Welche Schlussfolgerung zieht die Autorin bezüglich der Ergebnisse?

Die Autorin stellt fest, dass MART bei statischen Vorhersagen zwar Vorteile gegenüber CART zeigen kann, jedoch bei der komplexen HMM-Vorhersage keine signifikanten Verbesserungen erzielt.

Excerpt out of 54 pages  - scroll top

Details

Title
Boosting bei der Analyse von Konjunkturzyklen
College
University of Dortmund  (Lehrstuhl für Computergestützte Statistik)
Grade
2,3
Author
Heike Looks (Author)
Publication Year
2002
Pages
54
Catalog Number
V10229
ISBN (eBook)
9783638167215
ISBN (Book)
9783638697927
Language
German
Tags
Klassifikationsalgorithmus MART RWI-Datensatz Konjunkturvorhersage
Product Safety
GRIN Publishing GmbH
Quote paper
Heike Looks (Author), 2002, Boosting bei der Analyse von Konjunkturzyklen, Munich, GRIN Verlag, https://www.grin.com/document/10229
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  54  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint