Boosting (englisch: "verstärken, fördern") ist eine generelle Methode, um die Genauigkeit eines gegebenen Lern- oder Klassifikationsalgorithmus zu erhöhen. Ein sogenannter "schwacher" Lernalgorithmus, der kaum besser und genauer ist als einfaches Raten, wird soweit "verstärkt", das sich ein ziemlich genauer "starker" Lernalgorithmus ergibt. Dabei werden während des wiederholten Durchlaufens des Boostingalgorithmus durch unterschiedliche Gewichtung der Trainingsbeispiele mehrere Klassifikatoren berechnet, deren Linearkombination dann einen verbesserten Klassifikator liefert.

Die Wurzeln und die Enstehungsgeschichte von Boosting finden ebenso Beachtung wie ein Darstellung gängiger Boostingalgorithmen.

Einer der Repräsentanten dieser Algorithmenklasse - MART - wird auf den RWI-Datensatz des Rheinisch-Westfälische Institut für Wirtschaftsforschung (RWI) in Essen angewandt, dessen besondere Bedeutung vor dem Hintergrund des Sonderforschungsbereichs 475 Komplexitätsreduktion in multivariaten Datenstrukturen beleuchtet wird.

Mittels einer doppelten leave-one-Cycle-out-Analyse werden die Analyseergebnisse mit denen des CART-Algorithmus verglichen.

Das statistische Problem der Klassifikation beschäftigt sich mit der Zuordnung von Objekten zu Klassen. Jedes Objekt ist charakterisiert durch eine Anzahl von Variablenausprägungen und soll eindeutig in eine Klasse eingeordnet werden. Ein Klassifikationsalgorithmus oder Klassifikator trainiert zunächst auf einer Menge von bereits klassifizierten Objekten. Dann ordnet er Objekte, von denen nur die Variablenausprägungen, aber nicht die Klassenzugehörigkeiten bekannt sind, einer Klasse zu.

Diese grundlegenden Begriffe der Klassifikation werden zusammen mit dem CART-Algorithmus, dem PAC-Lern-Modell und den Überlegungen über die Einbeziehung von Hintergrundwissen in Klassifikationsalgorithmen erläutert.

Boosting ist ein interessantes Konzept zur Verbesserung von Klassifikatoren. Es wird nicht nur in der Statistik eingesetzt, sondern hat Anwendungen in der Mustererkennung, der Spieltheorie und der Texterkennung gefunden.

Excerpt

Inhaltsverzeichnis

Einleitung
Bezeichnungen
Kapitel 1: Grundlagen
- 1.1 Das Klassifikationsproblem
- 1.2 Der CART-Algorithmus
- 1.3 Das PAC-Lern-Modell
- 1.4 Das dynamische Modell und die Integration von Hintergrundwissen
Kapitel 2: Boosting
- 2.1 Entstehungsgeschichte und Wurzeln von Boosting
- 2.2 Bisherige Anwendungsgebiete und Bewährung von Boosting
- 2.3 Erklärung verschiedener Algorithmen
- 2.4 Gradientenboosting
Kapitel 3: Wirtschaftliches Szenario
- 3.1 Beschreibung des RWI-Datensatzes
- 3.2 Problemstellung des Projektes B3 im Rahmen des SFB 475
- 3.3 Stand der Forschung bei der Auswertung der RWI-Datensatzes
Kapitel 4: Implementierung und Anwendung von MART
- 4.1 Aufrufparameter von MART
- 4.2 Anwendung auf den RWI-Datensatz
Kapitel 5: Ergebnis
- 5.1 Ergebnisdarstellung
- 5.2 Vergleich von CART und MART
Kapitel 6: Zusammenfassung und Ausblick

Zielsetzung und Themenschwerpunkte

Die Diplomarbeit befasst sich mit der Anwendung von Boosting-Algorithmen, speziell dem MART-Algorithmus, zur Analyse von Konjunkturzyklen. Das Ziel der Arbeit ist es, die Leistungsfähigkeit von Boosting im Vergleich zu klassischen Klassifikationsmethoden wie CART zu demonstrieren und dessen Eignung für die Analyse von ökonomischen Daten aufzuzeigen.

Klassifikationsmethoden und Entscheidungsbäume
Boosting-Algorithmen und ihre Anwendung
Analyse von Konjunkturzyklen anhand ökonomischer Daten
Vergleich der Performance von CART und MART
Integration von Hintergrundwissen in die Analyse

Zusammenfassung der Kapitel

Die Einleitung führt in die Thematik der Klassifikation ein und erläutert grundlegende Begriffe wie Entscheidungsbäume und den CART-Algorithmus. Kapitel 2 definiert Boosting und beschreibt verschiedene Boosting-Algorithmen, darunter den MART-Algorithmus, der im weiteren Verlauf der Arbeit angewendet wird. Kapitel 3 stellt den RWI-Datensatz vor und beschreibt dessen Bedeutung für die Analyse von Konjunkturzyklen. Kapitel 4 widmet sich der Implementierung und Anwendung des MART-Algorithmus auf den RWI-Datensatz. Kapitel 5 präsentiert die Ergebnisse der Analyse und vergleicht die Performance von CART und MART.

Schlüsselwörter

Klassifikation, Entscheidungsbaum, CART-Algorithmus, Boosting, MART, Konjunkturzyklen, RWI-Datensatz, ökonomische Daten, Komplexitätsreduktion, multivariate Datenstrukturen.

Excerpt out of 54 pages - scroll top

Details

Title: Boosting bei der Analyse von Konjunkturzyklen
College: University of Dortmund (Lehrstuhl für Computergestützte Statistik)
Grade: 2,3
Author: Heike Looks (Author)
Publication Year: 2002
Pages: 54
Catalog Number: V10229
ISBN (eBook): 9783638167215
ISBN (Book): 9783638697927
Language: German
Tags: Klassifikationsalgorithmus MART RWI-Datensatz Konjunkturvorhersage
Product Safety: GRIN Publishing GmbH

Quote paper: Heike Looks (Author), 2002, Boosting bei der Analyse von Konjunkturzyklen, Munich, GRIN Verlag, https://www.grin.com/document/10229

Boosting bei der Analyse von Konjunkturzyklen