Das Erstellen präziser Prognosen ist in der heutigen Zeit unverzichtbar, da vielerlei Planungsaktivitäten der Wirtschaft, Finanzwelt und Wissenschaft Vorhersagen über das zukünftige Verhalten von Variablen und Zeitreihen benötigen. Diese Vorhersagen unterstützen die strategischen Entscheidungen von Organisationen, welche dadurch ein erhebliches praktisches Interesse an Prognoseverfahren haben. Aufgrund der Existenz einer Unzahl von Interdependenzen und ständiger Veränderungen ist es jedoch gerade im Bereich der Wirtschaft zunehmend schwieriger akkurate Vorhersagen zu treffen. Das Bestimmen von Prognosen und anschließende darauf basierte Treffen von Entscheidungen kann für Unternehmen daher sowohl Chancen als auch Risiken bergen. Aufgrund der großen praktischen Bedeutung von Prognosen ist die Entwicklung und Verbesserung von Methoden der Prognoseerstellung ein aktives und stark verbreitetes Forschungsgebiet, welches auch in aktueller Literatur viel Beachtung findet. Insbesondere vor dem Hintergrund gestiegener Volatilitäten im wirtschaftlichen Umfeld und den immer stärkeren globalen Verflechtungen gewinnen die Anforderungen an moderne Prognosesysteme am Bedeutung. Eine dieser modernen Prognosemethoden ist die Methode der Prognose mithilfe künstlicher neuronaler Netzwerke, welche seit dem Ende der achtziger Jahre neben den konventionellen Prognoseverfahren zunehmend Anwendung findet. Künstlich neuronale Netzwerke sollten ursprünglich die Erforschung von Vorgängen im menschlichen Gehirn unterstützen. Mittlerweile werden neuronale Netze jedoch in einer Vielzahl von Anwendungsgebieten wie der Optimierung, der Klassifizierung und auch der Prognose, erfolgreich eingesetzt. Die Nutzung von neuronalen Netzen zur Erstellung von Prognosen bringt jedoch auch eine Reihe von Problemen mit sich. Werden bei der Auswahl von Faktoren, die es im Prozess der Prognoseerstellung mithilfe von künstlichen neuronalen Netzwerken zu bestimmen gilt, suboptimale Entscheidungen getroffen, kann sich dies stark negativ auf die Prognosegüte auswirken. Eine Methode, welche diesen Problemen entgegenwirken soll, ist die Kombination mehrerer neuronaler Netzwerke zu einem Ensemble. Mit dieser Methode, die im Laufe des letzten Jahrzehnts immer stärker werdende Aufmerksamkeit bekommen hat, soll die Gefahr von groben Fehleinschätzungen verringert sowie auch die generell erreichbare Prognosegüte stark verbessert werden.
Inhaltsverzeichnis
1 EINLEITUNG
1.1 THEMENVORSTELLUNG UND ZIELSETZUNG
1.2 GANG DER ARBEIT
2 KONVENTIONELLE PROGNOSEVERFAHREN
2.1 NAIVE VERFAHREN
2.2 QUALITATIVE VERFAHREN
2.3 QUANTITATIVE VERFAHREN
2.3.1 Zeitreihenprognose
2.3.2 Kausale Prognoseverfahren
3 KÜNSTLICHE NEURONALE NETZE
3.1 AUFBAU UND FUNKTIONSWEISE KÜNSTLICHER NEURONALER NETZE
3.1.1 Das Neuron
3.1.2 Die Netzwerktopologie
3.2 DER LERNVORGANG KÜNSTLICHER NEURONALER NETZWERKE
3.2.1 Der Backpropagation-Algorithmus
4 PROGNOSE MITHILFE KÜNSTLICHER NEURONALER NETZE
4.1 EIGENSCHAFTEN KÜNSTLICHER NEURONALER NETZE IN BEZUG AUF DIE PROGNOSE
4.1.1 Datengetrieben und selbst anpassend
4.1.2 Generalisierbarkeit
4.1.3 Abbildbarkeit jeder kontinuierlichen Funktion
4.1.4 Nichtlinearität
4.2 ANWENDUNGSGEBIETE
4.3 PROZESS DER PROGNOSEERSTELLUNG
4.4 ZEITREIHENMODELLIERUNG DURCH EIN MLP - NETZ
4.5 LIMITATIONEN DES KTB ANSATZES
5 KOMBINATION KÜNSTLICHER NEURONALER NETZE ZUR PROGNOSEERSTELLUNG
5.1 DIE ERSTELLUNG VARIIERENDER NETZWERKE
5.1.1 Variation der Startwerte
5.1.2 Variation der Topologien
5.1.3 Variation bzw. Manipulation der Trainingsdaten
5.2 DIE KOMBINATION DER NETZWERKE
5.2.1 Die einfache Durchschnittsbildung
5.2.2 Die gewichtete Durchschnittsbildung
5.2.3 Die Größe des NNE
5.3 GEGENÜBERSTELLUNG DER VERFAHREN DER KOMBINATIONSPROGNOSE
6 FAZIT UND AUSBLICK
Zielsetzung & Themen
Diese Arbeit untersucht, ob die Kombination mehrerer künstlicher neuronaler Netzwerke zu einem Ensemble die Prognosequalität im Vergleich zu einzelnen Netzwerken steigern kann oder ob dies einen unwirtschaftlichen Mehraufwand darstellt.
- Grundlagen konventioneller und neuronaler Prognoseverfahren
- Struktur und Lernvorgang künstlicher neuronaler Netzwerke
- Prozess der Prognoseerstellung und Limitationen des Single-Keep-The-Best (KTB) Ansatzes
- Methoden der Ensemble-Erstellung (Variation von Startwerten, Topologien und Trainingsdaten)
- Kombinationsregeln und optimale Ensemble-Größe
Auszug aus dem Buch
4.5 Limitationen des KTB Ansatzes
Bei der Prognoseerstellung mithilfe künstlicher neuronaler Netzwerke müssen im Prozess der Prognosevorbereitung eine Vielzahl von Entscheidungen getroffen werden, bevor die eigentliche Prognose vorgenommen werden kann. Diese beinhalten zunächst, wie in Absatz 4.3 beschrieben, die Wahl einer geeigneten Topologie. Dazu gehört das Festlegen der Art, der Komplexität und des Aufbaus des Netzes, sowie die Bestimmung der vom Netz genutzten Funktionen. Des Weiteren muss die Parametrisierung vorgenommen werden, was Entscheidungen bezüglich der Trainingsart und Dauer sowie auch der Auswahl der Trainingsdaten erfordert. Sämtliche dieser Entscheidungsmöglichkeiten werden in der Regel durch einen „Trial-and-Error“ Ansatz bewertet. Dies bedeutet, dass eine Vielzahl verschiedener Modellvariationen weitestgehend zufällig erstellt und trainiert werden, ohne dass hierbei auf universelle Regeln zurückgegriffen werden kann.
Anschließend wird die Konfiguration, welche die besten Resultate in einem Validierungsprozess erreicht, ausgewählt (Zhang & Berari, 2001, S. 652). Der Grundgedanke hinter dieser als „Single-Keep-The-Best“ (KTB) Ansatz bezeichneten Auswahlmethode ist, dass sich stets das für ein gegebenes Problem beste Modell identifizieren lässt. Dies ist jedoch in der Realität sehr unwahrscheinlich. Daher bringt der KTB-Ansatz mehrere Limitationen mit sich (Freitas & Rodrigues, 2006, S. 802) (Zhang & Berari, 2001, S. 652).
Die durch den KTB-Ansatz gewählten Eigenschaften eines künstlichen neuronalen Netzes zur Prognostizierung eines Problems sind in der Realität mit großer Wahrscheinlichkeit nicht die für das gegebene Problem optimalen Spezifikationen. Diese Limitation des Ansatzes wird durch mehrere Gründe verursacht.
Zum einen wird das Können des Netzwerkes durch sehr viele verschiedene Faktoren beeinflusst. Für die Festlegung dieser Faktoren gibt es keinerlei effektive Regeln, wodurch das optimale Wählen sämtlicher Faktoren auch bei der Erstellung vieler verschiedener Varianten sehr unwahrscheinlich ist. Des Weiteren sind künstliche neuronale Netzwerke rein datengetrieben. Dadurch wird die Beurteilung über die Qualität der einzelnen neuronalen Netze auch maßgeblich davon beeinflusst, mit welchen Datensätzen sie trainiert und anschließend getestet werden.
Zusammenfassung der Kapitel
1 EINLEITUNG: Einführung in die Thematik der Prognoseerstellung und Darlegung der zentralen Forschungsfrage bezüglich der Effektivität von Neural Network Ensembles.
2 KONVENTIONELLE PROGNOSEVERFAHREN: Überblick über klassische naive, qualitative und quantitative Prognosemethoden sowie deren Abgrenzung zu neuronalen Ansätzen.
3 KÜNSTLICHE NEURONALE NETZE: Erläuterung der Grundlagen, des Aufbaus, der Netzwerktopologie sowie des Lernvorgangs mittels Backpropagation-Algorithmus.
4 PROGNOSE MITHILFE KÜNSTLICHER NEURONALER NETZE: Untersuchung der spezifischen Eigenschaften neuronaler Netze für Prognosezwecke und Beschreibung des Prozesses der Prognoseerstellung sowie Limitationen des KTB-Ansatzes.
5 KOMBINATION KÜNSTLICHER NEURONALER NETZE ZUR PROGNOSEERSTELLUNG: Detaillierte Analyse der Erstellung variierender Netzwerke, der Kombinationsmöglichkeiten und der Bestimmung der optimalen Ensemble-Größe.
6 FAZIT UND AUSBLICK: Zusammenfassende Bewertung der Ergebnisse und Identifikation zukünftiger Forschungsfelder für die Kombinationsprognose.
Schlüsselwörter
Prognoseerstellung, Künstliche neuronale Netzwerke, Neural Network Ensemble, Zeitreihenprognose, Backpropagation, Datenvariation, Partitionierung, Bagging, Boosting, Generalisierung, Prognosegüte, KTB-Ansatz, Neuronale Topologie, Modelloptimierung, Stacking
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der Nutzung von künstlichen neuronalen Netzwerken zur Prognoseerstellung und untersucht, inwiefern die Kombination mehrerer solcher Netzwerke (Neural Network Ensembles) die Prognosequalität verbessert.
Was sind die zentralen Themenfelder der Arbeit?
Zentrale Themen sind der Vergleich konventioneller Prognosemethoden mit neuronalen Netzen, der Aufbau und das Training neuronaler Architekturen sowie diverse Techniken zur Ensemble-Bildung und -Kombination.
Was ist die primäre Forschungsfrage?
Die zentrale Frage ist, ob die Kombination mehrerer neuronaler Netzwerke die erreichbare Prognosequalität tatsächlich signifikant erhöht oder ob sie lediglich einen unwirtschaftlichen Mehraufwand an Ressourcen darstellt.
Welche wissenschaftliche Methode wird verwendet?
Es handelt sich um eine theoretische Arbeit, die auf einer umfassenden Literaturanalyse und der Auswertung empirischer Studien aus der Wissenschaft und Praxis basiert.
Was wird im Hauptteil der Arbeit behandelt?
Im Hauptteil werden zunächst die Limitationen einzelner neuronaler Netze (KTB-Ansatz) analysiert, gefolgt von verschiedenen Methoden zur Erstellung variierender Netzwerke (z.B. Variation von Startwerten oder Trainingsdaten) und abschließend deren Kombination zu Ensembles.
Welche Schlüsselwörter charakterisieren die Arbeit?
Zu den wichtigsten Begriffen zählen Neural Network Ensemble, Prognoseerstellung, Generalisierung, Backpropagation, Datenvariation, Bagging und Boosting.
Was ist das "Single-Keep-The-Best" (KTB) Verfahren?
Der KTB-Ansatz beschreibt die Methode, durch Trial-and-Error viele verschiedene Netzwerkkonfigurationen zu testen und lediglich das Modell mit der besten Performance für die Prognose auszuwählen.
Warum wird die Kombination von Netzwerken als vorteilhaft angesehen?
Die Kombination hilft, die Limitationen einzelner Modelle zu überwinden, indem die individuellen Stärken verschiedener Netzwerke genutzt werden, um die Generalisierungsfähigkeit zu erhöhen und das Risiko grober Fehleinschätzungen zu senken.
Welche Rolle spielt das "Verrauschen" von Daten?
Das Verrauschen dient als Methode der Datenvariation, um künstlich neue, aber inhaltlich verwandte Zeitreihen zu erzeugen. Dies ermöglicht das Training mehrerer Netzwerke auf ähnlichen Daten, was die Prognosefehler der einzelnen Modelle unkorreliert macht und somit die Gesamtgüte des Ensembles verbessert.
- Arbeit zitieren
- Nicolas Saive (Autor:in), 2011, Kombinationsprognose mit neuronalen Netzen, München, GRIN Verlag, https://www.grin.com/document/197590