EINFÜHRUNG
Die neuronale Netze haben in den 80er-90er Jahren eine enorme Popularität und Bedeutung für Finanzprognosen erlangt. Sie bieten bei weitem mehr Flexibilität als die traditionellen,, noch in den 60-er und 70-er Jahren gegründeten statistisch-ökonometrischen Methoden. Dennoch muss man heutzutage feststellen, dass die erfolgreiche Prognose für die jüngste Aktien-Zeitreihen in den letzten Jahren immer schwieriger geworden ist (vgl. White, s. 457-58) und meistens nur kommerziell unter Beanspruchung größerer EDV- und Investitionskapazitäten möglich wird, was nicht immer rentabel ist. Dies gilt insbesondere für etablierte Finanzmärkte der Industrieländer, und ist vor allem auf wachsende Markteffizienz und steigende Beanspruchung der KNN-Prognose an sich zurückzuführen. Die Optionen bieten in dieser Hinsicht ein viel versprechendes und noch wenig erschlossenes Einsatzfeld. Sie weisen starke Abhängigkeit nicht nur von Kursen des Basiswertes direkt, sondern auch von Volatilität, die auch unter Verwendung der klassischen statistischen Methoden ziemlich gut vorhersagbar ist (z.B. mit GARCH-Modellen, vgl. Mills, s. 133-137). Weiterhin, sind alle existierenden Optionspreismodelle höchstens nichtlinear, was den KNN einen Vorteil im Vergleich zu den meistens linear ausgeprägten statistischen Methoden verspricht.
Dieses Teil der Arbeit beschäftigt sich mit 1-Tages-Prognose der S&P-500-Call- Optionsscheine, die an der Chicago Mercantile Exchange gehandelt werden. Das erste Kapitel beschäftigt sich ausschließlich mit Auswahl und technischer Vorverarbeitung (Preprossesing) des Datensatzes. Wie wir später sehen werden, ist diese Etappe sehr wichtig wegen der schwächeren Transparenz der Optionsscheine verglichen mit beispielsweise Aktien. Die weiteren zwei Kapitel beschreiben den Aufbau des KNN sowie das Trainieren des Netzes in NeuroSolutions-Umgebung. Im vierten Kapitel wird die Prognosekapazität des Netzes aus der Sicht eines risikofreudigen Investors beurteilt und mit einigen „naiven“ Strategien verglichen.
INHALTSVERZEICHNIS
EINFÜHRUNG
1. Datensatz und Data Preprocessing
2. Auswahl der Variablen
3. Software, Netzaufbau und Trainieren:
4. TESTEN
5. Weitere Ausblicke/Verbesserungspotential:
Anhang 1: Die Black-Scholes-Formel zur Berechnung des Preises eines Call-Optionsscheines:
Literaturverzeichnis
EINFÜHRUNG
Die neuronale Netze haben in den 80er-90er Jahren eine enorme Popularität und Bedeutung für Finanzprognosen erlangt. Sie bieten bei weitem mehr Flexibilität als die traditionellen,, noch in den 60-er und 70-er Jahren gegründeten statistisch-ökonometrischen Methoden. Dennoch muss man heutzutage feststellen, dass die erfolgreiche Prognose für die jüngste Aktien-Zeitreihen in den letzten Jahren immer schwieriger geworden ist (vgl. White, s. 457-58) und meistens nur kommerziell unter Beanspruchung größerer EDV- und Investitionskapazitäten möglich wird, was nicht immer rentabel ist. Dies gilt insbesondere für etablierte Finanzmärkte der Industrieländer, und ist vor allem auf wachsende Markteffizienz und steigende Beanspruchung der KNN-Prognose an sich zurückzuführen.
Die Optionen bieten in dieser Hinsicht ein viel versprechendes und noch wenig erschlossenes Einsatzfeld. Sie weisen starke Abhängigkeit nicht nur von Kursen des Basiswertes direkt, sondern auch von Volatilität, die auch unter Verwendung der klassischen statistischen Methoden ziemlich gut vorhersagbar ist (z.B. mit GARCH-Modellen, vgl. Mills, s. 133-137). Weiterhin, sind alle existierenden Optionspreismodelle höchstens nichtlinear, was den KNN einen Vorteil im Vergleich zu den meistens linear ausgeprägten statistischen Methoden verspricht.
Dieses Teil der Arbeit beschäftigt sich mit 1-Tages-Prognose der S&P-500-Call-Optionsscheine, die an der Chicago Mercantile Exchange gehandelt werden.
Das erste Kapitel beschäftigt sich ausschließlich mit Auswahl und technischer Vorverarbeitung (Preprossesing) des Datensatzes. Wie wir später sehen werden, ist diese Etappe sehr wichtig wegen der schwächeren Transparenz der Optionsscheine verglichen mit beispielsweise Aktien. Die weiteren zwei Kapitel beschreiben den Aufbau des KNN sowie das Trainieren des Netzes in NeuroSolutions-Umgebung. Im vierten Kapitel wird die Prognosekapazität des Netzes aus der Sicht eines risikofreudigen Investors beurteilt und mit einigen „naiven“ Strategien verglichen.
1. Datensatz und Data Preprocessing
Der gesamte historische Datensatz wurde der Chicago Mercantile Exchange entnommen[1] und erstreckt sich über ca. 200 Handelstage über den Zeitraum vom 01.01.2001 bis zum 31.10.2001, mit jeweils ca. 250 täglichen Beobachtungen für S&P-Call-Optionsscheine mit verschiedensten Verfallsfrist- und Basispreiskombinationen. Aus den Konsistenzgründen wurde der Datensatz zuerst auf den Zeitraum 01.01.2001 bis 10.11.2001 verkürzt. Wegen der überwältigenden Größe des gesamten verbleibenden Datensatzes (über 40000 Beobachtungen für Call-Optionen) einerseits, und des relativ kurzen Zeitraumes von ca. 170 Handelstage andererseits, mussten pro Tag mehrere Optionen in den endgültigen Datensatz übernommen werden. . Für jeden Handelstag wurden 12 Optionen ausgewählt mit 3 kürzesten Verfallsfristen und mit jeweils vier vom at-the-money-Verhältnis[2] am geringsten entfernten Basispreisen. Dies ist dadurch begründet, dass solche Optionen allgemein viel liquider sind und besser vorhersagbar sind.
Zur strengeren Sicherung der Generalisierung wurde dieser 1524 Beobachtungen lange Datensatz weiterhin in einen Training- und Testing-Datensätze unterteilt. Der Training-Datensatz erfasst den Zeitraum 02.01.2001- 29.06.2001 und wird zum Trainieren des neuronalen Netzwerkes verwendet, der Test-Datensatz erfasst den Zeitraum 02.07.2001- 10.09.2001 und wird ausschließlich zur investitionsbezogenen Auswertung der Gütigkeit der Netzwerksprognose verwendet.
Jeder von diesen 2 Datensätzen besteht technisch gesehen aus 12 zusammengeklebten Sequenzen, wobei jede Sequenz den in Frage kommenden Zeitraum vollständig durchläuft. Da die ersten Beobachtungen einer Sequenz nicht von den letzten Beobachtungen der hervorgehenden Sequenz abhängen können, wurden die Datensätze mit einer zusätzlichen Dummy-Variable (IS_NEW im weiteren genannt) versorgt, die identifiziert, ob eine Beobachtung als erste in ihrer Sequenz vorkommt.
Die wenigen Ausreißer (etwa 10 Beobachtungen) wurden durch gültige Werte ersetzt. Die Ausreißer waren vor allem dank der Tatsache vorhanden, dass trotz des o. g. Algorithmus zur Auswahl der Optionen, für einige Tage nur Beobachtungen mit extrem großem in-the-money Verhältnis vorlagen, was sich in extremen Optionspreisen widerspiegelte.
2. Auswahl der Variablen
Als zu prognostizierende Output-Variable wurde der offizielle Optionspreis beim Schließen der Börse (sog. Settle-Price) verwendet.
Bei der Auswahl der Input-Variablen wurde aus folgenden Überlegungen ausgegangen.
Zum einen, wurde von vornherein angestrebt, dass das aufzubauende KNN keineswegs ein explizierendes Netzwerk, sondern ein reines prognostizierende Netzwerk sein sollte. Das heißt, alle Input-Variablen, die zur Prognose der Output-Variable des aktuellen Tages verwendet werden, wirklich aus dem Informationsstand des Vortages stammen sollten. Dies wurde auch im Laufe der im Kapitel 1 beschriebenen Auswahl der 12 Optionen pro Handelstag berücksichtigt, und zwar, wurde das at-the-money Verhältnis als Verhältnis zwischen dem heutigen Basispreis und dem gestrigen (nicht heutigen) Basiswert berechnet.
Als Ausgangsmenge der Input-Variablen ist die Menge der in der Black-Scholes-Formel enthaltenen explizierenden Variablen vollkommen akzeptabel. Die klassische explizierende Black-Scholes-Formel (vgl. Anhang 1) ist aber kritisch anzusehen. Obwohl sie die Menge der den Optionspreis beeinflussenden Variablen im Großen und Ganzen korrekt definiert, ist sie bei weitem nicht perfekt in der genauen Erfassung der empirischen Abhängigkeiten[3].
Die Menge der in dieser Formel enthaltenen Variablen besteht aus:
- dem aktuellen Preis des Basiswertes (undelying price)
- dem Basispreis (strike price)
- der verbleibenden Zeit bis zum Verfall der Option
- der risikolosen Rendite
- der jährlichen Rendite des Basiswertes
- der annualisierten Volatilität der Rendite des Basiswertes
Der Basiswert ist am Vortage noch unbekannt, deswegen kämen nur vergangenen Werte von diesem in Frage, und zwar weil diese den aktuellen Basispreis möglicherweise explizieren können[4].
Die Black-Scholes-Formel berücksichtigt in Ihrer klassischen Variante nur die vergangene Volatilität, die als konstant betrachtet wird und auf zukünftige Perioden übertragen wird. Dies widerspricht aber den jüngsten Erkenntnissen aus dem Bereich der stochastischen und bedingten Volatilität (beispielsweise GARCH-Modelle). Eine Möglichkeit, die Volatilität trotzdem zu berücksichtigen, besteht darin, die sog . Implizite Volatilität zu verwenden. Implizite Volatilität wird implizit als Volatilität berechnet, welche die klassische Black-Scholes-Formel für jeweilige Option ins Gleichgewicht setzt. Sie entspricht etwa dem Begriff der vom Markt erwarteten Volatilität der Rendite des Basiswertes bis zum Verfall der Option. Die historischen impliziten Volatilitäten sind ein Teil des Datensatzes und wurden von Chicago-Mercantile-Exchange berechnet. Nun ist anzumerken, dass auch hier nur die vergangenen Werte von dieser als Inputs verwendet werden dürfen, weil die aktuelle implizite Volatilität eigentlich am Vortage nicht bekannt ist.
[...]
[1] siehe FTP-Download-Seite ftp://ftp.cme.com/pub/hist_eod/osytd.zip vgl. auch http://www.cme.com/prices/historical_ftp_datafiles/prices_historicalftpdatafiles_endofday.cfm
zur Erklärung der einzelnen Felder des Datensatzes.
Im Datensatz fehlen die eigentlichen historischen Werte des Baisiswertes (d.h. des S&P-Indexes). Diese wurden dem http://finance.yahoo.com/ entnommen
[2] Eine Option entspricht dem at-the-money Verhältnis, falls sein Basispreis (strike price) dem aktuellen Wert des Basiswertes (underlying) (in diesem Falle des S&P-Indexes) gleicht.
[3] Dies ist insbesondere für die Abhängigkeit von Basispresises gültig. ( sog. “volatility-smile“-effect, vgl. http://www.in-the-money.com/presentation/sld104.htm)
[4] Dies wäre angesichts der evtl. vorhandenen Autoregressivität in Renditen des Basiswertes möglich. Obwohl diese meistens in Aktienkursen nicht gefunden werden (was mit Markteffizienz-Annahme vereinbar ist), werden dabei nur liniare Abhängigkeiten gemeint. KNN können aber bekanntlich dazu verwendet werden, die nichtliniare Anhängigkeiten aufzuspüren.
- Arbeit zitieren
- Volodymyr Perederiy (Autor:in), 2002, Aktienkursprognose mit künstlichen neuronalen Netzen: KURZFRISTIGE PROGNOSE DER PREISE VON CALL-OPTIONEN AUF S&P-500-INDEX MITTELS KNN, München, GRIN Verlag, https://www.grin.com/document/28347
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.