INHALTSVERZEICHNIS
EINF ÜHRUNG 1
1. DATENSATZ UND DATA PREPROCESSING. 2
2. AUS WAHL DER VARIABLEN 3
3. SOFTWARE, NETZAUFBAU UND TRAINIEREN: 5
4. TESTEN. 9
5. WEITERE AUSBLICKE/VERBESSERUNGSPOTENTIAL: 11
ANHANG 1: DIE BLACK-SCHOLES-FORMEL ZUR BERECHNUNG DES PREISES
EINES CALL-OPTIONSSCHEINES: 13
LITERATURVERZEICHNIS 14
Kurzfristige Prognose der Call-Optionen auf S&P-500-Index mittels KNN
1
EINFÜHRUNG
Die neuronale Netze haben in den 80er-90er Jahren eine enorme Popularität und Bedeutung für Finanzprognosen erlangt. Sie bieten bei weitem mehr Flexibilität als die traditionellen,, noch in den 60-er und 70-er Jahren gegründeten statistisch-ökonometrischen Methoden. Dennoch muss man heutzutage feststellen, dass die erfolgreiche Prognose für die jüngste Aktien-Zeitreihen in den letzten Jahren immer schwieriger geworden ist (vgl. White, s. 457-58) und meistens nur kommerziell unter Beanspruchung größerer EDV- und Investitionskapazitäten möglich wird, was nicht immer rentabel ist. Dies gilt insbesondere für etablierte Finanzmärkte der Industrieländer, und ist vor allem auf wachsende Markteffizienz und steigende Beanspruchung der KNN-Prognose an sich zurückzuführen. Die Optionen bieten in dieser Hinsicht ein viel versprechendes und noch wenig erschlossenes Einsatzfeld. Sie weisen starke Abhängigkeit nicht nur von Kursen des Basiswertes direkt, sondern auch von Volatilität, die auch unter Verwendung der klassischen statistischen Methoden ziemlich gut vorhersagbar ist (z.B. mit GARCH-Modellen, vgl. Mills, s. 133-137). Weiterhin, sind alle existierenden Optionspreismodelle höchstens nichtlinear, was den KNN einen Vorteil im Vergleich zu den meistens linear ausgeprägten statistischen Methoden verspricht.
Dieses Teil der Arbeit beschäftigt sich mit 1 - Tages-Prognose der S&P-500-Call-Optionsscheine, die an der Chicago Mercantile Exchange gehandelt werden. Das erste Kapitel beschäftigt sich ausschließlich m it Auswahl und technischer
Vorverarbeitung (Preprossesing) des Datensatzes. Wie wir später sehen werden, ist diese Etappe sehr wichtig wegen der schwächeren Transparenz der Optionsscheine verglichen mit beispielsweise Aktien. Die weiteren zwei Kapitel beschreiben den Aufbau des KNN sowie das Trainieren des Netzes in NeuroSolutions-Umgebung. Im vierten Kapitel wird die Prognosekapazität des Netzes aus der Sicht eines risikofreudigen Investors beurteilt und mit einigen „naiven“ Strategien verglichen.
1
Kurzfristige Prognose der Call-Optionen auf S&P-500-Index mittels KNN
2
1. DATENSATZ UND DATA PREPROCESSING
Der gesamte historische Datensatz wurde der Chicago Mercantile Exchange entnommen 1 und erstreckt sich über ca. 200 Handels tage über den Zeitraum vom 01.01.2001 bis zum 31.10.2001, mit jeweils ca. 250 täglichen Beobachtungen für S&P-Call-Optionsscheine mit verschiedensten Verfallsfrist- und Basispreiskombinationen. Aus den Konsistenzgründen wurde der Datensatz zuerst auf den Zeitraum 01.01.2001 bis 10.11.2001 verkürzt. Wegen der überwältigenden Größe des gesamten verbleibenden Datensatzes (über 40000 Beobachtungen für Call-Optionen) einerseits, und des relativ kurzen Zeitraumes von ca. 170 Handelstage andererseits, mussten pro Tag mehrere Optionen in den endgültigen Datensatz übernommen werden. . Für jeden Handelstag wurden 12 Optionen ausgewählt mit 3 kürzesten Verfallsfristen und mit jeweils vier vom at-the- money-Verhältnis 2 am geringsten entfernten Basispreisen. Dies ist dadurch begründet, dass solche Optionen allgemein viel liquider sind und besser vorhersagbar sind.
Zur strengeren Sicherung der Generalisierung wurde dieser 1524 Beobachtungen lange Datensatz weiterhin in einen Training- und Testing-Datensätze unterteilt. Der Training-Datensatz erfasst den Zeitraum 02.01.2001- 29.06.2001 und wird zum Trainieren des neuronalen Netzwerkes verwendet, der Test-Datensatz erfasst den Zeitraum 02.07.2001-10.09.2001 und wird ausschließlich zur investitionsbezogenen Auswertung der Gütigkeit der Netzwerksprognose verwendet.
Jeder von diesen 2 Datensätzen besteht technisch gesehen aus 12 zusammengeklebten Sequenzen, wobei jede Sequenz den in Frage kommenden Zeitraum vollständig durchläuft. Da die ersten Beobachtungen einer Sequenz nicht von den letzten Beobachtungen der hervorgehenden Sequenz abhängen können, wurden die Datensätze mit einer zusätzlichen Dummy-Variable (IS_NEW im weiteren genannt) versorgt, die identifiziert, ob eine Beobachtung als erste in ihrer Sequenz vorkommt.
Die wenigen Ausreißer (etwa 10 Beobachtungen) wurden durch gültige Werte ersetzt. Die Ausreißer waren vor allem dank der Tatsache vorhanden, dass trotz des o. g. Algorithmus zur Auswahl der Optionen, für einige Tage nur Beobachtungen mit extrem großem in-the-money Verhältnis vorlagen, was sich in extremen Optionspreisen widerspiegelte.
1 siehe FTP-Download-Seite ftp://ftp.cme.com/pub/hist_eod/osytd.zip vgl. auch
http://www.cme.com/prices/historical_ftp_datafiles/prices_historicalftpdatafiles_endofday.cfm
zur Erklärung der einzelnen Felder des Datensatzes.
Im Datensatz fehlen die eigentlichen historischen Werte des Baisiswertes (d.h. des S&P-Indexes). Diese wurden
dem http://finance.yahoo.com/ entnommen
2 Eine Option entspricht dem at-the-money Verhältnis, falls sein Basispreis (strike price) dem aktuellen Wert des
Basiswertes (underlying) (in diesem Falle des S&P-Indexes) gleicht.
2
Kurzfristige Prognose der Call-Optionen auf S&P-500-Index mittels KNN
3
2. AUSWAHL DER VARIABLEN
Als zu prognostizierende Output-Variable wurde der offizielle Optionspreis beim Schließen der Börse (sog. Settle-Price) verwendet.
Bei der Auswahl der Input-Variablen wurde aus folgenden Überlegungen ausgegangen. Zum einen, wurde von vornherein angestrebt, dass das aufzubauende KNN keineswegs ein explizierendes Netzwerk, sondern ein reines prognostizierende Netzwerk sein sollte. Das heißt, alle Input-Variablen, die zur Prognose der Output-Variable des aktuellen Tages verwendet werden, wirklich aus dem Informationsstand des Vortages stammen sollten. Dies wurde auch im Laufe der im Kapitel 1 beschriebenen Auswahl der 12 Optionen pro Handelstag berücksichtigt, und zwar, wurde das at-the-money Verhältnis als Verhältnis zwischen dem heutigen Basispreis und dem gestrigen (nicht heutigen) Basiswert berechnet. Als Ausgangsmenge der Input-Variablen ist die Menge der in der Black-Scholes-Formel entha ltenen explizierenden Variablen vollkommen akzeptabel. Die klassische explizierende Black-Scholes-Formel (vgl. Anhang 1) ist aber kritisch anzusehen. Obwohl sie die Menge der den Optionspreis beeinflussenden Variablen im Großen und Ganzen korrekt definiert, ist sie bei weitem nicht perfekt in der genauen Erfassung der empirischen Abhängigkeiten 3 . Die Menge der in dieser Formel enthaltenen Variablen besteht aus:
- dem aktuellen Preis des Basiswertes (undelying price)
- dem Basispreis (strike price)
- der verbleibenden Zeit bis zum Verfall der Option
- der risikolosen Rendite
- der jährlichen Rendite des Basiswertes
- der annualisierten Volatilität der Rendite des Basiswertes Der Basiswert ist am Vortage noch unbekannt, deswegen kämen nur vergangenen Werte von diesem in Frage, und zwar weil diese den aktuellen Basispreis möglicherweise explizieren können 4 .
Die Black-Scholes-Formel berücksichtigt in Ihrer klassischen Variante nur die vergangene Volatilität, die als konstant betrachtet wird und auf zukünftige Perioden übertragen wird. Dies
3 Dies ist insbesondere für die Abhängigkeit von Basispresises gültig. ( sog. “volatility-smile“-effect, vgl.
http://www.in-the-money.com/presentation/sld104.htm)
4 Dies wäre angesichts der evtl. vorhandenen Autoregressivität in Renditen des Basiswertes möglich. Obwohl
diese meistens in Aktienkursen nicht gefunden werden (was mit Markteffizienz-Annahme vereinbar ist), werden
dabei nur liniare Abhängigkeiten gemeint. KNN können aber bekanntlich dazu verwendet werden, die
nichtliniare Anhängigkeiten aufzuspüren.
3
Arbeit zitieren:
Volodymyr Perederiy, 2002, Aktienkursprognose mit künstlichen neuronalen Netzen: KURZFRISTIGE PROGNOSE DER PREISE VON CALL-OPTIONEN AUF S&P-500-INDEX MITTELS KNN, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Corporate Governance und Signaling: Meldepflichtige Geschäfte nach §15...
Diplomarbeit, 83 Seiten
Neuronale Netze - Implementierung eines Hopfield Netzes in Java
Informatik - Angewandte Informatik
Referat (Ausarbeitung), 13 Seiten
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Volodymyr Perederiy hat den Text Aktienkursprognose mit künstlichen neuronalen Netzen: KURZFRISTIGE PROGNOSE DER PREISE VON CALL-OPTIONEN AUF S&P-500-INDEX MITTELS KNN veröffentlicht
Volodymyr Perederiy hat einen neuen Text hochgeladen
Identifikation von Spam-Mail mit künstlichen neuronalen Netzen
Entwicklung eines Verfahrens
Gerald Weinberger
Support-Vektor-Maschinen und statistische neuronale Netze im Data Mini...
Eine empirische Analyse am Bei...
Ronald Franken
0 Kommentare