Ziel der Arbeit ist es, durch eine spieltheoretische Untersuchung der Putzsymbiose zwischen dem Mondfisch (Mola Mola) und den Putzfischen die Entstehung und Stabilität dieser Symbiose zu erklären. Der Mondfisch taucht in regelmäßigen Abständen an die Wasseroberfläche auf und verharrt in Seitenlage für längere Zeit nahezu bewegungslos. Während er an der Wasseroberfläche ist, befreien Wimpelfische und Kaiserfische ihn von Parasiten, die diesen als Nahrungsquelle dienen. Im Rahmen dieser Arbeit werden Wimpel- und Kaiserfische als Putzfische bezeichnet und es wird nicht zwischen ihnen differenziert, weil sie sich in ihrer Eigenschaft, den Mondfisch zu putzen, nicht unterscheiden.
Gegenstand dieser Arbeit ist, das außergewöhnliche Verhalten des Mondfisches, sich regungslos, todesähnlich an der Wasseroberfläche treiben und von den Putzfischen reinigen zu lassen, mithilfe der Spieltheorie zu erklären, weil die genauen Hintergründe hierfür "noch nicht abschließend geklärt" sind. Um einen Erklärungsansatz zu finden und zu plausibilisieren, wird das Verhalten des Mondfisches sowie die Symbiose und die Handlungsoptionen von Putz- und Mondfischen dargestellt. Sodann wird in die Grundzüge des Spiels eingeführt und es werden die Gleichgewichte in einmaligen und unendlich oft wiederholten Spielen abgeleitet, weil die Putzsymbiose nicht nur einmal durchgeführt wird, sondern ein wiederkehrendes Ereignis ist. Die Putzsymbiose wird als Gefangenendilemma, einer Grundkonstellation der Spieltheorie, beschrieben und als solches in mehreren Schritten analysiert. Schließlich wird mithilfe der Grimm-Trigger-Strategie erklärt, weshalb die Symbiose zustande kommt und stabil ist.
Inhaltsverzeichnis
1. Einleitung
2. Symbiose zwischen Mond- und Putzfischen
2.1. Der Mondfisch
2.2. Parasitärer Befall
2.3. Strategien
3. Einführung in die Spieltheorie
3.1. Definition der Spieltheorie
3.2. Modellierung der Symbiose als Spiel in Normalform
3.3. Nash-Gleichgewicht
3.4. Das Gefangenendilemma
3.5. Modellierung der Symbiose als Gefangenendilemma
4. Wiederholte Spiele
4.1. Folk Theoreme
4.2. Anzeichen des Mondfisches
4.3. Endlich und unendlich oft wiederholte Spiele
4.4. Unendlich oft wiederholtes Spiel mit Diskontierung
4.5. Grim-Trigger-Strategie
4.6. Anwendung der Grim-Trigger-Strategie auf die Symbiose
4.7. Plausibilisierung der Grim-Trigger-Strategie in der Symbiose
5. Fazit
Literaturverzeichnis
Internetverzeichnis
Abbildungsverzeichnis
Anhänge
Anhang 1: Geschichte der Spieltheorie
Anhang 2: Auszahlungsmatrix A
Anhang 3: Auszahlungsmatrix B
Anhang 4: Tabelle von diskontierten Auszahlungen
Anhang 5: Umformung von Gleichung 4 zu 5
Anhang 6: Umformung von Gleichung 5 zu 6
Anhang 7: Wiederholung des Prozedere von den Gleichungen aus den Anhängen 6 und 7 mit der allgemeinen Variable n
Anhang 8: Herleitung von Gleichung 9
Anhang 9: Summenzeichen 3
Anhang 10: Umformung von Gleichung 10 zu Ungleichung 12
Anhang 11: Rechnung mit der Ungleichung 12
Anhang 12: Abkürzungsverzeichnis
Anhang 13: Liste von Gleichungen & Ungleichungen
Anhang 14: Symbol- und Variablenverzeichnis
"To be literate in the modern age, you need to have a general understanding of game theory [...]." Paul A. Samuelson, Nobelpreisträger1
1. Einleitung
Ziel der Projektarbeit ist es, durch eine spieltheoretische Untersuchung der Putzsymbiose zwischen dem Mondfisch (Mola Mola) und den Putzfischen die Entstehung und Stabilität dieser Symbiose zu erklären. Der Mondfisch taucht in regelmäßigen Abständen an die Wasseroberfläche auf und verharrt in Seitenlage für längere Zeit nahezu bewegungslos.2 Während er an der Wasseroberfläche ist, befreien Wimpelfische und Kaiserfische ihn von Parasiten, die diesen als Nahrungsquelle dienen.3 Im Rahmen dieser Arbeit werden Wimpel- und Kaiserfische als Putzfische bezeichnet und es wird nicht zwischen ihnen differenziert, weil sie sich in ihrer Eigenschaft, den Mondfisch zu putzen, nicht unterscheiden.
Gegenstand dieser Projektarbeit ist, das außergewöhnliche Verhalten des Mondfisches, sich regungslos, todesähnlich an der Wasseroberfläche treiben und von den Putzfischen reinigen zu lassen, mit Hilfe der Spieltheorie zu erklären, weil die genauen Hintergründe hierfür „noch nicht abschließend geklärt” sind.4 Um einen Erklärungsansatz zu finden und zu plausibilisieren, werden wir das Verhalten des Mondfisches sowie die Symbiose und die Handlungsoptionen von Putz- und Mondfischen darstellen. Sodann wird in die Grundzüge des Spiels eingeführt und es werden die Gleichgewichte in einmaligen und unendlich oft wiederholten Spielen abgeleitet, weil die Putzsymbiose nicht nur einmal durchgeführt wird, sondern ein wiederkehrendes Ereignis ist. Die Putzsymbiose wird als Gefangenendilemma, einer Grundkonstellation der Spieltheorie, beschrieben und als solches in mehreren Schritten analysiert. Schließlich wird mit Hilfe der Grim-Trigger-Strategie erklärt, weshalb die Symbiose zustande kommt und stabil ist.
Im Ergebnis lässt sich mit einer spieltheoretischen Analyse das eigentümliche Verhalten des Mondfisches schlüssig erklären. Verschiedene Entwicklungsstufen der Spieltheorie, die zur Erklärung der Wirklichkeit fortlaufend verfeinert wurden, werden dabei im Rahmen der Erklärung der Symbiose nachgezeichnet. Die Projektarbeit zeigt so die Leistungsfähigkeit der Spieltheorie, eines sich erst seit dem 20. Jahrhundert entwickelnden Zweiges der Mathematik,5 für die Erklärung biologischer Sachverhalte.
2. Symbiose zwischen Mond- und Putzfischen
2.1. Der Mondfisch
Der bis zu 2,7 m lange und 2,3 t schwere Mondfisch (Mola Mola) ist der schwerste Tele- ostfisch.6 Als Einzelgänger lebt er vorwiegend in der epipelagischen Zone, also einer Zone mit bis zu 200 m Wassertiefe,7 der warmen bis gemäßigten Gewässer. Vor allem die nordamerikanische und westeuropäische Küste sind dicht mit Mondfischen besiedelt.8 Die Lebenserwartung beträgt vermutlich mehr als 20 Jahre.9 Als bevorzugte Nahrungsquelle dienen Quallen, kleinen Fische, Plankton und Algen. In regelmäßigen Abständen taucht der Mondfisch an die Wasseroberfläche auf. Dort lässt er sich in Seitenlage für längere Zeit treiben. Die genauen Hintergründe für dieses Verhalten sind „noch nicht abschließend geklärt”.10
Es wurden bisher zwei Hypothesen aufgestellt: Als erste Hypothese wird angenommen, dass Putzfische die sich auf und in der Haut des Mondfisches befindlichen Parasiten entfernen und er sich dafür in der Nähe der Wasseroberfläche todesähnlich treiben lassen muss.11 Die zweite Hypothese besagt, dass der Mondfisch nach seinen bis zu 600 m tiefen Tauchgängen in die mesopelagische Zone seine stark gefallene Körpertemperatur wieder auf ein normales Niveau regulieren muss.12 In der mesopelagischen Zone steigt der Druck und die Temperatur fällt in der Tiefe beinahe auf den Gefrierpunkt.13 In dieser Arbeit wird die Schlüssigkeit der ersten Hypothese mit Hilfe der Spieltheorie überprüft.
2.2. Parasitärer Befall
Auf und in der Haut des Mondfisches können über 50 verschiedenen Arten von Parasiten leben.14 Bei ausführlicher Untersuchung der Parasiten von mehr als 100 Mondfischen wurde festgestellt, dass mehrzellige Parasiten (metazoan parasites) den Großteil der Parasiten ausmachen.15 Wenn mehrzellige Parasiten ein Wirtstier befallen haben, entziehen diese dem Wirt Nahrung. Darüber hinaus bauen sie Blockaden innerhalb des Gewebes des Wirtes auf und fördern physiologisch schädliche Zustände, die das Verhalten des Wirts negativ beeinflussen.16 Die Entfernung der Parasiten wird von verschiedenen Putzfischarten, den Wimpel- und Kaiserfischen, übernom-men.17 Die Parasiten sind für den Mondfisch zwar nicht lebensbedrohlich, sie stellen aber eine Last für den Mondfisch dar.
Der Mondfisch springt zuweilen aus dem Wasser, um durch die harte Landung auf der Wasseroberfläche die Parasiten in der Haut zu lockern und diejenigen Parasiten, die sich auf der Haut befinden, zum Teil sogar ganz zu entfernen.18 Einerseits kann dadurch die Gesamtzahl der Parasiten am Mondfisch reduziert werden, andererseits wird dadurch die Parasitenentfernung durch die Putzfische deutlich erleichtert.
2.3. Strategien
Die Symbiose zwischen Mondfisch und Putzfischen wird als ein sog. cleaner-client- mutualism (“Putzer-Kunde-Mutualismus") bezeichnet, weil beide Parteien von der Symbiose profitieren.19 Der Mondfisch stellt den Kundenfisch (client) dar, der seinen Parasiten von den Putzfischen entfernen lässt, und die Putzfische (cleaner) erhalten als Beloh-nung Nahrung (die Parasiten).
Gegen die Putzsymbiose spricht, dass die Beteiligten ihre „Abmachung“ nicht unbedingt einhalten müssen. Der Kundenfisch könnte nämlich die Putzfische fressen, nachdem sie ihre Dienste erbracht haben. In ähnlicher Weise könnten die Putzfische auch ihre „Abmachung“ nicht einhalten, indem sie die deutlich schmackhaftere Schleimhaut des Mondfisches fressen. Während des Putzvorganges gibt es also für den Mondfisch und die Putzfische zwei Handlungsmöglichkeiten: Sie können entweder kooperieren oder nicht. Der den Putzfischen überlegenen Mondfisch kann den Putzfischen ermöglichen, die Parasiten aus seiner Haut zu fressen (kooperative Strategie), oder die Putzfische fressen (nicht kooperative Strategie), was eine Mahlzeit ohne großen Aufwand darstellen würde.
Den Putzfischen stehen ebenfalls zwei Handlungsoptionen offen: Sie können entweder in mühseliger und aufwendiger Arbeit die Parasiten aus der Haut des Mondfisches entfernen und so eine hart erarbeitete Mahlzeit erlangen (kooperative Strategie), oder sie können an eine einfache Mahlzeit gelangen, indem sie kleine Teile der nahrhafteren Schleimhaut des Mondfisches herausreißen und diese fressen (nicht kooperative Strategie). Mondfische produzieren eine Schleimschicht, die sie vor Bakterien und UV-Strahlen schützen, und Putzfische fressen lieber diesen Schleim als die Parasiten.20 Die Schleimbisse der Putzfische schaden dem Mondfisch, weil diese zu einer Schwächung seines Schutzsystems führen und seine Anfälligkeit für Infektionen und Hautschäden erhöhen.21
Warum nehmen die Fische also an der Putzsymbiose teil, wenn die Gefahr besteht, dass sie gefressen oder verletzt werden? Diese Frage lässt sich mit Hilfe der Spieltheorie beantworten, indem die Putzsymbiose zwischen Mondfisch und Putzfischen als ein Spiel modelliert wird.
3. Einführung in die Spieltheorie
3.1. Definition eines Spiels
Die Spieltheorie (siehe Geschichte der Spieltheorie, Anhang 2) beschreibt, wie sich einzelne rationale Spieler für Handlungsoptionen entscheiden, wenn der maximal erzielbare Nutzen davon abhängt, wie sich die anderen Spieler entscheiden.22 Im Rahmen der Spieltheorie entwickelt die Mathematik Modelle und beantwortet, welche Handlungsoption für einen rationalen Spieler die beste Entscheidung darstellt.23 Die optimale Entscheidung bietet den größten Nutzen für den Spieler.
Zwar kann man für biologische Sachverhalte nicht generell von Individuen ausgehen, die sich aufgrund einer rationalen Nutzenabwägung für eine Handlungsoption entscheiden, wie es in der neoklassischen Wirtschaftslehre der Fall ist. Allerdings führt die Annahme, dass im Rahmen der Evolution sich Eigenschaften und Verhaltensweisen von Tieren durchsetzen, die ihnen und ihren Nachkommen einen Vorteil an Fitness bieten, zu einem vergleichbaren Ergebnis.24 Es macht nämlich keinen Unterschied, ob sich eine optimale Strategie evolutionär durchsetzt oder sie das Ergebnis einer rationalen Nutzenabwägung ist, weil das jeweilige Ergebnis stets die optimale Strategie ist.
In der formalisierten Darstellung eines Spiels kommt es zunächst darauf an, wie viele Spieler an einem solchen Spiel teilnehmen. Die Definition eines Spiels geht von der Menge der Spieler aus. Dabei gibt n die Gesamtzahl der Spieler an. Die Menge der Spieler wird als N = (1, 2, ..., n) angegeben.25 Ein einzelner Spieler, der Element von N ist, wird mit der Variablen i (i G N) bezeichnet. Bei der Variablen i = 1, 2, ..., n (i G N) steht i = 1 für Spieler 1, i = 2 für Spieler 2 usw. Die Handlungsoptionen, für die sich die einzelnen Spieler entscheiden können, bezeichnet man als die Strategien der einzelnen Spieler. Die einzelne Strategie eines bestimmten Spielers i lautet si.
Wenn in einem Spiel jeder Spieler i eine Strategie si wählt, ergibt sich daraus eine Strategiekombination.26 Die Anzahl der Spieler bestimmt die Anzahl der gewählten Strategien in einer Strategiekombination. Diese Strategiekombination wird dargestellt als s = (s1k, s2k, ..., snk), wobei s1, s2, ..., sn für die jeweiligen Strategien si der Spieler i = 1, 2, n stehen und die Variable k G N für die Strategiewahl des jeweiligen Spielers steht. Die Menge der Strategiewahlen K = (1, 2, n) gibt alle Strategie wählen (Handlungsoptionen) der Spieler an, d.h. es gilt k G K. Alle möglichen Strategiekombinationen der Spieler bilden schließlich zusammen den Strategieraum S. Jede Strategiekombination der Spieler ist Element des Strategieraums der Spieler, d.h. es gilt: s G S. Der Strategieraum von Spieler i wird als Si dargestellt.27
Nachdem eine bestimmte Strategiekombination durch die Strategiewahlen der Spieler entstanden ist, erhält jeder Spieler eine Auszahlung (auch Nutzen), die mit der Variable k dargestellt wird. Die Variable m mit dem Index i steht für die bestimmte Auszahlung eines bestimmten Spielers i. Die Auszahlungsfunktion %i(s) ordnet jedem Spieler i eine bestimmte Auszahlung m zu. Die Auszahlung m des jeweiligen Spielers i hängt von der Strategiekombination s ab.28
Für Spieler i werden alle Mitspieler bzw. Gegenspieler als -i bezeichnet. In einem Spiel mit zwei Spielern würde also Spieler i = 2 den einzigen Gegenspieler -i von Spieler i = 1 darstellen. Die individuelle Auszahlung von Spieler 1 (%x) hängt nicht alleine von seiner eigenen Strategiewahl sik (= s1k), sondern stets auch von der Strategiewahl seines Gegenspielers s-ik (= s2k) ab. Allgemein gilt für die Auszahlung eines Spielers i: Ki (sik, s-ik).29
Die mathematische Definition eines Spiels in Normalform G = (N, S, %) wird bestimmt durch
- die Menge der Spieler N = (1, 2, n),
- den Strategieraum Si, der die Menge aller möglichen Strategiekombinationen s = (stk, s2k, s3k, ..., snk) aus den gewählten Strategien der einzelnen Spieler i angibt, und
- die Auszahlungsfunktionen m (S) = m (s), K2 (s), k? (s), ..., Kn (s) der einzelnen Spieler i bei der Wahl der Strategiekombination aus dem Strategieraum S.30
3.2. Modellierung der Symbiose als Spiel in Normalform
Die Symbiose zwischen dem Mondfisch und den Putzfischen kann als ein Spiel in Normalform G = (N, S, u) dargestellt werden. Zunächst hat das Spiel zwei Spieler: N = (1, 2), wobei Spieler i = 1 die Gesamtheit der Putzfische und Spieler i = 2 den Mondfisch repräsentieren. Die Spieler haben jeweils zwei Strategien zur Verfügung, nämlich zu kooperieren (Strategie 1) oder nicht (Strategie 2). Der Strategieraum Si beider Spieler i besteht aus den folgenden vier Strategiekombinationen: s = (s11, s21), s = (s11, s22), s = (s12, s21), s = (s12, s22). Diese Strategiekombinationen stellen die einzigen vier möglichen Spielausgängen im Spiel dar. Jede Auszahlung der Spieler hängt von den gewählten Strategiekombinationen si im Strategieraum Si ab. Dies bedeutet, dass Spieler 2 also beispielsweise aus der Strategiekombination s = (sn, s22) eine Auszahlung von K2 (sn, s22) erhalten würde.
3.3. Nash-Gleichgewicht
Das in der Spieltheorie am häufigsten verwendete Lösungskonzept für Spiele ist das Nash-Gleichgewicht. Dieses bezeichnet ein Gleichgewicht, in dem kein Spieler seine Strategie einseitig wechselt.31 Nach diesem spieltheoretischen Modell wird ein Spiel von mehreren rationalen Spielern gespielt, die jeweils darauf bedacht sind, die maximale Auszahlung zu erzielen.32
Die beste Antwortstrategie si* aus dem Strategieraum Si vom Spieler i ist die Strategie des Spielers i, die ihm den höchsten Nutzen (oder mindestens gleich hohen Nutzen) bezogen auf die Strategie mit der höchsten Auszahlung des Gegenspielers (s-iD) liefert. Die durch das ’ gekennzeichnete Strategien sf des Spielers i führen zu geringeren (oder gegebenenfalls gleich guten) Auszahlungen als die beste Antwortstrategie si*. Formalisiert ist si* eine beste Antwort, wenn gilt:
Abbildung in dieser Leseprobe nicht enthalten33
Es kommt erst zu einem Nash-Gleichgewicht, wenn in einer bestimmten Strategiekombination die gewählte Strategie jedes Spielers i die beste Antwortstrategie si* auf die jeweiligen besten Antwortstrategien s-i* der anderen Spieler -i ist.34 Für ein Nash-Gleichgewicht gilt somit folgende Bedingung
Abbildung in dieser Leseprobe nicht enthalten35
Bei einem Nash-Gleichgewicht hat kein einzelner Spieler einen Anreiz, von seiner gewählten Strategie abzuweichen, weil er durch eine einseitige Strategieänderung, die von der besten Antwortstrategie abweicht, seine Auszahlung nicht verbessern kann, solange die anderen Spieler an ihrer besten Antwortstrategie festhalten. Daher entsteht ein “eigenstabilisierendes” Gleichgewicht.36
3.4. Das Gefangenendilemma
Das Nash-Gleichgewicht bot insbesondere eine Erklärung für das sogenannte Gefangenendilemma, ein Zwei-Spieler-Spiel, das zu Beginn der 50er Jahre intensiv diskutiert und durch das Nash-Gleichgewicht gelöst worden ist. Dem Gefangenendilemma liegt folgende Entscheidungssituation zu Grunde:37
Zwei Angeklagte einer Tat werden unabhängig voneinander und ohne Absprachemöglichkeit vernommen. Sie stehen vor der Wahl, ob sie die Tat gestehen sollen oder nicht. Der Vernehmungsbeamte ist sich sicher, dass beide die Tat begangen haben, kann dies aber ohne ein Geständnis nicht beweisen und müsste sie wegen minderschwerwiegender Delikte anklagen. Gestehen beide Anklagte nicht, so käme es daher nur zu einer geringen Strafe für beide Angeklagten, z. B. zwei Jahre Freiheitsstrafe. Gesteht ein Angeklagter und der andere nicht, so würde der Geständige weniger hart (z. B. 1 Jahr Freiheitsstrafe), aber der Nicht-Geständige sehr hart (z. B. 5 Jahre Freiheitsstrafe) bestraft werden. Wenn beide Angeklagten gestehen, würden sie jeweils mit einer mittleren Strafe von z. B. 3 Jahren bestraft werden (siehe Anhang 3).38
Das Gefangenendilemma kann als eine strategische Entscheidungssituation zwischen zwei Spielern (den Angeklagten) mathematisch modelliert werden. Für die Menge der Spieler gilt N = (1, 2) und beide Angeklagte haben in diesem Spiel zwei Strategien, weil sie entweder gestehen (Nicht-Kooperation = Strategie 1) oder nicht gestehen (Kooperation = Strategie 2) können.39 Auch wenn sich die Gefangenen nicht absprechen können, käme das „Nicht-Gestehen“ einer Kooperation unter ihnen gleich. Das „Gestehen“ der Tat stellt demgegenüber keine Kooperation unter den Angeklagten dar.
Für die Menge der Strategiewahlen gilt: K = (1, 2) und der Strategieraum Si für Spieler i besteht aus den vier Strategiekombinationen s = (s11, s21), s = (s11, s22), s = (s12, s21) und s = (s12, s22). Kollektiv gesehen profitieren die Spieler am meisten von einer wechselseitigen Kooperation s = (s11, s21), weil sie nach dem obigen Beispiel jeweils eine Strafe von nur zwei Jahren erhalten (reward RA).40 Wenn beide Spieler nicht kooperieren und die Tat gestehen [s = (s12, s22)], werden sie mit einer dreijährigen Freiheitsstrafe (punishment PA) bestraft.41 42 43 Wenn jedoch nur ein Spieler gesteht [entweder s = (s11, s21), oder s = (s12, s21)], so wird dieser vergleichsweise milde bestraft (temptation Ta bzw. “Versuchung, zu verraten”) [2] und gegen den anderen Spieler werden fünf Jahre (sucker ’s payoff Sa bzw. “die Auszahlung des gutgläubigen Opfers”) [3] verhängt. Jeder einzelne Angeklagte, also ein Spieler i des Gefangenendilemmas, ist lediglich daran interessiert, seine individuelle Auszahlung m zu maximieren, die wiederum von der Strategiewahl s-ik seines Gegenspielers abhängt. Dabei besteht die Auszahlung in diesem konkreten Fall immer in einem Schaden, nämlich der Freiheitsstrafe, so dass alle Auszahlungen mit einem negativen Vorzeichen dargestellt werden.
Das Gefangenendilemma ist ein nichtkooperatives Spiel, weil sich die Spieler aufgrund der mangelnden Kommunikation nicht über ihr Aussageverhalten absprechen und keine bindenden Verträge dazu schließen können.44 Für jeden Spieler i liegt zwar eine vollständige Information über die möglichen Strategien si und Auszahlungen des Gegenspielers K-i vor, allerdings fehlt ihnen die Information über die gewählte Strategie des Gegenspielers -i.45 Beide Spieler wollen durch ihre eigene Strategiewahl eine möglichst geringe Freiheitsstrafe erhalten. Die jeweilige Strategiewahl der Spieler müssen simultan getroffen werden.46
In der Auszahlungsmatrix A (siehe Anhang 3) werden die Auszahlungen m der Spieler i dargestellt. Aus dieser Matrix wird ersichtlich, dass beim Gefangenendilemma die folgende Bedingung gelten muss: TA > RA > PA > SA.47 Das tiefgestellte A steht für die Auszahlungsmatrix A und die jeweiligen Buchstaben für die oben eingeführten Begriffe reward R, punishment P, temptation T und sucker’s payoff S. Es handelt sich in jedem Zwei-Spieler-Spiel um ein Gefangendilemma, wenn die Bedingung TA > RA > PA > SA erfüllt ist.48
Des Weiteren ist aus der Auszahlungsmatrix A (siehe Anhang 3) zu erkennen, dass jeder Spieler i mit der zweiten Strategie (Nicht-Kooperation) stets eine höhere Auszahlung erzielt, unabhängig davon, welche Strategiewahl sk vom Gegenspieler -i gespielt wird: %i (si2, s-ik) > %i (sii, s-ik).49 Die nichtkooperative Strategiewahl s2 stellt deswegen die beste Antwortstrategie si* jedes Spielers im Gefangenendilemma dar, weil sie dem Spieler, unabhängig von der Strategiewahl der anderen Spieler, stets den höchsten Gewinn ein- bringt.50
Wenn beide Spieler ihre beste Antwortstrategie s = (s12, s22) spielen, stellt sich ein Nash- Gleichgewicht ein, weil kein Spieler in diesem Zustand einen Anreiz hat, von seiner Strategiewahl sk abzuweichen. Die Bedingung m (si*, s-i*) > m (si’, s-i*) für das Nash-Gleichgewicht wird also erfüllt. In diesem Nash-Gleichgewicht kann die individuelle Auszahlung Ki der Spieler i nicht durch eine einseitige Strategieänderung verbessert wer- den.51 Allerdings entspricht das Nash-Gleichgewicht s = (s12, s22) des Spiels hier nicht der Strategiekombination mit der besten kollektiven Auszahlung. Die Strategiekombination mit der besten kollektiven Auszahlung ist nämlich s = (s11, s21). Die Strategiekombination mit der besten kollektiven Auszahlung wird als pareto-optimal bezeichnet.52 Die Spieler spielen aber nicht die kooperative, pareto-optimale Alternative s = (s11, s21), weil jeder Spieler das Verhalten seines Gegenspielers nicht einschätzen kann. Aus diesem Grund würde kein rational handelnder Spieler die Strategiekombination s = (s11, s21) wählen.
Schließlich ist das Dilemma des Spiels, dass jeder Spieler i die beste Antwortstrategie si2 wählt, obwohl diese zu einem nicht pareto-optimalen Ergebnis führt und die Spieler sich durch eine wechselseitige Kooperation s = (s11, s21) pareto-optimal hätten stellen können. Das Gefangenendilemma ist daher ein klassisches Paradoxon, weil “ein Widerspruch zwischen der individuellen und der kollektiven Rationalität”[53] vorliegt.
3.5. Modellierung der Symbiose als Gefangenendilemma
Die Symbiose zwischen dem Mondfisch und den Putzfischen soll nun als ein Gefangenendilemma, ein spieltheoretisches Modell, modelliert werden. Im Anhang 4 ist die Auszahlungsmatrix B der Symbiose zu finden, in der Auszahlungen der jeweiligen Fische i mit Beispielszahlen für den Strategieraum Si angegeben sind.
Die Symbiose zwischen dem Mondfisch und den Putzfischen gleicht einem Gefangenendilemma, weil es sich um ein Zwei-Spieler-Spiel handelt, in dem die Bedingung TB > RB > PB > SB gilt. Diese Bedingung ist anhand der Auszahlungen in der Auszahlungsmatrix B bezüglich der jeweiligen Strategiekombinationen zu erkennen. Die spezifischen Auszahlungen in der Auszahlungsmatrix B wurden so ausgewählt, dass die Symbiose bestmöglich dargestellt werden kann. Die ausgewählten Beispielzahlen in der Auszahlungsmatrix B sind nicht von großer Bedeutung, weil sie theoretisch frei festgelegt werden können, solange die Bedingung TB > RB > PB > SB erfüllt ist. Ansonsten würde die Annahme nicht einem Gefangenendilemma entsprechen.
In der Symbiose zwischen dem Mondfisch und den Putzfischen ist die Auszahlung, wenn beide Spieler kooperieren (siehe 2.3. Strategien), für die Spieler jeweils positiv, denn sie haben beide einen Vorteil bei einer gegenseitigen Kooperation: m (sn, s21) = 6. Die Putzfische bekommen Nahrung in Form von Parasiten und gleichzeitig wird der Mondfisch von den Parasiten befreit. Somit ist die Auszahlung für beide Spieler positiv; es handelt sich um eine "win-wuT -Situation.
Wenn jedoch nur der Putzfisch nicht kooperiert und der Mondfisch kooperiert, dann kann der Putzfisch seine Auszahlung steigern, indem er die Schleimhaut des Mondfisches frisst, die schmackhafter als die Parasiten ist. In diesem Fall wäre die Auszahlung für die Putzfische größer: %1(sn, s21) = 10. Der Mondfisch erfährt dadurch einen Schaden, weil seine Schleimhaut gefressen wurde, und die Auszahlung würde einen negativen Wert annehmen: K2 (sn, s21) = -5. Deswegen ist bei dieser spezifischen Strategiekombination
s = (s12, s21) die Auszahlung der Putzfische positiv (Gewinn) und die Auszahlung des Mondfisches negativ (Schaden).
Im umgekehrten Fall, in dem der Mondfisch nicht kooperiert und die Putzfische kooperieren, frisst der Mondfisch einen der Putzfische. Der Mondfisch erfährt eine Auszahlungssteigerung [^2 (sii, s22) = 10]. Der Gesamtheit der Putzfische wird geschadet, weil mindestens einer von ihnen gefressen werden würde |^i (sii, s22) = -5].
Wenn beide Spieler nicht kooperieren, ist die Auszahlung für beide Spieler: %i (si2, s22) = 0. In diesem Spezialfall würde keine Symbiose entstehen, weil beide Spieler nicht an einer Kooperation “interessiert” wären.
Auch in diesem Beispiel stellt die nicht-kooperative Strategiewahl si2 die beste Antwortstrategie des Spiels dar, weil jedes Gefangenendilemma ein nicht-kooperatives Spiel ist. Das Nash-Gleichgewicht liegt somit bei der nicht pareto-optimalen Strategiekombination s = (si2, s22), in der alle Spieler ihre beste Antwortstrategie (Nicht-Kooperation) spielen. Jeder Spieler würde also bei dieser Annahme aus dem Spiel eine Auszahlung von %i (si2, s22) = 0 erhalten.
Die Anwendung des Nash-Gleichgewichts würde also zu einem Ergebnis führen, das so in der Natur nicht zu beobachten ist, weil es nicht zu einer Putzsymbiose kommen würde. Daher müssen weitere Aspekte des natürlichen Vorganges in das mathematische Modell einbezogen werden. Dieser weitere Aspekt ist der Umstand, dass es sich nicht um einen einmaligen Vorgang, sondern es sich um ein „wiederholtes Spiel“ handelt, weil sich der Mondfisch immer wieder putzen lässt.
4. Wiederholte Spiele
Da die Symbiose zwischen Mondfisch und den Putzfischen nicht als ein einzelnes Spiel modelliert werden kann, muss in die Überlegungen einbezogen werden, dass es sich um einen wiederholten Vorgang handelt. Ein einzelner Putzdurchgang wird als Stufenspiel G = (N, S, k) definiert und in wiederholten Spielen wird dieses Stufenspiel mehrmals wiederholt, weil jeder Durchgang des Putzspiels dieselbe Spielform besitzt. Das Gesamtspiel besteht aus sog. Teilspielen, die jeweils dieselbe Spielform wie das Stufenspiel besitzen. Ein Teilspiel des Gesamtspiels steht für einen beliebigen Putzdurchgang aller Putzdurchgänge.
Bei einem endlich wiederholten Spiel wird das Stufenspiel über T Perioden wiederholt. T steht für die Anzahl der Perioden. Das Gesamtspiel über T Perioden wird als G (T) definiert.54 Die Variable T gibt die Menge der Perioden an, die ein wiederholtes Spiel besitzt. Es gilt: T = (0, 1, ..., t, ... n), wobei die Anzahl der Perioden durch die Variable n angegeben wird. Die Variable t ist Element der natürlichen Zahlen (t G N) und steht für eine bestimmte Zeitperiode. Das Gesamtspiel G (T) wird entsprechend in n-Teilspiele unterteilt. Bei unendlich oft wiederholten Spielen wird folglich das Gesamtspiel als G (ot) definiert,55 weil die Anzahl der Perioden unendlich ist und das Spiel in unendlich viele Teilspiele unterteilt wird.
4.1. Folk-Theoreme
Die Folk-Theoreme sind eine Gruppe von Theoremen, die Gleichgewichte in wiederholten Spielen erklären.56 Das Folk-Theorem, das hier Anwendung findet, behandelt unendlich oft wiederholte Spiele und wurde 1986 von Fudenberg und Maskin zuerst formu- liert.57 Es besagt, dass sich in unendlich oft wiederholten Spielen Gleichgewichte einstellen können, die vom Nash-Gleichgewicht im Stufenspiel abweichen. Diese abweichenden Gleichgewichte werden als teilspielperfekte Nash-Gleichgewichte bezeichnet und können pareto-optimal sein.58 Die Strategie, die zum teilspielperfekten Nash-Gleichgewicht führt, wird für jeden Spieler i als die beste Strategie, hier die pareto-optimale Strategie,
siB dargestellt.59 Das Nash-Gleichgewicht in einem nicht-kooperativen Ein-Perioden- Spiel ist deshalb häufig ineffizient (nicht pareto-optimal), weil die Gesamtauszahlung beider Spieler nicht maximal ist (z.B. im Gefangenendilemma).60
Laut dem Folk-Theorem ist die Bedingung für das Entstehen eines teilspielperfekten Nash-Gleichgewichtes s = (siB, s-iB), dass jeder Spieler i ausreichende Anzeichen von allen anderen Spielern -i erhält, dass diese Spieler vom Nash-Gleichgewicht im Stufenspiel, also von der besten Antwortstrategie s-i*, abweichen und die pareto-optimale Strategie s-iB spielen werden . 61 Die Anzeichen für diese Abweichung müssen öffentlich und für jeden Spieler zugänglich sein. In der Realität ist dies nur schwer zu erreichen, weil bei einem wiederholten Spiel mit vielen Spielern die Anzeichen weniger öffentlich werden, d.h. sie können möglicherweise nicht jeden Spieler erreichen.62 Eine erfolgreiche Informationsweitergabe durch die Anzeichen ist bei einer großen Anzahl an Spielern deutlich schwerer als bei wenigen Spielern. Die Anzeichen der Abweichung müssen daher kontinuierlich übertragen werden. Ansonsten kann ein teilspielperfektes Nash-Gleichgewicht aufgrund der fehlenden Anzeichen zusammenbrechen, weil Anzeichen beispielsweise bei einem langen Spielverlauf vergessen werden oder aus anderen Gründen nicht ausreichend sind.63
4.2. Anzeichen des Mondfisches
Der Mondfisch signalisiert den Putzfischen durch sein todesähnliches Treiben an der Wasseroberfläche, dass er die Strategie s2i (Kooperation) (siehe Auszahlungsmatrix B, Anhang 4) verfolgt und kooperieren will. Wenn das Spiel jedoch über einen längeren Zeitraum wie bei Mond- und Putzfischen wiederholt wird, können möglicherweise die Signale, die nach dem Folk-Theorem die Bedingung für eine Abweichung vom Nash- Gleichgewicht des Stufenspiels zum teilspielperfekten Nash-Gleichgewicht sind, weniger öffentlich werden. Zwischen den Zusammentreffen der jeweiligen Putz- und Mondfische liegen teilweise erhebliche Zeiträume und Distanzen.
Der Mondfisch kann durch sein Treiben an der Wasseroberfläche den Putzfischen zeigen, dass er kooperiert, und ermöglicht somit einen fast kontinuierlichen Informationsfluss.
[...]
1 Dixit, Nalebuff, Thinking Strategically, Buchempfehlungen.
2 Wikipedia, Mondfisch, Lebensweise.
3 Starfish.
4 Wikipedia, Mondfisch, Lebensweise.
5 Wikipedia, Spieltheorie, Geschichte.
6 Abe, Sekiguchi, Why does the ocean sunfish bask? S. 395.
7 Wikipedia, Pelagic zone, Epipelagic (sunlight).
8 Houghton, Doyle, Davenport, Hays, The ocean sunfish Molamola: insights into distribution, abundance and behavior in the Irish and Celtic Seas, S. 1237.
9 Bowen, ocean sunfish.
10 Wikipedia, Mondfisch, Lebensweise.
11 Abe, Sekiguchi, Why does the ocean sunfish bask? S. 395.
12 Abe, Sekiguchi, Why does the ocean sunfish bask? S. 395; Houghton, Doyle, Davenport, Hays, The ocean sunfish Mola mola: insights into distribution, abundance and behaviour in the Irish and Celtic Seas, S. 1237.
13 Bowen, ocean sunfish; Wikipedia, Tiefsee, Pelagial.
14 Abe, Sekiguchi, Why does the ocean sunfish bask? S. 395.
15 Ahuir-Barja, Raga, Sanchez-Garda, NEW PARASITE RECORDS FROM SUNFISH.
16 Benz, Bullard, Metazoan parasites and associates of chondrichthyans with emphasis on taxa harmful to captive hosts, S. 342 f.
17 Starfish.
18 Phillips, Jumping Giants!
19 Chen, Catherine, How to Keep an Ocean Sunfish Clean.
20 Chen, Catherine, How to Keep an Ocean Sunfish Clean.
21 Chen, Catherine, How to Keep an Ocean Sunfish Clean.
22 Dietze, Strategien im Gefangenendilemma, S. 1.
23 Wikipedia, Spieltheorie.
24 Broom, Rychtar, Game-Theoretical Models in Biology, S. 35.
25 Holler, Illing, Einführung in die Spieltheorie, S. 3; Leininger, Amann, Einführung in die Spieltheorie, S.14.
26 Leininger, Amann, Einführung in die Spieltheorie, S. 14.
27 Leininger, Amann, Einführung in die Spieltheorie, S. 14.
28 Holler, Illing, Einführung in die Spieltheorie, S. 4.
29 Fudenberg, Tirole, Game Theory, S. 4.
30 Leininger, Amann, Einführung in die Spieltheorie, S. 14; Holler, Illing, Einführung in die Spieltheorie, S. 4.
31 Wikipedia, Nash-Gleichgewicht.
32 Holler, Illing, Einführung in die Spieltheorie, S. 10; Leininger, Amann, Einführung in die Spieltheorie, S.21.
33 Leininger, Amann, Einführung in die Spieltheorie, S. 22.
34 Holler, Illing, Einführung in die Spieltheorie, S. 10.
35 Leininger, Amann, Einführung in die Spieltheorie, S. 22.
36 Leininger, Amann, Einführung in die Spieltheorie, S. 21; Vgl. Wikipedia, Nash-Gleichgewicht.; Samuelson, Nordhaus, Volkswirtschaftslehre, S. 306.
37 Dietze, Strategien im Gefangenendilemma, S. 4.
38 Vgl. Leininger, Amann, Einführung in die Spieltheorie, S. 10 ff.
39 Vgl. Dietze, Strategien im Gefangenendilemma, S. 4.
40 Rapoport, Chammah, Orwant, Prisoner's Dilemma, A Study in Conflict and Cooperation, S. 33.
41 Grinberg, Hristova, Lalev, Models for cooperative decisions in Prisoner’s Dilemma, S. 171.
42 Grinberg, Hristova, Lalev, Models for cooperative decisions in Prisoner’s Dilemma, S. 171.
43 Douadia, Sandrine, Gilles, Lisette, Dealing with the aversion to the sucker’s payoff in public goods games, S. 5.
44 Dietze, Strategien im Gefangenendilemma, S. 33.
45 Holler, Illing, Einführung in die Spieltheorie, S. 6.
46 Dietze, Strategien im Gefangenendilemma, S. 33.
47 Rapoport, Index of Cooperation, S. 100.
48 Rapoport, Index of Cooperation, S. 100.
49 Holler, Illing, Einführung in die Spieltheorie, S. 6.
50 Dietze, Strategien im Gefangenendilemma, S. 33.
51 Dietze, Strategien im Gefangenendilemma, S. 33.
52 Wikipedia, Pareto-Optimum.
53 Dietze, Strategien im Gefangenen-Dilemma, S. 5.
54 Holler, Illing, Einführung in die Spieltheorie, S. 135.
55 Holler, Illing, Einführung in die Spieltheorie, S. 135.
56 Wikipedia, Folk-Theorem.
57 Wikipedia, Folk-Theorem, Summary of folk theorems.
58 Gintis, Game Theory Evolving, S. 201; Holler, Illing, Einführung in die Spieltheorie, S. 138.
59 Lohmann, Organisation dauerhafter Kooperation, S. i9.
60 Holler, Illing, Einführung in die Spieltheorie, S. 6.
61 Gintis, Game Theory Evolving, S. 20i.
62 Gintis, Game Theory Evolving, S. 20i.
63 Dilip, Milgrom, Pearce, Information and Timing in Repeated Partnerships, S. i7i4.
-
-
-
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X. -
-
Upload your own papers! Earn money and win an iPhone X.