Name: Kooperation in problematischen sozialen Situationen
Price: 0.99 EUR
Availability: InStock
Author: Peter Ulbrich
ISBN: 978-3-640-00981-7

Excerpt

Inhalt:

1 EINLEITUNG

2 DAS GEFANGENENDILEMMA
2.1 DAS EINFACHE GEFANGENENDILEMMA
2.2 DAS WIEDERHOLTE GEFANGENENDILEMMA

3 KOOPERATION IM ITERIERTEN GEFANGENENDILEMMA
3.1 LEBEN UND LEBEN LASSEN IM STELLUNGSKRIEG
3.2 DAS COMPUTERTURNIER
3.3 BEDINGUNGEN FÜR ERFOLG

4 DAS ITERIERTE N-PERSONEN GEFANGENENDILEMMA
4.1 DIE MÖGLICHKEIT VON KOOPERATION

5 „LARGE-NUMBER DILEMMA“ IN PROBLEMATISCHEN SITUATIONEN
5.1 STABILITÄT
5.2 PROBLEME ENDOGENER SANKTIONIERUNG
5.2.1 Das Problem der Information
5.2.2 Eine Kette von Bestrafungen
5.2.2.1 Fraktionen
5.3 WEITERE EINFLÜSSSE UND EINE ÜBERSICHT
5.4 EIN BEI-SPIEL: HARDIN`S GAME

6 FAZIT

7 LITERATUR

1 Einleitung

Eines der wichtigsten Probleme der Soziologie ist der Frage nach der Entstehung von sozialer Ordnung. Ein wesentlicher Teilaspekt ist die Frage nach der Entstehung von Kooperation zur Bereitstellung kollektiver Güter in größeren Gruppen (Raub/Voss 1981: 186) . Viele Erklärungsansätze sehen diese im „war of man against man“ erst und ausschließlich durch exogene Faktoren, wie den Weberschen „Erzwingungsstab“ möglich. Irgendwer oder irgendetwas von außen muss Kraft seines Einflusses, seiner Macht, Zwang ausüben oder androhen.

Diese Erklärung hat das Manko, dass eben jener Erzwingungsstab auch erst einmal erklärt sein will. Das macht den Ansatz nicht unwichtiger, doch es ergibt sich wiederum die Frage, ob nicht Kooperation auch endogen entstehen kann, aus dem Kreis der mit- und gegeneinander agierenden Akteure heraus.

U.a. dieser Frage widmet sich auch die Spieltheorie. Eines ihrer Spiele, sicher auch das bekannteste, das Gefangenendilemma, modelliert exemplarisch eine Vielzahl von Situationen, in denen Kooperation hilfreich wäre, würde sie nur entstehen, was aber leider nicht ganz unproblematisch ist.

Ich werde zu zeigen versuchen, wann Kooperation unter sich den Rationalitätsannahmen entsprechend verhaltenden Akteuren in diesen Dilemma-Situationen entstehen kann und unter welchen Umständen sie stabil bleibt. Einen weiteren Schwerpunkt bilden die Implikationen, die sich ergeben, wenn das Gefangenendilemma (als typischer Vertreter der sogenannten Harsanyi-Dilemmata) mit mehr als zwei Personen und mit steigenden Gruppengrößen „gespielt“ werden.

2 Das Gefangenendilemma

2.1 Das einfache Gefangenendilemma

Es handelt sich beim Gefangenendilemma (kurz PD, von „prisoner’s dilemma“) um ein Spiel, bei dem rationales Verhalten der Akteure zu einem suboptimalem Ergebnis führt. Es wird von zwei Gefangenen ausgegangen, die gemeinsam ein Verbrechen begingen. Beide wurden gefasst, es gibt aber keine Zeugen für ihre Tat. Sie werden getrennt befragt und haben die Möglichkeit zu schweigen oder zu gestehen. Ferner nimmt man eine Art „Kronzeugenregelung“ an: gesteht A, der andere (B) aber nicht, wird B hoch bestraft, A kommt wegen der Regelung frei. Gestehen beide, werden beide bestraft. Schweigen beide bekommen sie höchstens eine geringen Strafe wegen eines Bagatelldeliktes, das große Verbrechen kann man ihnen nicht nachweisen.

Die Auszahlungsmatrix (in Jahren Gefängnis, dazu in der Klammer als „positive Auszahlung) sieht folgendermaßen aus:

Abbildung in dieser Leseprobe nicht enthalten

Jeder Spieler hat eine dominante Strategie ¹ , d.h. es gibt für ihn nur eine Wahl, die unabhängig von der Wahl des anderen zum besseren Ergebnis führt. Diese Wahl ist die Defektion (im Beispiel: singen, Defektion bedeutet nicht zu kooperieren). Denn wenn der andere Spieler kooperieren sollte, hat man die höchste Auszahlung, wenn er defektiert, immerhin noch etwas. Würde man hingegen kooperieren, besteht die Gefahr, dass der Gegenspieler defektiert und man selbst die niedrigste Auszahlung erhält.

Dies Situation führt also dazu, dass beide Spieler den Rationalitätsannahmen gemäß defektieren, beide 3 Jahre ins Gefängnis müssen, obwohl sie doch nur ein Jahr ins Gefängnis gemusst hätten, hätten sie z.B. eine verbindliche Absprache treffen können. Beide stünden besser da als nach ihren „rationalen“ Entscheidungen.

Eine Verallgemeinerung dieser Auszahlungsmatrix für 2 Spieler (n=2) sieht so aus:

Abbildung in dieser Leseprobe nicht enthalten

T ist die Versuchung (T emptation), den anderen, der kooperiert auszubeuten und bringt die höchste Auszahlung. R ist die Belohnung (R eward) für gegenseitige Kooperation. P ist die Bestrafung (P unishment) für gegenseitige Defektion. S ist die Auszahlung für den, der sich übers Ohr hauen lies (S ucker’s Payoff).

Es handelt sich beim Gefangenendilemma um ein sogenanntes nichtkooperatives Spiel. Die beiden Spieler können sich nicht auf die beste Strategie einigen, da sie nicht miteinander kommunizieren können. Und selbst wenn sie dies könnten, wären sie an ihre Abmachungen nicht gebunden, denn wer wollte sie dazu zwingen? Immer „diktiert“ die Rationalität ein kollektiv irrationales Ergebnis. Jeder wendet seine gewinmaximierende dominante Strategie an und die Auszahlung ist bescheidenes P für beide. In Experimenten (Situationen ohne hohe Kosten) wurde festgestellt, dass sich ein nicht unbedeutender Teil der Akteure gar nicht rational verhält, sondern sein/ihr Verhalten von der rationalsten Lösung zumindest etwas abweicht. Ist also Kooperation möglich?

Wie kommt man aus diesem Dilemma, ohne eine zusätzliche Aktivität, die wieder Bedingungen schafft (neue Anreizstrukturen z.B.), welche das Dilemma auflösen? Eine Variante: indem man es wiederholt.

2.2 Das wiederholte Gefangenendilemma

Da jede Kommunikation ausgeschlossen bzw. wertlos ist (es wird ja per definitionem keine Abmachung garantiert), interagieren die Spieler nur durch ihre „Spielzüge“. Wissen aber beide Spieler, dass (zumindest potenziell) über viele weitere Züge gespielt wird, werden sich auch die Zukunftserwartungen auf ihre Entscheidungen auswirken. Axelrod (2000: 11) sagt,

Die Zukunft kann folglich einen Schatten auf die Gegenwart zurückwerfen.

Will man das Modell auch in die Wirklichkeit übertragen, muss man die Erwartungen für die Zukunft gewichten. Sie zählen weniger als die aktuelle Entscheidung (und ihr Ergebnis), denn

a) die Spieler neigen dazu „Auszahlungen in dem Maße geringer zu bewerten wie der Zeitpunkt ihres Erwerbs in der Zukunft liegt“ (ebd.) und

b) es besteht u.U. zumindest eine gewisse Chance, dass sich die beiden Spieler nicht wieder treffen.

Dafür wird ein Diskontparameter eingeführt. Dieser heißt bei Axelrod (ebd.) z.B. w, bei Werner Raub (1988) ai.

Der „Wert“ einer unendlichen Folge von Auszahlungen bemisst sich dann so (erste Auszahlung

1):

Abbildung in dieser Leseprobe nicht enthalten

Je größer der Diskontparameter w nun ist, umso bedeutsamer ist die Zukunft (umso größer wird der Betrag von [Abbildung in dieser Leseprobe nicht enthalten]. Da die Zukunft weniger Wert ist, muss w kleiner sein als 1, aber größer als 0.

Aber auch wenn die Wahrscheinlichkeit, sich wieder zu treffen oder die erwarteten zukünftigen Auszahlungen sehr groß sind, gibt es trotzdem keine beste Strategie unabhängig von der des Gegners (Theorem 1, Axelrod 2000: 14). Noch immer ist die Frage der Kooperation nicht gelöst. Deswegen erst einmal zu zwei Beispielen.

3 Kooperation im iterierten Gefangenendilemma

3.1 Leben und leben lassen im Stellungskrieg

Dieses Beispiel zeigt, dass Kooperation entstehen kann, wo man es vielleicht am wenigsten erwartet². Schon 1914, im ersten Jahr des ersten Weltkrieges begann an Teilen der Front der Stellungskrieg. Mit immensem Materialaufwand und erschreckend vielen Toten wurde um wenige Meter Land gekämpft. Es ging den Kriegstreibern um eine Zermürbung des Feindes. Die Frage war, wer hält länger durch, denn die Front bewegte sich kaum. Es lagen sich an den einzelnen Frontabschnitte kleinere Einheiten oft für lange Zeit gegenüber. Dabei kam es zu Kooperation zwischen den „Feinden“. Zu bestimmten Tageszeiten wurde z.B. einfach nicht geschossen, bzw. nur in die Luft. Die Soldaten bewegten sich offen hinter ihren Stellungen ohne von der Gegenseite angegriffen zu werden. Offiziere, die etwas derartiges bemerkten waren entsetzt und verwundert zugleich. Es muss zu Abmachungen gekommen sein.

Der einzelne Soldat wusste, „wenn die Deutschen eine vorgeschobene Stellung bombardierten und fünf Engländer töteten, dann tötete eine Salve zur Antwort fünf Deutsche“ (Belton Cobb, in Axelrod 2000: 69). Im Gegensatz zur militärischen Führung, die die gegnerische Seite zermürben wollte, wollten die Soldaten leben oder einfach einmal ihre Ruhe haben. Es entstanden stillschweigende Übereinkünfte zwischen den Mitgliedern der kleinen, sich gegenüberliegenden Einheiten. Für sie war der Krieg nicht wie für die Staaten ein Quasi- Nullsummenspiel (jeder Gewinn des einen bedeutet einen Verlust für den/die anderen), sondern eine Art des Gefangenendilemmas (ebd. 68). Wechselseitiges beschießen brachte beiden Seiten hohe Verluste (P,P), während die illegalen Waffenstillstände beiden Seiten mehr Ruhe und weniger Tote einbrachten (R,R). Hätte jedoch eine Seite einseitig kooperiert, hätte sie große Verluste hinnehmen müssen (S), die andere aber keine(T), dafür bestand keine Anreiz.

Es gilt auch hier T > R > P > S.

Wie ist diese Kooperation entstanden, wie hielt sie sich stabil?

Die ersten Fraternisierungen sind womöglich in Zusammenhang mit Mahlzeiten entstanden, die auf beiden Seiten etwa zur gleichen Zeit eingenommen wurden.³ Es wird berichtet, dass zu bestimmten Zeiten immer (Gefechts-)Ruhe herrschte und sich die Soldaten nach einigen Tagen während dieser Zeiten sorglos verhielten.

Eine andere Möglichkeit für den Beginn offener Waffenruhen ist die Verlängerung von Schlechtwetterperioden, während denen sowieso fast keine Kämpfe möglich waren. Das Verhaltensmuster wurde dann bei besserem Wetter einfach fortgesetzt. Es kam aber auch zu offenen Absprachen. Doch diesen wurde besonders vom Offizierskorps entgegengearbeitet, es gab harte Strafen.

Wie konnte trotzdem Kooperation aufrecht erhalten werden? Ein Schlüssel liegt in der Einsicht, dass die Gegenseite eigene Kooperation belohnen könnte bzw. man selbst Defektion der Gegenseite wieder mit Defektion bestrafen könnte. Denn im Gegensatz zum einfachen Gefangenendilemma wird dieses „Spiel“ wiederholt. Es handelt sich um ein sogenanntes iteriertes Gefangenendilemma. Kennzeichnend ist der Schatten der Zukunft. Die gegenüberliegende Seite weiß um das eigenen Verhalten während der vergangenen Zeit. Sie kann belohnen und betrafen und muss selbst mit Belohnung und Bestrafung rechnen. Eine Bedingung für Stabilität im System „Leben und leben lassen“ war die Provozierbarkeit der Strategien. Wer keine Vergeltung für Provokationen übt, muss damit rechnen ausgebeutet zu werden. Dazu gehörte auch die Demonstration der eigenen Fähigkeiten, z.T. ohne Schaden anzurichten, aber mit der eindeutigen Botschaft, welcher Schaden möglich ist!

3.2 Das Computerturnier

Das Gefangenendilemma ist ein Dilemma, weil es keine optimale Strategie gibt, die immer zu einem kollektiv rationalen Ergebnis führt⁴. Was die beste Strategie ist, hängt immer vom anderen Spieler ab. Das Dilemma kommt auch in der „realen Welt“ vor. Viele Situationen sind im Kern ein Gefangenendilemma. Nicht immer handeln die Akteure strikt rational und spielen die dominante Strategie der Defektion. Im Wettrüsten der Supermächte in der Zeit des kalten Krieges ist u.U. eine Situation der allgemeinen Defektion gegeben. Im Senat der USA hingegen hat sich ein System der Absprachen zwischen Senatoren entwickelt, dass auf Geben und Nehmen im Sinne des Dilemmas beruht.⁵

Axelrod (2000: 26) stellt nun die Frage, wie man das Spiel eigentlich gut spielt. Was kann man tun, um seinen Auszahlung zu maximieren und doch mehr als P (für gegenseitige Defektion) zu bekommen?

Dazu veranstaltete er ein Computerturnier, zu welchem professionelle Spieltheoretiker Programme einsenden sollten, die dann alle gegeneinander und gegen eine Zufallsprogramm spielten. Die Programme sollten die Strategie eines Spielers für das iterierte Dilemmaspiel bestimmen.

Klarer Gewinner in Runde eins war das Programm TIT FOR TAT des Psychologen Anatol Rapoport. Dieses Programm beginnt mit Kooperation und tut danach immer, was der andere Spieler im vorangegangenen Zug getan hat. D.h. es bestraft Defektion mit eigenen Defektion im nächsten Zug und es belohnt Kooperation mit eigener Kooperation.

Die weitere Analyse ergab, dass weder die wissenschaftliche Richtung des Autors, noch die Länge oder Kürze eines Programms ausschlaggebend für seinen Erfolg war, sondern eine Eigenschaft des Programms: die „Freundlichkeit“. Die ersten 8 Plätze im Turnier wurden von freundlichen Regeln belegt, sie erreichten durchschnittlich zwischen 472 und 504 Punkten.⁶ Der beste „unfreundliche“ Teilnehmer kam nur auf 401 Punkte.

Die freundlichen Regeln untereinander erreichten jeweils etwa 600 Punkte, ihre Robustheit musste sich also an den unfreundlichen erweisen. Im Übrigen muss betont werden, dass die freundlichen Regeln nur gewinnen konnten, weil in ausreichendem Maße freundliche Regeln vorhanden waren (in Runde eins 8 von 15) .

Unter ihnen erwies sich noch ein Kriterium als stark erfolgsfördernd: Nachsicht. Wer Defektionen des Gegenspielers wie einige Regeln auf lange oder gar ewig bestraft, hatte am Ende selbst wenig. Unter der achtköpfigen Siegergruppe erreichte die am wenigsten nachsichtige Regel die wenigsten Punkte.

Drei Merkmale scheinen also wichtig für Erfolg: Freundlichkeit (nie zuerst defektieren), Provozierbarkeit (Defektion bestrafen) und Nachsicht (nicht ewige Vergeltung üben). Hinzu kommt vielleicht noch das der Durchschaubarkeit, Einfachheit. TIT FOR TAT war das kürzeste und am wenigsten komplexe der eingesandten Programme.

3.3 Bedingungen für Erfolg

Es gibt keinen eindeutigen „Zwang“ der Rationalität zu einer besseren Strategie als allseitiger Defektion. Axelrod (2000 u.a.) betrachtet die Entstehung der Kooperation daher evolutionär. Bei einem hinreichend großen Schatten der Zukunft entsteht Kooperation u.U. aus der Einsicht, dass der kurzfristige Vorteil der Versuchung T zu klein ist gegenüber der Auszahlung bei allgemeiner Kooperation. Man könnte also sagen, der Spieler wählt eine Strategie anstatt immer vollkommen neu. Vorrausetzung ist aber, dass Kooperation existiert. Dann können freundliche, provozierbare, nach- und durchsichtige Strategien Erfolg haben. Sie können, wie Axelrod (2000: 57ff.) zeigt, auch als Minderheit in Populationen mit allgemeiner Defektion eindringen. Doch müssen die Umstände Kooperation anregen. Bei unendlich langen Spielen mit hinreichend großem Diskontfaktor ist auch die Freundlichkeit kein zu großes Risiko. Der einmalige Versuchungsgewinn für den Gegner (bei eigener Auszahlung S) wird nicht zu sehr ins Gewicht fallen. Der Gegenspieler bekommt nur einen kleinen Vorsprung, kann aber (vorausgesetzt man bestraft dann seine Defektion, spielt provozierbar) den Vorsprung nicht ausbauen und muss, wenn Kooperation nicht wieder entsteht mit den geringen Auszahlungen P zufrieden sein. Mathematisch ausgedrückt lohnt Kooperation wenn:

Abbildung in dieser Leseprobe nicht enthalten

Durch Umformung erhält man

Abbildung in dieser Leseprobe nicht enthalten

Im oben angeführten Modell (die Höhe der Matrix-Auszahlungen ist mit entscheidend) hieße das (5-3)/(5-1) = 0,5. Kooperation lohnt, wenn w für Akteur i größer oder gleich 0.5 ist (wenn zum Beispiel zukünftige Gewinne gleich bewertet werden und die Wahrscheinlichkeit der Wiederholung mindestens 50% beträgt). Das lässt sich leicht nachrechnen. Als Beispiel sei ein Wert unter 0,5 (hier 0.25) eingesetzt. (2) hieße dann 4 ³ 8, was falsch ist. Für einen Wert über 0,5 (hier 0,6) heißt (2): 8,33 ³ 6,5, was wahr ist.

Der Diskontierungsfaktor wi gibt an, für wie wichtig i die Zukunft hält, es ist dies seine subjektive Einschätzung. Kooperation ist sinnvoll, wenn wi größer ist als das Gesamtspeil-w, das aus einer bestimmten Auszahlungsmatrix resultiert. Das in (3) zum Ausdruck kommende Verhältnis ist das von Kosten der Kooperation zu Kosten des Konflikts. Förderlich für Kooperation sind also ein möglichst kleines (T-R) bzw. möglichst großes (T-P).

Der Nachteil von bedingt kooperativen Strategien wie TIT FOR TAT liegt (nicht in der reinen Spielsituation, wo vollständige Information herrscht) u.a. darin, dass u.U. Fehlentscheidungen bzw. Falschverstehen der gegnerischen Züge eine Kette wechselseitiger Defektion auslösen, die nicht zum Ende kommt.

4 Das iterierte n-Personen Gefangenendilemma

Vor allem in Bezug auf das Problem der Bereitstellung kollektiver Güter ist das zwei- Personen-Spiel sehr wirklichkeitsfern, auch wenn man die Zahl der Spiele und die Zahl der Interaktionspartner(-gegner) sehr hoch ansetzt⁷. In sozialen Situationen „spielen“ nämlich oft ganz viele mit- und gegeneinander, die Situation ist nicht mehr nur zweiseitig. Auch im n- Personen-PD, der Generalisierung des einfachen Spiels für eine unbestimmte Anzahl von Personen, wird für die Entstehung von Kooperation immer wieder auf die Bedeutung der Wiederholung verwiesen (z.B.: Olson 1992, zusammenfassend Raub 1988: 322ff.). Der Ausgangspunkt ist das einfache n-Personen-PD-Spiel G:

Man hat die Wahl zwischen (bedingt) kooperativen (s+) und nichtkooperativen (s-) Strategien. Der Nutzen der Kooperation ist größer als der der Defektion:

Abbildung in dieser Leseprobe nicht enthalten

Absolute Rationalität diktiert jedoch auch hier die Defektion. Es kommt zu einem Gleichgewicht mit der allseitigen Auszahlung ui(s-), trotz der Strategiewahlmöglichkeit mit der Auszahlung ui(s+) (Raub 1988: 324).

4.1 Die Möglichkeit von Kooperation

Betrachten wir nun die Auszahlung (U) des Superspiels⁸ G* mit dem eingefügten Diskontierungsfaktor ai (S sei die Superspielstrategie):

Abbildung in dieser Leseprobe nicht enthalten

Raub (1988: 324) findet in dieser Gleichung die Bedeutung der Iteration offensichtlich, die Kommunikation zwischen den Spielern für Kooperation überflüssig machen kann. Bei Existenz von bedingt kooperativen Strategien (aber nur dann!) kann Kooperation die Folge eines Gleichgewichts im Superspiel sein. Raub kommt so zum theorem on cooperative equilibria:

Abbildung in dieser Leseprobe nicht enthalten

Ein Vektor ⁹ Sc = (Sc1,...,Scn) ist ein Gleichgewichtspunkt für G*, wenn

oder allgemein:

Auszahlung der besten Antwort - Nutzen universeller Kooperation Auszahlung der besten Antwort - Nutzen universeller Defektion

[Abbildung in dieser Leseprobe nicht enthalten] ist der Superspieldiskontparameter bei Verwendung bedingt kooperativer Strategien. Die rechte Seite der Gleichungen entspricht der Darstellung am Ende von Kapitel 3.3., hier aber auch für 3 und mehr Personen. Es handelt sich wieder um die Abwägung zwischen Kosten des Konfliktes und Kosten der Kooperation Sie gibt an, wann es sich lohnt bei allgemeiner bedingter Kooperation zu kooperieren. Wenn die Diskontparameter des Akteurs mindestens so groß sind wie der Quotient, kann es zu einem kooperativen Gleichgewicht kommen.

5 „Large-Number Dilemma“ in problematischen Situationen

Ein wesentlicher Einflussfaktor für die Bereitstellung öffentlicher Güter ist auch die Gruppengröße. Welche Auswirkungen hat sie auf das Entstehen von Kooperation und die Bereitstellung kollektiver Güter? Olson (1992) meint, dass eine Gruppe, je größer sie ist, um so weiter davon entfernt sei kollektive Güter optimal bereit zu stellen (Raub 1988: 311). Buchanan stellte fest:

„ individual choice behavior (...) may differ sharply between small groups and large groups ” (nach Raub 1988: 312).

In kleinen Gruppen entstünde eine Moral, die bei steigender Größe von Zweckmäßigkeitsdenken abgelöst würde. Er nennt dieses Problem „Large-Number Dilemma“, das Problem der großen Anzahl (von Akteuren/Spielern).

Diese Dilemma ist kein universelles. Es gibt Beispiele, die es zu bestätigen und andere, die es zu wiederlegen scheinen (ebd. 312ff). Probleme treten z.B. im Bereich Umweltschutz auf, bei der Entscheidung zu Wählen oder nicht, bei der Entstehung von Sozialer Ordnung etc. Als Gegenbeispiele werden der perfekte Markt¹⁰ und Organisationen genannt, die oft kollektive Güter für größere Gruppen bereitstellen, z.B. Gewerkschaften und andere Lobby- Organisationen. Probleme ergeben sich aus der Gruppengröße vorrangig in sowieso problematischen Situationen, wozu (spieltheoretisch analysiert) z.B. auch das Volunteer’s Dilemma von Diekmann (1985, Raub 1988: 346ff.) und andere Chicken-Games gehören.

Zusammenfassend bezeichnet man diese problematischen Spiele, bei denen individuelle Rationalität kollektive Irrationalitäten produziert, auch als Harsanyi-Dilemmas (Raub 1988: 321). Das PD und seine n-Personen-Generalisierungen sind nur die klassischen Beispiele. Die Folgenden Abschnitte geben wesentliche Gleichgewichtserfordernisse und die jeweils damit verbundenen Probleme an. Ich konzentriere mich hier v.a. auf die beiden Punkte endogene Sanktionierung und Stabilitätsanforderungen.

5.1 Stabilität

Eine weitere Bedingung für Kooperation ist die Stabilität. Nach dem Theorem über kooperative Gleichgewichte muss ai größer oder gleich [Abbildung in dieser Leseprobe nicht enthalten] sein. Ist dies für einen Akteur nicht der Fall, hat er keinen Anreiz zu kooperieren, bzw. seine Kooperation von der anderer abhängig zu machen. Die Diskontparameter ai müssen also für alle Spieler größer sein als [Abbildung in dieser Leseprobe nicht enthalten]

(s+). Er drückt die Wahrscheinlichkeit des Wiedersehens aus, also die erwartete Stabilität. Probleme durch Vergrößerung der Gruppengröße entstehen, weil damit wahrscheinlich auch die Heterogenität der Gruppe steigt, die Diskontparameter sich also stark unterscheiden werden. Akteure deren Diskontparameter zu niedrig sind, werden nur kooperieren, wenn auch im Teilspiel ihre beste Antwort¹¹ Kooperation ist. Das ist in Dilemmaspielen in der Regel nicht der Fall, keinesfalls im Gefangenendilemma.

5.2 Probleme endogener Sanktionierung

Zuerst muss man noch einmal betonen, hängt die Möglichkeit von Kooperation und damit die Möglichkeit der effizienten Bereitstellung eines kollektiven Gutes von der Verfügbarkeit bedingter Strategien ab, die kooperieren, wenn sie auf Kooperation treffen. Weiter müssen diese Strategien einen Mechanismus der Sanktionierung beinhalten um so die Iteration des Spieles ihre Wirksamkeit (Schatten der Zukunft) entfalten lassen zu können. Nur drohende Sanktionierung kann die für jedes Teilspiel anstehende Entscheidung zwischen kurzfristigem Ausbeutungsgewinn und langfristiger kooperativer Auszahlung zugunsten der Kooperation ausbalancieren.

Die steigende Zahl von Akteuren kann die Effektivität solcher Sanktionsmechanismen auf verschiedene Art und Weise beeinflussen.

5.2.1 Das Problem der Information

Informationsprobleme: Jeder Akteur muss, weil er strategisch handelt, in der Lage sein perfekte Informationen über alle Züge aller anderen Spieler zu erhalten, denn daraus leitet er sein zukünftiges Verhalten ab. Jeder Akteur muss die Defektionen der anderen registrieren; es darf nicht die Möglichkeit geheimer Defektion geben. Mit steigender Gruppengröße sinken aber die Fähigkeiten der Akteure „den Überblick zu behalten“ („decreasing monitoring opportunities“, Raub 1988: 334). Im Falle zweiseitiger Interaktionen ist bei steigender Teilnehmeranzahl auch die Wahrscheinlichkeit des Wiedertreffens geringer, ebenso Frequenz der Interaktion und damit die gegenseitige Wahrnehmbarkeit und Differenzierbarkeit. Akteure erwarten in großen Gruppen auch weniger Reaktionen auf eigenes Defektieren, denn „einer mehr oder weniger, das fällt doch nicht auf“. Das Trittbrettfahrer(free rider)-Problem verstärkt sich.

5.2.2 Eine Kette von Bestrafungen

TIT FOR TAT kann nach dem Theorem über kooperative Gleichgewichte bei Verwendung bedingt kooperativer Strategien zu einem Gleichgewichtspunkt führen. Diese Situation ist aber sehr fragil. Würde nur einer der Spieler defektieren, müsste er im nächsten Zug mit allseitiger Bestrafung rechnen, die aber nicht nur den Abweichenden, sondern alle gleichermaßen träfe. Sofort wäre die Kette wechselseitiger Defektion in Gang gesetzt, alle Spieler bestrafen sich nun gegenseitig. Dem Defekteur ist es nun, wie allen anderen Einzelspielern auch, nicht mehr möglich Kooperation zu initiieren¹², denn ein kooperativ Spielender kann nicht in eine Population mit allgemeiner Defektion eindringen, er würde ausgebeutet werden (vgl. Raub 1988: 329). Problematisch ist v.a. das auch Fehler und Fehlinterpretationen von Handlungen anderer Spieler diesen Mechanismus auslösen können.

Es gibt aber einen möglichen Ausweg, denn warum sollte TIT FOR TAT, die in diadischen Interaktionen erfolgreiche Strategie, auch im n-Personenspiel eine gute Wahl sein? Schüßler (1990: 48) weist mit Bezug auf Taylor (1976) darauf hin, dass in großen Gruppen nur schwerlich alle Akteure das Verhalten aller anderen verfolgen können und sich deswegen auf ein Aggregat beziehen.

5.2.2.1 Fraktionen

Der Spieler, der sich auf ein Aggregat bezieht, entscheidet sich nicht bei einer Defektion für die Bestrafung, sondern wenn das Kooperationsniveau seine Auszahlungen unter eine subjektiv bestimmte Grenze senkt. Es gibt im einfachsten Spiel (mit der Wahl zwischen bedingt kooperativen und defektierenden Strategien) zwei Fraktionen, die jeweils eine der Strategien verfolgen. Erst wenn sich einmal weniger Spieler kooperativ verhalten haben als nötig und damit das Ertragsniveau für i unter die selbstgesetzte Grenze fällt, wird Spieler i auch defektieren.

Doch auch diese „Lösung“ ist sehr problematisch. Der Anreiz, nicht zu kooperieren besteht, solange mehr Spieler kooperieren als nötig sind um das Kooperationsniveau nicht zu unterschreiten. Jeder hat aber einen Anreiz zu defektieren und wird dies eventuell in der Hoffnung tun, der einzige zu sein, so dass das Kooperationsniveau nicht unterschritten wird. Stabil wäre das Spiel nur, wenn genau so viele Spieler kooperierten, wie nötig sind, um das Kooperationsniveau zu halten. Denn jeder potenzielle Defekteur wird nun in Erwartung künftiger Auszahlungen nicht defektieren. Er weiß, würde nur einer defektieren, bräche in diesem Fall die Kooperation zusammen, alle hätten erhebliche Einbußen. Auch hier gibt es leider keine generalisierbare Strategie die individuell rational und kollektiv erfolgreich ist. Es bleibt eben ein Gefangenendilemma!

Schüßler (1990: 49) zieht nach diesen Ausführungen den Schluss, dass damit die Möglichkeit von Kooperation unter Egoisten prinzipiell bewiesen wäre. Dies erscheint mir fragwürdig, da auch nicht geklärt ist, wie die rationalen Egoisten die bedingt kooperativen Strategien entwickeln.

Auch er bezweifelt den „Lösungs-Charakter“ dieser Analyse des n-Personen-PD, jedoch v.a. aufgrund der Tatsache, dass die Kooperationsniveaus der Akteure kaum identisch sein werden und ein Gleichgewicht (durch Identisch-Machen der Niveaus) nicht ohne Koordinierung entstehen kann. Die Wahrscheinlichkeit, dass es sich zufällig bildet, ist in großen Gruppen sehr gering. Eine andere Variante, die aber die Bedingungen ändert ist das PD mit Exit- (Ausschluss-) Option (vgl. Schüßler 1990: 52ff.)

5.3 Weitere Einflüssse und eine Ü bersicht

Neben den Problemen der endogenen Sanktionierung und der Stabilität verweist Raub noch auf andere Bedingungen von Kooperation, die durch die Gruppengröße beeinflusst werden können. Dazu gehört die Stärke der Interdependenzen, die aus dem Verhältnis von Kooperations- und Konfliktkosten entspringt. Die Versuchung zu defektieren kann sich mit steigender Gruppengröße (nach oben oder unten) verändern, je nachdem, ob die Gruppengröße stärker die Kosten der Kooperation oder die des Konfliktes beeinflusst (Raub 1988: 339). Außerdem besteht eben nicht nur das so effiziente kooperative Gleichgewicht sondern eventuell auch andere, beim Gefangenendilema z.B. das allseitiger Defektion. Es kann zu Handlungs- und Strategiekoordinierungsproblemen kommen. Auch steige möglicherweise die Kosten der Organisation.

All diese Faktoren gehen in Raubs Übersicht über „Gruppengröße und Bedingungen für Kooperation“ (Raub 1988: 354) ein. Sie bezieht sich aber auch auf alle Harsanyi-Dilemmata, nicht nur auf das PD.

Diese sieht wie folgt aus: Kooperation ermöglicht Effizienz. Wichtig für Kooperation ist 1) endogene Sanktionierung, 2) Erwartete Stabilität, 3) die Stärke der Interdependenz und die Kosten der Kooperation vs. Kosten des Konflikts und 4) die „coorientation“ (das zuletzt geschilderte Problem wegen der Existenz verschiedener Gleichgewichte).

1) wird beeinflusst durch Information und Effekte der Sanktionen, 2) durch die mögliche und wahrscheinliche Verschiedenheit der Diskontparameter, 3) durch die von Spiel zu Spiel und mit Gruppengröße variierenden Auszahlungsfunktionen und 4) durch Handlungs- und Koordinatonsprobleme.

5.4 Ein Bei-Spiel: Hardin`s Game

Diese Spiel stammt von R. Hardin und wird in Raub (1988: 341f.) beschrieben. Es handelt sich um ein n-Personen-PD. Jeder Akteur muss sich entscheiden, ob er zur Produktion des kollektiven Gutes beiträgt. Das Gut ist unteilbar und absolut nicht exklusiv, jede Einheit des Gutes kann, wenn sie einmal produziert ist, von allen Akteuren in gleichem Maße konsumiert werden. Ein Akteur, der nichts beisteuert, kann also die selbe Menge konsumieren wie alle anderen. Es gibt kooperative Strategien c (der Akteur stellt eine Einheit bereit) und defektive d (er stellt nichts bereit). Die Variable r (ich nenne sie hier Nutzenfaktor) gibt an, wieviel Nutzen aus einer produzierten Einheit gewonnen wird, also wieviele Einheiten für eine produzierte bereitgestellt werden. M ist die Zahl der anderen Kooperierenden, n die Gesamtzahl der Spieler. Daraus ergibt sich als Auszahlung für einen Kooperateur:

Abbildung in dieser Leseprobe nicht enthalten

(Nutzenfaktor mal Anzahl der Kooperierenden durch Gesamtzahl, minus Kosten der Bereitstellung einer Einheit, hier 1), und für einen Defekteur:

Abbildung in dieser Leseprobe nicht enthalten

Die Auszahlungsfunktionen heißen c(m) für einen Akteur, der (mit m anderen Akteuren) kooperiert, d(m) für einen Akteur, wenn nur m Spieler kooperieren:

Abbildung in dieser Leseprobe nicht enthalten

Als Anreiz zur Kooperation muss r größer sein als 1 (die Kosten der Bereitstellung).

Nehmen wir nun an Hardin’s Game sei Teilspiel eines Superspiels mit bedingt kooperativen Strategien[Abbildung in dieser Leseprobe nicht enthalten], solange wie alle anderen Akteure j auch kooperieren. Abweichen von c bewirkt hingegen eine Bestrafung, also [Abbildung in dieser Leseprobe nicht enthalten]im nächsten Zug. Nun zur Analyse der „Versuchung“ zu defektieren [Abbildung in dieser Leseprobe nicht enthalten](s+).

Wie im Kapitel 3.3 und 4.1 gezeigt, berechnet sich diese aus dem Quotienten

Auszahlung der besten Antwort - Nutzen universeller Kooperation Auszahlung der besten Antwort - Nutzen universeller Defektion bzw.:

Abbildung in dieser Leseprobe nicht enthalten

Die beste Antwort ist d(n-1)¹³ = r(n-1)/n, der Nutzen universeller Kooperation ist[Abbildung in dieser Leseprobe nicht enthalten] Der Nutzen allgemeiner Defektion [Abbildung in dieser Leseprobe nicht enthalten¹⁴ ].

Die Formel lautet also:

Abbildung in dieser Leseprobe nicht enthalten

Die erste Ableitung in Abhängigkeit von n lautet: d[Abbildung in dieser Leseprobe nicht enthalten]

Das bedeutet, dass [Abbildung in dieser Leseprobe nicht enthalten] mit steigenden n stetig größer wird, steigende Gruppengröße die Versuchung zu defektieren erhöht.

Man beachte, dass [Abbildung in dieser Leseprobe nicht enthalten]für [Abbildung in dieser Leseprobe nicht enthalten] ist. [Abbildung in dieser Leseprobe nicht enthalten] tendiert gegen [Abbildung in dieser Leseprobe nicht enthalten] für [Abbildung in dieser Leseprobe nicht enthalten]. Die Versuchung wächst mit steigender Gruppengröße weiter, bleibt aber kleiner als [Abbildung in dieser Leseprobe nicht enthalten]. Das bedeutet, dass bei entsprechenden individuellen Diskontparametern bedingte Kooperation trotzdem möglich bleibt.

6 Fazit

Ich habe zu zeigen versucht, wie aus spieltheoretischer Sicht die Möglichkeit von Kooperation als Basis für die Bereitstellung kollektiver Güter zu erklären versucht wird. Das Gefangenendilemma als ein klassisches und bekanntes Beispiel aus der Klasse der sogenannten Harsanyi-Dilemmata diente zur Explikation. Im 2-Personen-Spiel diente Robert Axelrods „Evolution der Kooperation“ als Grundlage. Er ist prinzipiell von der Möglichkeit von Kooperation unter Egoisten überzeugt, setzt jedoch nicht zwingend rationale Akteure voraus (Axelrod 2000: 16). Wichtig für erfolgreiche Kooperation sind Strategien, die 4 Eigenschaften erfüllen: Freundlichkeit, Provozierbarkeit, Nachsicht und Durchsichtigkeit. Andere Autoren stellen die Frage nach der Kooperation auch für umfangreichere Interaktionen und modellieren generalisierte n-Personen-Spiele. Auch hier wird die Möglichkeit von Kooperation bei Vorhandensein bedingter Strategien nachgewiesen, allerdings unter der expliziten Voraussetzung rational handelnder Akteure (z.B. Raub 1988, Schüßler 1990). Trotzdem sind wir wieder bei der Eingangsfrage. Wenn auch kein „Erzwingungsstab“ nötig sein sollte um unter Egoisten Kooperation zu einem Gleichgewicht führen zu lassen, bleibt doch die Frage offen, wo die bedingt kooperativen Strategien herkommen.

Dass diese zu einem Gleichgewicht führen können, reicht als Erklärung nicht aus, da ja im Gefangenendilemma auch immer noch die dominante Strategie im Teilspiel die Defektion bleibt, welche auch zu einem anderen als dem kooperativen Gleichgewicht führt. Wenn man nun noch die Probleme der steigenden Gruppengröße (large-number dilemma) einbezieht, ist der Boden für die Annahme, Kooperation entstehe endogen aus dem rationalen Handeln von Egoisten zumindest nicht der allerfesteste¹⁵. Zumindest ist eine Theorie über die „Evolution der Kooperation“ nötig, die erklärt, wann es warum und wie dazu gekommen ist, dass Kooperation begann und sich dann teilweise als erfolgreich auch etabliert hat. Die spieltheoretische Modellierung legt die Vermutung nahe, dass es dann unter bestimmten Umständen funktionieren müsste.

7 Literatur

Axelrod, Robert (2000): Die Evolution der Kooperation, Übersetzt und mit einem Nachwort von Werner Raub und Thomas Voss, München: Oldenbourg

Davis, Morton D. (1993): Spieltheorie für Nichtmathematiker, Mit einem Vorwort von Oskar Morgenstern, 2.üb. Aufl., München: Oldenbourg

Diekmann, Andreas (1985): Volunteer’s Dilemma, in: Journal of Conflict Resolution 29, 605

- 610

Dixit, Avinash K. und Barry J. Nalebuff (1995): Spieltheorie für Einsteiger. Strategisches Know-how für Gewinner

Erhardt, Karl-Martin (1997): Kollektivgutspiele in diskreter und stetiger Zeit. Theorie und Experimente, Karlsruhe

Olson, Mancour (1992, zuerst 1968): Die Logik des kollektiven Handelns: Kollektivgüter und die Theorie der Gruppen, Tübingen: Mohr

Raub, Werner (1988): Problematic social situations and the „large-number dilemma“. Game- theoretical analysis, in: Journal of Mathematical Sociology 13(4): 311-357

Raub, Werner und Thoma Voss (1981): Individuelles Handeln und gesellschaftliche Folgen. Das individualistische Programm in den Sozialwissenschaften, Darmstadt: Luchterhand

Sch üß ler, Rudolf (1990): Kooperation unter Egoisten: Vier Dilemmata, München:

Oldenbourg

Taylor, M. (1976): Anarchy and Cooperation, London: Wiley (zit. nach Schüßler 1990)

[...]

¹ Strategien sind Entscheidungsregeln, Richtlinien, die angeben, was in jeder im Spiel möglichen Situation getan wird.

² Die folgenden Ausführungen beziehen sich in wesentlichen auf Axelrod (2000: 65-79). Zur Kritik siehe Schüßler (1990: 26ff.).

³ Vgl. „The War The Infantry Knew“ in ebd. 70.

⁴ Beschreibung nach Axelrod (2000: 25-49), Kritisches dazu in Dixit/Nalebuff (1995: 106ff)

⁵ Vgl. zu diesem und anderen Beispielen u.a. Axe lrod (2000: 4f.).

⁶ bei 200 gespielten Runden und der bekannten Auszahlungsmatrix (die ich auch für die allgemeine Darstellung des Gefangenendilemmasam Anfang dieser Arbeit verwendet habe) ergab eine mögliche Höchstzahl von 1000 Punkten, bei gegenseitiger Kooperation 600, bei gegenseitiger Defektion 200 und bei totaler Ausbeutung 0.

⁷ Die folgenden Formeln orientieren sich n der Darstellung von Raub (1988). Sie gelten nicht nur für das Gefangenendilemma, sondern sind Generalisierungen für alle Harsanyi-Dilemmata. Deswegen ist die Notation etwas komplizierter.

⁸ Superspiel heißt das iterierte, immer wieder wiederholte Spiel.

⁹ Vektor = Strategiekombination, c steht für kooperativ (cooperative).

¹⁰ Wobei ich mir zu fragen erlaube, wo es diesen geben soll!

¹¹ Beste Antwort heißt die eigene gewinnmaximierende Wahl bei festliegenden Strategien der anderen Spieler.

¹² Anders im 2-Personen-Spiel bei Verwendung von TIT FOR TAT. Hier reicht einmaliges kooperierendes Verhalten des Defekteurs um sein Gegenüber wieder zu Kooperation zu “bewegen“.

¹³ „c(n-1)“ wegen der Definition der Auszahlungsfunktion c(m). Es bedeutet aber vollständige Kooperation inklusive Akteur i. Die Funktionen werden in Abhängigkeit von m angegeben, weil m im wesentlichen die Auszahlungshöhe bestimmt.

¹⁴ Die Auszahlung wenn 0 Akteure kooperieren: d(m) bei m=0.

Häufig gestellte Fragen

Was ist das Gefangenendilemma und wie funktioniert es?

Das Gefangenendilemma (PD) ist ein spieltheoretisches Modell, das eine Situation beschreibt, in der rationales Verhalten der Beteiligten zu einem suboptimalen Ergebnis führt. Zwei Gefangene, die gemeinsam ein Verbrechen begangen haben, werden getrennt befragt. Sie können gestehen oder schweigen. Wenn einer gesteht und der andere schweigt, kommt der Geständige frei, während der Schweigende hoch bestraft wird. Gestehen beide, werden beide bestraft. Schweigen beide, erhalten sie nur eine geringe Strafe. Die dominante Strategie für beide ist zu gestehen (Defektion), was zu einem schlechteren Ergebnis führt, als wenn beide geschwiegen hätten (Kooperation).

Was ist das iterierte Gefangenendilemma und warum ist es wichtig?

Das iterierte Gefangenendilemma ist eine wiederholte Version des einfachen Gefangenendilemmas. Da die Spieler wissen, dass sie mehrfach interagieren werden, können ihre Entscheidungen durch die Erwartungen an zukünftige Interaktionen beeinflusst werden. Dies eröffnet die Möglichkeit für Kooperation, da die Spieler Defektion bestrafen und Kooperation belohnen können.

Wie kann Kooperation im iterierten Gefangenendilemma entstehen?

Kooperation kann im iterierten Gefangenendilemma entstehen, wenn die Spieler eine Strategie verfolgen, die auf Gegenseitigkeit basiert, wie z.B. "Tit for Tat". Diese Strategie beginnt mit Kooperation und spiegelt dann die vorherige Aktion des anderen Spielers wider. Freundlichkeit (nie zuerst defektieren), Provozierbarkeit (Defektion bestrafen) und Nachsicht (nicht ewige Vergeltung üben) sind wichtige Eigenschaften für erfolgreiche Strategien.

Was ist der Diskontparameter und welche Rolle spielt er bei der Kooperation?

Der Diskontparameter (w oder ai) gewichtet die Bedeutung zukünftiger Auszahlungen im Vergleich zu gegenwärtigen. Ein höherer Diskontparameter bedeutet, dass die Zukunft wichtiger ist und die Spieler eher zu Kooperation bereit sind, da sie die langfristigen Vorteile berücksichtigen. Kooperation ist sinnvoll, wenn der Diskontparameter groß genug ist, um die kurzfristige Versuchung der Defektion auszugleichen.

Was ist das n-Personen-Gefangenendilemma und wie unterscheidet es sich vom 2-Personen-Spiel?

Das n-Personen-Gefangenendilemma ist eine Verallgemeinerung des einfachen Spiels für eine unbestimmte Anzahl von Personen. Es modelliert Situationen, in denen viele Akteure miteinander interagieren und die Bereitstellung kollektiver Güter betroffen ist. Auch hier diktiert die Rationalität die Defektion, es sei denn es wird kooperiert.

Was ist das "Large-Number Dilemma" und wie beeinflusst es die Kooperation?

Das "Large-Number Dilemma" beschreibt die Schwierigkeit, in großen Gruppen Kooperation zu erreichen und kollektive Güter bereitzustellen. Mit zunehmender Gruppengröße sinken die Möglichkeiten zur Überwachung, die Heterogenität der Gruppe nimmt zu und das Trittbrettfahrerproblem verstärkt sich.

Welche Probleme ergeben sich bei der endogenen Sanktionierung in großen Gruppen?

In großen Gruppen wird es schwieriger, Defektionen zu erkennen und zu bestrafen (Informationsproblem). Zudem kann eine Kette wechselseitiger Bestrafung ausgelöst werden, wenn ein Spieler defektiert. Dies wird noch verstärkt, weil es auch Fehler gibt und Handlungen falsch interpretiert werden.

Was ist Hardin's Game und was zeigt es über die Kooperation in großen Gruppen?

Hardin's Game ist ein n-Personen-Gefangenendilemma, bei dem sich jeder Akteur entscheiden muss, ob er zur Produktion eines kollektiven Gutes beiträgt. Die Analyse zeigt, dass die Versuchung zur Defektion mit steigender Gruppengröße zunimmt, was die Kooperation erschwert.

Was sind die wichtigsten Bedingungen für Kooperation gemäß der Analyse?

Die wichtigsten Bedingungen für Kooperation sind endogene Sanktionierung, erwartete Stabilität, die Stärke der Interdependenz (Verhältnis von Kooperations- und Konfliktkosten) und die "coorientation" (die Möglichkeit, ein gemeinsames Gleichgewicht zu finden).

Excerpt out of 20 pages - scroll top

Buy now

Title: Kooperation in problematischen sozialen Situationen

Term Paper , 2000 , 20 Pages

Autor:in: Peter Ulbrich (Author)

Sociology - Individual, Groups, Society

Look inside the ebook

Details

Title: Kooperation in problematischen sozialen Situationen
Author: Peter Ulbrich (Author)
Publication Year: 2000
Pages: 20
Catalog Number: V102601
ISBN (eBook): 9783640009817
Language: German
Tags: Kooperation Situationen
Product Safety: GRIN Publishing GmbH

Quote paper: Peter Ulbrich (Author), 2000, Kooperation in problematischen sozialen Situationen, Munich, GRIN Verlag, https://www.grin.com/document/102601