Zusammenfassung
Research conducted and published by sociologists, psychologists as well as experimental microeconomists has repeatedly highlighted that the common assumption of rational individuals in most of the existing literature of game theory is only a rough approximation to reality at best if not doubtful. With full rationality being a cornerstone, the discipline has found itself in a dilemma situation. As early as 1955, Simon had consequently created the term bounded rationality and called for modied model assumptions. However, his call has been largely unheard until 1996. Ernst-Ludwig von Thadden's paper Optimal pricing against a simple learning rule was one step on the way for more research focussing on the agents' lack of full rationality. This paper intends to provide rstly a short summary of the development of game theory research with a clear focus on bounded rationality. Secondly, it presents the core assumptions and key take-aways of Ernst-Ludwig von Thadden's paper Optimal Pricing against a simple learning rule.
Ernst-Ludwig von Thadden prime assumption is a non-strategic strategic buyer, in other words a buyer which updates his beliefs ac-cording to a simple learning rule. This non-strategic behaviour reects Simon's call to assume a bounded rationality when modelling the agents' behaviour. Thadden's research shows - derived using a repeated buyer-seller relationship under asymmetric information - that the strategically acting seller can not benet from this situation in terms of extract a supernormal price. On average, the seller extracts only the buyer's mean utility u.
2
Inhaltsverzeichnis
1 Einleitung 4
2 Spieltheoretischer Überblick 5
2.1 Grundproblem von Märkten mit asymmetrischen Informationen 5
2.2 Problemlösungsmöglichkeiten 6
2.3 Neue spieltheoretische Annahmen 6
3 Optimal Pricing against a Simple Learning Rule 9
3.1 Modellaufbau 9
3.2 Modellablauf 10
3.3 Lernregel des Käufers 11
3.4 Fall ohne Abzinsung 12
3.5 Fall mit Abzinsung 15
3.6 Alternative Lernregeln 16
4 Schluÿbemerkung 17
3
1 Einleitung
Die neue Not der Kunden - so lautete die Überschrift eines ZEIT Artikels vom 31.Oktober 2007. Der Artikel beschreibt die zunehmende Verzweiung der Verbraucher bei der Fülle an Produkten, Techniken und Tarifen mit
1
denen Tag für Tag die Verbraucher konfrontiert werden.
Liberalisierung, Globalisierung und technischer Fortschritt bringen Deutschlands Verbrauchern mehr Freiheiten als je zuvor. Nie aber war es so anstrengend, die richtige Wahl zu treen. . . .
Verbraucherforscher wie die Professorin Lucia Reisch aus Calw bei Stuttgart halten deshalb nicht den mündigen Verbraucher
für typisch, sondern den condent consumer, den vertrauensvollen Konsumenten. Er hat weniger Zeit für die Informationssuche und vertraut deshalb etablierten Marken, bleibt bei bewährten Konsumgewohnheiten oder kauft einfach das Gleiche wie Freunde oder Angehörige.
Jeder von uns kennt das eben geschilderte Szenario aus eigener Erfahrung und weiÿ, dass man aufgrund von mangelndem Wissen, Möglichkeiten oder Zeit manchmal keine optimalen Entscheidungen trit und ganz sicher nicht dem theoretischen Modell des Homo Oeconomicus entspricht. Dieser Homo Oeconomicus wird in Gablers Wirtschaftslexikon beschrieben, als ein Mensch, der
seine Handlungen allein auf der Basis der ihm vorliegenden In-formationen rational ausrichtet und seine Entscheidungen nach dem ökonomischen Prinzip zur Maximierung seines persönlichen Nutzens trit.
Wenn man jedoch die spieltheoretische Forschung der letzten Jahrzehnte betrachtet, so ndet man fast nur Forschung über rational und strategisch agierende Spieler. Beispielsweise liest man im Preface des Spieltheoriebuches A Primer in Game Theory, von Gibbons, Robert (1992):
we will discuss (in this book) four classes of games: static games of complete information, dynamic games of complete information, 1 Ein Aussage, die sich auch bei Gross (1994) nden lässt.
4
static games of incomplete information, and dynamic games of incomplete information.
Die Forschung der letzten Jahrzehnte hat sich fast ausschlieÿlich mit der Auswirkung von unterschiedlicher Informationsverteilung auf das Verhalten der Akteure beschäftigt, jedoch nur selten die Grundannahmen dieser Forschung in Frage gestellt. Das Element der Irrationalität des Spielers wurde nur in den seltensten Fällen berücksichtigt. So können die in dieser Zeit entwickelten Modelle und Methoden keine Vorhersagen für den oben beschriebe-
nen condent consumer machen, denn ein Spieler, der nicht-rational oder nicht-strategisch handelt, ist in diesen Modellen nicht vorgesehen. Ich möchte nun in meiner folgenden Arbeit einen kurzen Überblick der spieltheoretischen Forschung auf Märkten mit asymmetrischer Information
geben und daran anknüpfend das Modell Optimal Pricing against a Simple Learning Rule von Ernst-Ludwig von Thadden erläutern. In diesem Modell zeigt Professor v. Thadden, dass bei einem sich wiederholenden Kaufvorgang zwischen einem strategisch handelndem Verkäufer und einem nicht strategisch agierenden Käufer, der Verkäufer bei gegebenen Modellannahmen keine Möglichkeit hat, einen Vorteil zu erreichen, weil er die naiv einfache Lernregel des Käufers nicht ausnutzen kann.
2 Spieltheoretischer Überblick
2.1 Grundproblem von Märkten mit asymmetrischen Informationen
Beginnen wir mit dem Überblick bei Akerlof (1970), der in seinem Aufsatz
Market for Lemons am Gebrauchtwagenmarkt zeigt, dass auf Märkten mit asymmetrischer Informationsverteilung auf lange Sicht hohe Qualität vom Markt verschwindet. Denn wenn die uninformierten Käufer nicht zwischen hoher und niedriger Qualität unterscheiden können, dann liegt (meistens) die gebildete Zahlungsbereitschaft unterhalb des Reservationspreises der Anbieter mit hoher Qualität. Diese können zu diesem Preis nicht verkaufen und werden systematisch aus dem Markt gedrängt, so dass am Ende nur noch schlechte Qualität übrig bleibt. Es kommt zum Marktversagen. Dies lässt sich an einem einfachen Beispiel zeigen, bei dem ein Auto mit der Wahrscheinlichkeit von 50% eine hohe Qualität und mit Wahrscheinlichkeit von 50% eine niedrige Qualität aufweist. Der Reservationspreis der
5
2 und der für niedrige Qualität
Verkäufer für hohe Qualität liegt bei 1000
bei 500. Die Zahlungsbereitschaft und gleichzeitig der Nutzen der Käufer hingegen liegt bei 1200 für hohe und 700 für niedrige Qualität. Wenn die Käufer die Qualitäten unterscheiden könnten, würden sich am Markt Preise zwischen 1000 und 1200 für hohe Qualität und 500 bis 700 für niedrige Qualität einpendeln.
Jedoch liegt aufgrund der asymmetrischen Informationsverteilung die
1 ∗1200+ 1 ∗700
= 950, was dazu 2 2 maximale Zahlungsbereitschaft der Käufer bei
2
führt, dass Autos mit hoher Qualität vom Gebrauchtwagenmarkt verschwinden und der Markt zusammenbricht. Autos von hoher Qualität nden keine Käufer mehr, die Wahrscheinlichkeit hohe Qualität zu erhalten sinkt und irgendwann sind nur noch Autos mit niedriger Qualität am Markt verfügbar.
2.2 Problemlösungsmöglichkeiten
Der Aufsatz von Akerlof ist einer der meistzitierten wissenschaftlichen Texte der damaligen Jahre und es gab vielfältige Ansätze um das Akerlof-Dilemma zu lösen. So beweisen Heal (1976) und Wilson (1985), dass in sich wiederholenden Spielen die uninformierten Käufer das Verhalten der Verkäufer beobachten können und sich mit Hilfe dieser Beobachtungen jeder Verkäufer einen guten Ruf aufbauen kann. Die Reputation verhindert somit, dass Verkäufer betrügen, da dies zu einem schlechteren Ruf und somit zu weniger Verkäufen führen würde.
Ein zweiter Ansatz kommt von Hart und Moore (1988), die zeigen, dass Verträge zwischen Käufer und Verkäufer das Verhältnis stabilisieren können und somit ein Marktversagen wie beim Gebrauchtwagenmarkt von Akerlof verhindert werden kann.
2.3 Neue spieltheoretische Annahmen
In der gesamten bisher genannten Forschung basierten die Modelle darauf, dass zwar eine Informationsasymmetrie vorliegt, die Teilnehmer sich jedoch jederzeit rational und strategisch verhalten. Diese Annahme war zu der damaligen Zeit selbstverständlich und wurde z.B. von Fudenberg and Tirole (1993) folgendermaÿen begründet: 2 Die verwendete Werteinheit wie z.B. Euro oder Dollar ist für dieses Beispiel ohne weitere Relevanz, da die Logik davon unabhängig ist.
6
A rational player will use only those strategies that are best responses to some beliefs he might have about the strategies of his opponents. Or, to use the contrapositive, a player cannot reasonably play a strategy that is not a best response to some beliefs about his opponents' strategies.
Man ging somit davon aus, dass ein Mensch keinen Vorteil daraus hat sich nicht-strategisch oder nicht-rational zu verhalten. Forschungsansätze, bei dem Akteure nicht dem Homo Oeconomicus entsprechen, führten ein Schattendarsein und wurden nur von wenigen Spieltheoretikern verfolgt. Dabei denierte Simon (1955) schon in den 60er Jahren den Begri
der bounded rationality und forderte in seiner Arbeit dazu auf, das bisher angenommene rationale Verhalten durch ein Verhalten zu ersetzen, welches sich eher an dem empirisch beobachteten Verhalten der Akteure orientiert, welches häug genug nicht durch Rationalität sondern durch Erfahrung, Glauben, Halbwissen, . . . geprägt ist.
Doch erst in den letzten Jahren kam es zu einer verstärkten Forschung
zum Thema der bounded rationality, wie man an der Anzahl der veröentlichten Texte mit dem Keyword bounded rationality 3 sehen kann.
3 Auswertung des Erscheinungsjahrs der veröentlichten Texte mit dem Keyword bounded rationality auf http://www.repec.org vom 18.12.2007
7
An der Tabelle kann man erkennen, dass es erst ab den späten 90ern
zu einer nennenswerten Forschung im Bereich der bounded rationality kam. Gleichzeitig wurde die Annahme eines rational und strategisch handelnden Spielers nicht mehr als selbstverständlich angesehen und z.B. von Camerer (2004) das Bewuÿtsein geschaen, dass die bisherigen Grundannahmen und
Modelle unter Berücksichtigung von bounded rationality angepasst werden müssen.
It is widely accepted that not every player behaves rationally in complex situations, . . .
The presence of players who do not think strategically or optimize, even if there are very few such players, can change what rational players should do. As a result, what a population of play-
8
ers is likely to do when some are not thinking strategically and optimizing can only be predicted by an analysis that . . . accounts for bounded rationality as well . . .
In diesem Sinne möchte ich nun das Modell Optimal Pricing against a Simple Learning Rule von Ernst-Ludwig von Thadden erläutern, bei dem der Käufer bei einem sich unendlich wiederholenden Kaufgeschäft auf Korrektheit verzichtet und sein Verhalten gemäÿ einer einfachen Lernregel bestimmt. Der Käufer verzichtet ganz bewuÿt in dem Modell darauf, den gesamten Markt zu erfassen, obwohl er dies vielleicht könnte. Der Verkäufer hingegen verhält sich strategisch und rational und versucht das Verhalten des Käufers vorherzusagen um seinen Gewinn zu steigern.
3 Optimal Pricing against a Simple Learning Rule
3.1 Modellaufbau
In diesem Modell kommt es zu einer unendlich oft wiederholten Kaufaktion zwischen einem Verkäufer und einem Käufer, wie bei dem Akerlof 'schen Lemons Problem. Das dabei gehandelte Gut kann zwei verschiedene Qualitätszustände θ L and θ H annehmen, wobei hohe Qualität immer bevorzugt wird, also θ L < θ H gilt. Ein Beispiel für solch eine Aktion wäre z.B. der alltägliche Kauf eines Apfels, der entweder gut oder schlecht schmecken kann. θ ist eine exogen gegebene Variable mit P rob(θ q ) = f q , q = L, H, deren Verteilung nur dem Verkäufer bekannt ist. Das heiÿt, die Qualität ist eine private Information des Verkäufers, während der Käufer die Qualität erst nach dem Kauf erkennt. Der Verkäufer hat von der Qualität unabhängige xe Kosten, die auf 0 normiert werden.
Der Gewinn des Verkäufers ist gleich dem Preis, den er erhält, wenn der Käufer das Gut kauft. Andernfalls ist der Gewinn 0. Der Verkäufer seinerseits versucht das Verhalten des Käufers vorherzusagen, um seine Verkaufsstrategie zu optimieren.
Um das Beispiel mit dem Apfel fortzuführen: ob der Apfel gut oder schlecht schmeckt, kann vom Verkäufer nicht beeinusst werden und der Verkäufer kennt die Qualität des Apfels, während der Käufer den Apfel erst kaufen muÿ, bevor er die Qualität feststellen kann. Der Käufer hat eine Wertschätzung für das Gut in Höhe von u L und u H , wobei 0 < u L < u H gilt. Der Käufer kauft zum Preis p, was ihm einen Nutzen
9
von u q − p generiert. Wenn er nicht kauft, ist sein Nutzen 0. Darüber hinaus lässt sich der Durchschnittsnutzen des Käufers durch u := f L u L + f H u H berechnen.
Der Käufer isst somit gerne Äpfel, wobei ihm leckere Äpfel lieber sind als schlecht schmeckende. Sollte er sich zum Kauf entschlieÿen, wird sein Nutzen durch den Kaufpreis p verringert.
Wichtig ist, dass in dem Modell die Wertschätzung des Käufers von der Qualität abhängt und dass der Käufer gewisse Erwartungen an die Qualität bei einem gegebenen Preis hat und somit auch beurteilen kann, wie gut der Markt seine Anforderungen befriedigt. Um diese Erwartungen zu erzeugen, merkt sich der Käufer den Preis und die dafür erhaltene Qualität. In jeder Periode passt er hierfür seine Erwartungen über die zu erwartende Qualität bei dem gegebenen Preis gemäÿ einer einfachen Lernregel an. Vereinfacht gesprochen ist das die Rufbildung des Verkäufers.
3.2 Modellablauf
Die einzelnen Entscheidungen des Modells werden in folgender Reihenfolge getroen:
1. Zuerst legt die Natur die Qualität θ des Gutes fest die der Verkäufer erkennt.
2. Der Verkäufer legt einen Preis p(θ) fest.
3. Der Käufer sieht den Preis und wählt I(p) =
4. Die Auszahlungen sind dann
(a) I(p) ∗ (u q − p) für den Käufer,
(b) I(p) ∗ p für den Verkäufer.
Das Modell unterscheidet sich von den typischen signaling Spielen dadurch, dass die Kosten und der Gewinn des Verkäufers nicht von θ abhängen, was bedeutet, dass es in diesem Modell keine Möglichkeit des signalings oder screenings existieren. Deshalb gibt es bei einem einmalig gespielten Spiel, bei dem die Verteilung von θ allgemein bekannt ist, auch nur ein einziges
10
Bayesianische Nashgleichgewicht, nämlich einen konstanten Preis in Höhe
von p(θ q ) = e, q = L, H, e ≤ u. 4
Die Frage ist jedoch, ob bei einem sich unendlich oft wiederholenden Spiel, in dem die Qualität θ in jeder Periode t = 1, 2, . . . neu festgelegt wird, der Verkäufer einen durchschnittlichen Preis ≥ u erzielen kann. Hierfür versucht der Verkäufer den erwarteten Zukunftsgewinn, deniert durch I(p t ) ∗ p t , zu maximieren, indem er die Preise für jede Periode aus einem gegebenen Möglichkeitenset P = {e v ; v = 0, . . . , n, e 0 = u L , e n = u H }, n ≥ 1 auswählt. Die Begrenzung, dass die gewählten Preise zwischen u L und u H liegen müssen und nur endlich viele Preise gewählt werden können, hat keine Auswirkung auf die Aussagekraft des Modells, da der Verkäufer optimalerweise keine Preise ausserhalb von [u L , u H ] wählt und unendlich viele Preismöglichkeiten gegenüber endlich vielen Preismöglichkeiten keinen Vorteil generieren. Jedoch erleichtern diese Annahmen bezüglich des Preises die Beweisführung enorm. Der Verkäufer hat somit die Wahl zwischen n + 1 Preisen für sein Gut, welches er verkaufen will.
3.3 Lernregel des Käufers
Die Lernregel des Käufers ist absichtlich sehr einfach gehalten, da der Käufer bewuÿt oder unbewuÿt das strategische Verhalten des Verkäufers ignoriert und nur die relativen Häugkeiten der Qualitätszustände zählt und nach diesen Beobachtungen seine Erwartungen bildet.
Vereinfacht beschrieben: der Käufer überlegt sich vor jedem Kauf, welchen durchschnittlichen monetären Nutzen er bisher zu dem in dieser Periode angebotenen Preis erhalten hat und wenn der Preis höher ist als sein Nutzen, wird er nicht kaufen. Mathematisch betrachtet erfolgt diese Abschätzung über eine (n + 1) × 2 Matrix b := (π, µ) ∈ [u L , u H ] n+1 × N, wobei die erste Spalte den bisherige Durchschnittsnutzen und die zweite Zeile die Anzahl der bisherigen Kaufaktionen zu diesem Preis e v anzeigt. Eine Matrix
würde also bedeuten, dass der Käufer bereits 3 Mal zum Preis e 0 gekauft hat und dadurch einen durchschnittlichen Nutzen von 2.5 erzielt hat. Zum 4 Einen Preis gröÿer als u würde der Käufer nicht akzeptieren und mehrere Preise sind wegen des fehlenden screenings und signalings unmöglich.
11
Preis e 1 hat er bereits 5 mal gekauft, während er zu diesem Preis einen durchschnittlichen Nutzen von 3.5 erreicht hat. Der monetäre Durchschnittsnutzen in Periode t zum Preis e v wird berechnet durch
wobei M vq die Anzahl der θ q 's ist, die bis zu dieser Periode t zum Preis
t
e v verkauft wurden. Bei dem Faktor A vq handelt es sich um die Anfangserwartung des Käufers, welche die Erwartungs-Matrix b vor der ersten Periode mit Werten füllt.
Der Käufer kauft nur dann in Periode t zum Preis e v , wenn der beobachtete Preis e v ≤ π vt ist, denn nur in diesem Fall war sein bisheriger Durchschnittsnutzen bei diesem Preis positiv. Nach jeder Periode passt der Käufer seine Erwartungs-Matrix b durch folgende Formeln an:
Wenn es also zum Kaufgeschäft kommen sollte, wird der Zähler für die bisher durchgeführten Kaufaktionen zum Preis e v um 1 erhöht. Sollte es zu keinem Kaufgeschäft kommen, wird der Zähler nicht erhöht.
π vt+1
Der bisherige Durchschnittsnutzen vom Preis e v verändert sich dahingehend, dass im Zähler der Nutzen, der durch die aktuelle Kaufaktion entstanden ist, addiert wird. Der Nenner wiederum steigt um 1. Das Modell ist nun vollständig beschrieben und wir werden nun den Fall mit und ohne Abzinsung betrachten.
3.4 Fall ohne Abzinsung
Beim Fall ohne Abzinsung gewichtet die Lernregel alle Beobachtungen gleich stark. Somit wird die Nutzenanpassung der Matrix b immer kleiner um so mehr Kaufaktionen vorgefallen sind. Das bedeutet natürlich, dass der Käufer nach mehreren Kaufaktionen eher den Kauf von niedriger Qualität für einen
12
hohen Preis akzeptieren wird. Es stellt sich jedoch die Frage, ob der Verkäufer die Situation systematisch zum Nachteil des Käufers ausnutzen kann? Von Thadden zeigt in seiner Arbeit, dass dies nicht möglich ist, da in der Summe aller Kaufaktionen der erwartete Gewinn des Verkäufers nie höher sein kann als der Durchschnittsnutzen
u
des Käufers. Denn eine Strategie
des Verkäufers mit höherem Gewinn würde zwangsläug dazu führen, dass irgendwann der Käufer aus dem Markt austreten und nicht mehr kaufen würde. Dies steht jedoch im Widerspruch zur optimalen Strategie des Verkäufers. Da der Beweis intuitiv nicht schwer zu erfassen ist und ich auch den Rahmen dieser Seminararbeit nicht sprengen will, verweise ich für den vollständigen Beweis auf den Appendix des Papers von Ernst-Ludwig von Thadden.
Man kann somit als Aussage festhalten, dass der Verkäufer nicht mehr als u vom Käufer bekommen kann, was einer ehrlichen Preisbildung nach der Wertschätzung des Käufers entspricht.
Darüber hinaus stehen dem Verkäufer unbegrenzt viele andere Preissetzungsmöglichkeiten, wie z.B den Fall mit zwei Preisen u L und e v > u L , zur Verfügung, welche das gleiche Ergebnis liefern. Beginnen wir mit ein paar Denitionen, die für die folgende Aussage über die Strategie des Verkäufers notwendig sind:
Denition 1 Für e v < u H gilt r v := ev−u L u H −ev .
r v ist somit der relative Abstand von e v zu u H und legt fest, wieviel Betrügen seitens des Verkäufers möglich ist.
Denition 2 Für x ∈ R bezeichnet x die kleinste nicht-negative Zahl, die gerade nicht kleiner ist als x. (also z.B. bei x = 4, 3 ist x = 5)
Denition 3 Die Strategie ρ v des Verkäufers ist gegeben durch:
1. p t (H t ) = e v if θ t = θ H . Also verkaufe bei hoher Qualität zum Preis e v , und . . .
2. für jedes k ∈ N, nach kr v Realisationen von θ H , verkaufe das nächste θ L für e v um die Anzahl der verkauften θ L 's zum Preis e v auf k zu erhöhen. In jeder anderen Situation H t mit θ t = θ L , p t (H t ) = u L .
13
Vereinfacht gesprochen wählt der Verkäufer immer den Preis e v bei hoher Qualität und den niedrigen Preis u L bei niedriger Qualität, ausser er hat durch den bisherigen Verkauf genug Ruf aufgebaut, dass er niedrige Qualität zum hohen Preis verkaufen kann. Dies ist natürlich nur möglich, da der Verkäufer für hohe Qualität nicht den vollen Preis, sondern nur e v < u H verlangt.
Behauptung 1 If u ≤ e v ≤ u H , ρ v is optimal.
Beweis. Betrachten wir Formel (3) mit der der Käufer seine Erwartung über den zukünftigen Nutzen bewertet, nachdem der Verkäufer betrogen hat:
Anhand dieser Formel kann gezeigt werden, dass selbst nach einem Betrug, π v nicht kleiner als e v wird und somit der Käufer immer kaufen wird.
Anhand der Abbildung kann man dies sehr gut für den Fall u L = 1, u H = 2 und e v = 1, 75 erkennen. Der Durchschnittsnutzen π v fällt nach jedem Betrug zurück auf 1, 75, jedoch verhindert die Strategie ρ v , dass der Verkäufer zu häug betrügt.
Gleichzeitig kann man den erwarteten Prot des Verkäufers nach t Perioden mit folgender Gleichung beschreiben,
14
welcher nach u strebt, wenn t → ∞.
Somit haben wir gezeigt, dass der Verkäufer im Fall ohne Abzinsung jede beliebige Preiskombination aus einem Preis gröÿer oder gleich dem Poolingpreis in Verbindung mit u L verwenden kann, um eine optimale Strategie zu entwickeln. In jeder dieser Strategien hat der Preis e v eine zugehörige Anzahl von Betrugsfällen, die durch ρ v deniert und deren Anzahl so begrenzt ist, dass der Käufer immer kauft.
3.5 Fall mit Abzinsung
Beim Fall mit Abzinsung hat der Verkäufer eine strikte Präferenz für heutigen Nutzen und es wird im Folgenden gezeigt werden, dass die Strategie aus dem Fall ohne Abzinsung nicht optimal ist. Wichtig hierbei ist, dass die Präferenz für heutigen Nutzen nicht zu groÿ sein darf, weil es sonst zu einer kurzsichtigen Handlung des Verkäufers kommen kann, bei der er seinen Ruf ruiniert, den Durchschnittsnutzen π v zu weit nach unten treibt und der Käufer nicht mehr kaufen wird. Ein zweiter wichtiger Hinweis bezieht sich auf die Anfangserwartung A v des Käufers, welche in diesem Fall nicht zu hoch sein sollte, da wir uns nicht auf die optimale Ausbeutung der Anfangserwartung seitens des Verkäufers konzentrieren wollen, sondern auf der Suche nach einem langfristigen Gleichgewicht mit 2 Preisen im Fall mit Abzinsung sind.
Behauptung 2 Wenn σ eine Strategie mit P (σ; b 1 ) e v < u H ist, dann ist σ nicht optimal.
Angenommen der Verkäufer will zum Preis e v < u H verkaufen, so ist es nicht schwierig zu zeigen, dass der Verkäufer sich strikt besser stellen kann, wenn er alle Entscheidungen p t (h t ) = e v durch p t (b t , θ q ) = u q , q = L, H ersetzt. Den aufgrund seiner Präferenz für heutigen Nutzen ist es sinnvoll, immer den maximalen Gewinn abzuschöpfen, als erst r v mal hohe Qualität zum Preis e v zu verkaufen um dann einmal θ L für e v zu verkaufen. Somit wird der Verkäufer in jedem Fall auf lange Sicht die Preise u L und u H wählen und sich somit die ehrliche Preissetzung durchsetzen. Behauptung 3 Die einzige Lösung für den Fall mit Abzinsung bei unendlichem Zeithorizont sind die Screeningpreise u L und u H .
Beweis Der Beweis folgt aus den folgenden Bedingungen:
15
!
1. e v > u L ,
2. e v < u H ist nicht optimal und
3. e v darf nicht gröÿer als u H sein, weil sonst der Käufer nicht mehr kaufen würde.
3.6 Alternative Lernregeln
Die in dieser Arbeit betrachtete Lernregel für µ und π kann als ein Extrembeispiel für adaptive Lernregeln gesehen werden und die folgenden zwei Ab-wandlungen zeigen, dass auch für weniger extreme Beispiele die Hauptaussage ihre Gültigkeit behält.
Bei den η-Regeln werden die Beobachtungen unterschiedlich gewichtet. So wird die aktuelle Beobachtung voll gewichtet, jedoch gehen alle vergangenen (t − 1) Beobachtungen nur noch mit dem Gewicht η t in die Erwartungs-Matrix b ein.
π vt+1
In dieser Arbeit wurde die η = 1 Regel verwendet, während z.B. bei der
Verwendung der η = 0 Regel ein tit-for-tat Spiel beschrieben worden wäre. 5
Entscheidend jedoch bei allen η Regeln ist, dass bei jeder η Regel mit 0 ≤ η < 1, die minimale Anzahl der zu verkaufenden θ H 's gröÿer ist, als bei der η = 1 Regel, bevor man ein θ L zu einem höheren Preis verkaufen kann. Der Verkäufer kann somit bei 0 ≤ η < 1 weniger betrügen, als bei η = 1. Eine zweite Abwandlung der verwendeten Lernregel sind die N-Regeln,
µ vt+1 5 eine tit-for-tat -Strategie befolgt 4 Anweisungen: sei nett, provozierbar, versöhnlich und durchschaubar. Auf unseren Fall angewendet würde das bedeuten: Glaube dem Verkäufer, dass er einen berechtigten Preis verlangt, aber sollte einmal der Preis nicht berechtigt sein, dann kaufe zu diesem Preis nie mehr.
16
bei denen (U vt 1 , . . . , U vt k das Tuple der letzten k Beobachtungen k ) ∈ u L , u H
zum Preis e v sind, welche von und bis einschliesslich der Periode t zurückgezählt wurden. M t ist die Gesamtanzahl der bisherigen Beobachtungen zum Preis e v bis zur aktuellen Periode t.
Bei der N Regel ist somit das Gedächtnis des Käufers beschränkt, da er sich nur an die letzten N Beobachtungen errinnern kann und diese gleich gewichtet. Für N = ∞ haben wir die in dieser Arbeit verwendete Regel und für N = 1 haben wir wieder ein tit-for-tat Spiel.
4 Schluÿbemerkung
Die Arbeit von Ernst-Ludwig von Thadden kombiniert eine einfache Lernregel des Käufers mit einer sich wiederholenden Kaufaktion mit asymmetrischen Informationen. Das zentrale Ergebnis seiner Arbeit ist, dass diese auf den ersten Blick nicht strategisch rationale Kaufregel trotz ihrer Einfachheit das gleiche Ergebnis liefert wie eine Lernregel mit rationaler Erwartungsbildung und vollständigen Informationen. Die Lernregel ist somit a bit more realistic and a bit (or even a lot) less rational gemäÿ der Forderung von Bray und Kreps (1987).
Man sollte die Arbeit von von Thadden jedoch nicht als Auorderung sehen, dass sich Individuen nicht mehr rational verhalten sollten, sondern von Thadden überprüft die Auswirkungen einer vereinfachten Lernregel, motiviert durch die vielfältigen Beweise aus der Soziologie, Psychologie und experimenteller Mikroökonomie, dass Individuen sich nicht immer rational verhalten.
Dass kein Modell aufgrund seiner getroenen Annahmen die Realität perfekt abbilden kann, ist jedem bewuÿt. So sollte man jedoch die Arbeit von von Thadden als Auorderung sehen, die Grundannahme rational agierender Individuen in Frage zu stellen. Individuen haben durchaus Anreize sich nicht rational zu verhalten. Sie verfügen nicht immer über die Möglichkeit und die Zeit, vollständige Informationen und Erwartungen zu bilden. Das ist unter bestimmten Umständen auch nicht notwendig, da genau dieses Modell zeigt, dass ein nicht strategisches Verhalten sie nicht zwangsläug schlechter stellen muss. (Oder sie wollen dies auch gar nicht, da andere Kaufmotive vorliegen.)
17
Literatur
[1] Akerlof, George A. (1970), The Market for Lemons: Quality Uncer-
tainty and the Market Mechanism, Quarterly Journal of Economics, 84, 488-500.
[2] Bray, M., and Kreps, D. M. (1987) Rational Learning and Rational
Expectations in: Feiwel, G. R. (Hrsg.): Arrow and the Ascent of Modern Economic Theory, Houndsmills, London: MacMillan & Co.
[3] Camerer, Colin F., Teck-Hua Ho and Juin Kuan Chong (2004) Behavioural Game Theory: Thinking, Learning and Teaching, in: Huck,
Steen (Hrsg.): Advances in understanding strategic behaviour game theory, experiments and bounded rationality, Palgrave Macmillan: 120-121.
[4] Ellison, Glenn (2006) Bounded Rationality in Industrial Organization,
in: Burnell, Richard (Hrsg.): Advances in Economics and Econometrics: Theory and Applications, Cambridge University Press.
[5] Fudenberg, Drew and Tirole, Jean (1993) Game Theory, The MIT Press: 48-49.
[6] Gabler Wirtschaftslexikon (2004) Homo Oeconomicus, 15. Auage, Gabler, Wiesbaden: 1457.
[7] Gibbons, Robert (1992) A Primer in Game Theory, Financial Times Prent.Int: Preface xii.
[8] Gross, Peter (1994) Die Multioptionsgesellschaft, 10. Auage, Suhrkamp.
[9] Hart, Oliver and John Moore (1988), Incomplete Contracts and Rene-
gotiation Econometrica 56, 755-785.
[10] Heal, Georey (1976), Do Bad Products Drive out Good?, Quarterly Journal of Economics, 90, 499-502.
[11] Niejahr, Elisabeth (2007) Der überforderte Verbraucher, in: DIE ZEIT, Nr. 45: 23-24.
18
[12] Simon, Herbert (1955), A Behavioral Model of Rational Choice, Quarterly Journal of Economics, 69, 99-118.
[13] Thadden, Ernst-Ludwig (1992), Optimal pricing against a Simple learn-
ing Rule, Games and Economic Behavior, 4, 627-649.
[14] Wilson, Robert (1985), Reputations in Games and Markets, in: Roth,
Alvin E. (Hrsg.): Game-Theoretic Models of Bargaining, Cambridge University Press: 27-62.
19
Arbeit zitieren:
Christoph Dyllick-Brenzinger, 2008, Optimal Pricing against a simple learning rule, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
That is, does one or more mark...
Essay, 9 Seiten
Behavioral Branding - Stand der Forschung und Managmentimplikationen
BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung
Seminararbeit, 42 Seiten
Verlustaversion und Prospect Theory als Erklärungsansätze für Verhalte...
VWL - Mikroökonomie, allgemein
Seminararbeit, 20 Seiten
Loss Aversion und Endowment Effect - Wesen und Relevanz für Käufer und...
BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung
Seminararbeit, 23 Seiten
Die Relevanz von Pretests und ihre Vereinbarkeit mit kreativer Werbung...
BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung
Diplomarbeit, 101 Seiten
Christoph Dyllick-Brenzinger's Text Optimal Pricing against a simple learning rule ist nun auf dem Buchmarkt erhältlich
Christoph Dyllick-Brenzinger hat den Text Optimal Pricing against a simple learning rule veröffentlicht
Christoph Dyllick-Brenzinger hat einen neuen Text hochgeladen
Elements of Reason: Cognition, Choice, and the Bounds of Rationality
Arthur Lupia, Mathew D. McCubbins, Samuel L. Popkin
Decision Rules in the European Union: A Rational Choice Perspective
Gebhard Kirchgassner, Gerald Schneider, Peter Daniel Moser
Politics and Rationality: Rational Choice in Application
William James Booth, Hudson Meadwell, Patrick James
Rationalizing Capitalist Democracy: The Cold War Origins of Rational C...
Amadae, S. M. Amadae
Rationalizing Capitalist Democracy: The Cold War Origins of Rational C...
Amadae, S. M. Amadae
0 Kommentare