Optimal Pricing against a simple learning rule


Seminararbeit, 2008

19 Seiten, Note: 2,0


Gratis online lesen

Inhaltsverzeichnis

1 Einleitung

2 Spieltheoretischer Überblick
2.1 Grundproblem von Märkten mit asymmetrischen Informationen
2.2 Problemlösungsmöglichkeiten
2.3 Neue spieltheoretische Annahmen

3 Optimal Pricing against a Simple Learning Rule
3.1 Modellaufbau
3.2 Modellablauf
3.3 Lernregel des Käufers
3.4 Fall ohne Abzinsung
3.5 Fall mit Abzinsung
3.6 Alternative Lernregeln

4 Schluÿbemerkung

Zusammenfassung

Research conducted and published by sociologists, psychologists as well as experimental microeconomists has repeatedly highlighted that the common assumption of rational individuals in most of the existing literature of game theory is only a rough approximation to reality at best if not doubtful. With full rationality being a cornerstone, the dis- cipline has found itself in a dilemma situation. As early as 1955, Simon had consequently created the term bounded rationality and called for modi ed model assumptions. However, his call has been largely un- heard until 1996. Ernst-Ludwig von Thadden's paper Optimal pricing against a simple learning rule was one step on the way for more re- search focussing on the agents' lack of full rationality

This paper intends to provide rstly a short summary of the devel- opment of game theory research with a clear focus on bounded rational- ity. Secondly, it presents the core assumptions and key take-aways of Ernst-Ludwig von Thadden's paper Optimal Pricing against a simple learning rule

Ernst-Ludwig von Thadden prime assumption is a non-strategic strategic buyer, in other words a buyer which updates his beliefs ac- cording to a simple learning rule. This non-strategic behaviour reects Simon's call to assume a bounded rationality when modelling the agents' behaviour. Thadden's research shows - derived using a re- peated buyer-seller relationship under asymmetric information - that the strategically acting seller can not bene t from this situation in terms of extract a supernormal price. On average, the seller extracts only the buyer's mean utilityū

1 Einleitung

Die neue Not der Kunden - so lautete die Überschrift eines ZEIT Artikels vom 31.Oktober 2007. Der Artikel beschreibt die zunehmende Verzwei ung der Verbraucher bei der Fülle an Produkten, Techniken und Tarifen mit denen Tag für Tag die Verbraucher konfrontiert werden.1

Liberalisierung, Globalisierung und technischer Fortschritt brin- gen Deutschlands Verbrauchern mehr Freiheiten als je zuvor. Nie aber war es so anstrengend, die richtige Wahl zu tre en.

...

Verbraucherforscher wie die Professorin Lucia Reisch aus Calw bei Stuttgart halten deshalb nicht den mündigen Verbraucher für typisch, sondern den con dent consumer, den vertrauensvollen Konsumenten. Er hat weniger Zeit für die Informationssuche und vertraut deshalb etablierten Marken, bleibt bei bewährten Kon- sumgewohnheiten oder kauft einfach das Gleiche wie Freunde oder Angehörige.

Jeder von uns kennt das eben geschilderte Szenario aus eigener Erfahrung und weiÿ, dass man aufgrund von mangelndem Wissen, Möglichkeiten oder Zeit manchmal keine optimalen Entscheidungen tri t und ganz sicher nicht dem theoretischen Modell des Homo Oeconomicus entspricht. Dieser Homo Oeconomicus wird in Gablers Wirtschaftslexikon beschrieben, als ein Men- sch, der seine Handlungen allein auf der Basis der ihm vorliegenden In- formationen rational ausrichtet und seine Entscheidungen nach dem ökonomischen Prinzip zur Maximierung seines persönlichen Nutzens tri t.

Wenn man jedoch die spieltheoretische Forschung der letzten Jahrzehnte betrachtet, so ndet man fast nur Forschung über rational und strategisch agierende Spieler. Beispielsweise liest man im Preface des Spieltheoriebuches A Primer in Game Theory, von Gibbons, Robert (1992):

we will discuss (in this book) four classes of games: static games of complete information, dynamic games of complete information, static games of incomplete information, and dynamic games of incomplete information.

Die Forschung der letzten Jahrzehnte hat sich fast ausschlieÿlich mit der Auswirkung von unterschiedlicher Informationsverteilung auf das Verhalten der Akteure beschäftigt, jedoch nur selten die Grundannahmen dieser For- schung in Frage gestellt. Das Element der Irrationalität des Spielers wurde nur in den seltensten Fällen berücksichtigt. So können die in dieser Zeit ent- wickelten Modelle und Methoden keine Vorhersagen für den oben beschriebe- nen con dent consumer machen, denn ein Spieler, der nicht-rational oder nicht-strategisch handelt, ist in diesen Modellen nicht vorgesehen.

Ich möchte nun in meiner folgenden Arbeit einen kurzen Überblick der spieltheoretischen Forschung auf Märkten mit asymmetrischer Information geben und daran anknüpfend das Modell Optimal Pricing against a Simple Learning Rule von Ernst-Ludwig von Thadden erläutern. In diesem Modell zeigt Professor v. Thadden, dass bei einem sich wiederholenden Kaufvorgang zwischen einem strategisch handelndem Verkäufer und einem nicht strate- gisch agierenden Käufer, der Verkäufer bei gegebenen Modellannahmen keine Möglichkeit hat, einen Vorteil zu erreichen, weil er die naiv einfache Lern- regel des Käufers nicht ausnutzen kann.

2 Spieltheoretischer Überblick

2.1 Grundproblem von Märkten mit asymmetrischen Infor- mationen

Beginnen wir mit dem Überblick bei Akerlof (1970), der in seinem Aufsatz Market for Lemons am Gebrauchtwagenmarkt zeigt, dass auf Märkten mit asymmetrischer Informationsverteilung auf lange Sicht hohe Qualität vom Markt verschwindet. Denn wenn die uninformierten Käufer nicht zwischen hoher und niedriger Qualität unterscheiden können, dann liegt (meistens) die gebildete Zahlungsbereitschaft unterhalb des Reservationspreises der An- bieter mit hoher Qualität. Diese können zu diesem Preis nicht verkaufen und werden systematisch aus dem Markt gedrängt, so dass am Ende nur noch schlechte Qualität übrig bleibt. Es kommt zum Marktversagen.

Dies lässt sich an einem einfachen Beispiel zeigen, bei dem ein Auto mit der Wahrscheinlichkeit von 50% eine hohe Qualität und mit Wahrschein- lichkeit von 50% eine niedrige Qualität aufweist. Der Reservationspreis der Verkäufer für hohe Qualität liegt bei 10002 und der für niedrige Qualität bei 500. Die Zahlungsbereitschaft und gleichzeitig der Nutzen der Käufer hingegen liegt bei 1200 für hohe und 700 für niedrige Qualität.

Wenn die Käufer die Qualitäten unterscheiden könnten, würden sich am Markt Preise zwischen 1000 und 1200 für hohe Qualität und 500 bis 700 für niedrige Qualität einpendeln.

Jedoch liegt aufgrund der asymmetrischen Informationsverteilung die maximale Zahlungsbereitschaft der Käufer bei[Abbildung in dieser Leseprobe nicht enthalten]was dazu führt, dass Autos mit hoher Qualität vom Gebrauchtwagenmarkt verschwin- den und der Markt zusammenbricht. Autos von hoher Qualität nden keine Käufer mehr, die Wahrscheinlichkeit hohe Qualität zu erhalten sinkt und irgendwann sind nur noch Autos mit niedriger Qualität am Markt verfüg- bar.

2.2 Problemlösungsmöglichkeiten

Der Aufsatz von Akerlof ist einer der meistzitierten wissenschaftlichen Texte der damaligen Jahre und es gab vielfältige Ansätze um das Akerlof-Dilemma zu lösen. So beweisen Heal (1976) und Wilson (1985), dass in sich wieder- holenden Spielen die uninformierten Käufer das Verhalten der Verkäufer beobachten können und sich mit Hilfe dieser Beobachtungen jeder Verkäufer einen guten Ruf aufbauen kann. Die Reputation verhindert somit, dass Ver- käufer betrügen, da dies zu einem schlechteren Ruf und somit zu weniger Verkäufen führen würde.

Ein zweiter Ansatz kommt von Hart und Moore (1988), die zeigen, dass Verträge zwischen Käufer und Verkäufer das Verhältnis stabilisieren können und somit ein Marktversagen wie beim Gebrauchtwagenmarkt von Akerlof verhindert werden kann.

2.3 Neue spieltheoretische Annahmen

In der gesamten bisher genannten Forschung basierten die Modelle darauf, dass zwar eine Informationsasymmetrie vorliegt, die Teilnehmer sich jedoch jederzeit rational und strategisch verhalten. Diese Annahme war zu der damaligen Zeit selbstverständlich und wurde z.B. von Fudenberg and Tirole (1993) folgendermaÿen begründet:

A rational player will use only those strategies that are best responses to some beliefs he might have about the strategies of his opponents. Or, to use the contrapositive, a player cannot reasonably play a strategy that is not a best response to some beliefs about his opponents' strategies.

Man ging somit davon aus, dass ein Mensch keinen Vorteil daraus hat sich nicht-strategisch oder nicht-rational zu verhalten. Forschungsansätze, bei dem Akteure nicht dem Homo Oeconomicus entsprechen, führten ein Schattendarsein und wurden nur von wenigen Spieltheoretikern verfolgt.

Dabei de nierte Simon (1955) schon in den 60er Jahren den Begri der bounded rationality und forderte in seiner Arbeit dazu auf, das bisher angenommene rationale Verhalten durch ein Verhalten zu ersetzen, welches sich eher an dem empirisch beobachteten Verhalten der Akteure orientiert, welches häu g genug nicht durch Rationalität sondern durch Erfahrung, Glauben, Halbwissen, . . . geprägt ist.

Doch erst in den letzten Jahren kam es zu einer verstärkten Forschung zum Thema der bounded rationality, wie man an der Anzahl der verö entlichten Texte mit dem Keyword bounded rationality3 sehen kann.

Abbildung in dieser Leseprobe nicht enthalten

An der Tabelle kann man erkennen, dass es erst ab den späten 90ern zu einer nennenswerten Forschung im Bereich der bounded rationality kam. Gleichzeitig wurde die Annahme eines rational und strategisch handelnden Spielers nicht mehr als selbstverständlich angesehen und z.B. von Camerer (2004) das Bewuÿtsein gescha en, dass die bisherigen Grundannahmen und Modelle unter Berücksichtigung von bounded rationality angepasst werden müssen.

It is widely accepted that not every player behaves rationally in complex situations, . . .

The presence of players who do not think strategically or opti- mize, even if there are very few such players, can change what rational players should do. As a result, what a population of play- ers is likely to do when some are not thinking strategically and optimizing can only be predicted by an analysis that . . . accounts for bounded rationality as well . . .

In diesem Sinne möchte ich nun das Modell Optimal Pricing against a Simple Learning Rule von Ernst-Ludwig von Thadden erläutern, bei dem der Käufer bei einem sich unendlich wiederholenden Kaufgeschäft auf Korrektheit verzichtet und sein Verhalten gemäÿ einer einfachen Lernregel bestimmt. Der Käufer verzichtet ganz bewuÿt in dem Modell darauf, den gesamten Markt zu erfassen, obwohl er dies vielleicht könnte. Der Verkäufer hingegen verhält sich strategisch und rational und versucht das Verhalten des Käufers vorherzusagen um seinen Gewinn zu steigern.

3 Optimal Pricing against a Simple Learning Rule

3.1 Modellaufbau

In diesem Modell kommt es zu einer unendlich oft wiederholten Kaufaktion zwischen einem Verkäufer und einem Käufer, wie bei dem Akerlof 'schen Lemons Problem. Das dabei gehandelte Gut kann zwei verschiedene Qualitäts- zustände θL and θH annehmen, wobei hohe Qualität immer bevorzugt wird, also θL < θH gilt. Ein Beispiel für solch eine Aktion wäre z.B. der alltägliche Kauf eines Apfels, der entweder gut oder schlecht schmecken kann.

θ ist eine exogen gegebene Variable mit P rob(θq ) = fq , q = L, H, deren Verteilung nur dem Verkäufer bekannt ist. Das heiÿt, die Qualität ist eine private Information des Verkäufers, während der Käufer die Qualität erst nach dem Kauf erkennt. Der Verkäufer hat von der Qualität unabhängige fixe Kosten, die auf 0 normiert werden.

Der Gewinn des Verkäufers ist gleich dem Preis, den er erhält, wenn der Käufer das Gut kauft. Andernfalls ist der Gewinn 0. Der Verkäufer seinerseits versucht das Verhalten des Käufers vorherzusagen, um seine Verkaufsstrategie zu optimieren.

Um das Beispiel mit dem Apfel fortzuführen: ob der Apfel gut oder schlecht schmeckt, kann vom Verkäufer nicht beein usst werden und der Verkäufer kennt die Qualität des Apfels, während der Käufer den Apfel erst kaufen muÿ, bevor er die Qualität feststellen kann.

Der Käufer hat eine Wertschätzung für das Gut in Höhe von uL und uH , wobei 0 < uL < uH gilt. Der Käufer kauft zum Preis p, was ihm einen Nutzen von uq − p generiert. Wenn er nicht kauft, ist sein Nutzen 0. Darüber hinaus lässt sich der Durchschnittsnutzen des Käufers durch[Abbildung in dieser Leseprobe nicht enthalten] berechnen.

Der Käufer isst somit gerne Äpfel, wobei ihm leckere Äpfel lieber sind als schlecht schmeckende. Sollte er sich zum Kauf entschlieÿen, wird sein Nutzen durch den Kaufpreis p verringert.

Wichtig ist, dass in dem Modell die Wertschätzung des Käufers von der Qualität abhängt und dass der Käufer gewisse Erwartungen an die Qualität bei einem gegebenen Preis hat und somit auch beurteilen kann, wie gut der Markt seine Anforderungen befriedigt. Um diese Erwartungen zu erzeugen, merkt sich der Käufer den Preis und die dafür erhaltene Qualität. In jeder Periode passt er hierfür seine Erwartungen über die zu erwartende Qualität bei dem gegebenen Preis gemäÿ einer einfachen Lernregel an. Vereinfacht gesprochen ist das die Rufbildung des Verkäufers.

3.2 Modellablauf

Die einzelnen Entscheidungen des Modells werden in folgender Reihenfolge getro en:

1. Zuerst legt die Natur die Qualität θ des Gutes fest die der Verkäufer erkennt.

2. Der Verkäufer legt einen Preis p(θ) fest.

3. Der Käufer sieht den Preis und wählt [Abbildung in dieser Leseprobe nicht enthalten]

4. Die Auszahlungen sind dann

(a) [Abbildung in dieser Leseprobe nicht enthalten] für den Käufer,
(b) [Abbildung in dieser Leseprobe nicht enthalten] für den Verkäufer.

Das Modell unterscheidet sich von den typischen signaling Spielen da- durch, dass die Kosten und der Gewinn des Verkäufers nicht von θ abhängen, was bedeutet, dass es in diesem Modell keine Möglichkeit des signalings oder screenings existieren. Deshalb gibt es bei einem einmalig gespielten Spiel, bei dem die Verteilung von θ allgemein bekannt ist, auch nur ein einziges Bayesianische Nashgleichgewicht, nämlich einen konstanten Preis in Höhe von[Abbildung in dieser Leseprobe nicht enthalten]4

Die Frage ist jedoch, ob bei einem sich unendlich oft wiederholenden Spiel, in dem die Qualität θ in jeder Periode t = 1, 2, . . . neu festgelegt wird, der Verkäufer einen durchschnittlichen Preis ≥ūerzielen kann.

Hierfür versucht der Verkäufer den erwarteten Zukunftsgewinn, de niert durch I(pt) * pt, zu maximieren, indem er die Preise für jede Periode aus einem gegebenen Möglichkeitenset [Abbildung in dieser Leseprobe nicht enthalten] auswählt. Die Begrenzung, dass die gewählten Preise zwischen uL und uH liegen müssen und nur endlich viele Preise gewählt werden können, hat keine Auswirkung auf die Aussagekraft des Modells, da der Verkäufer optimalerweise keine Preise ausserhalb von [uL, uH ] wählt und unendlich viele Preismöglichkeiten gegenüber endlich vielen Preismöglichkeiten keinen Vorteil generieren. Jedoch erleichtern diese Annahmen bezüglich des Preises die Beweisführung enorm. Der Verkäufer hat somit die Wahl zwischen n + 1 Preisen für sein Gut, welches er verkaufen will.

3.3 Lernregel des Käufers

Die Lernregel des Käufers ist absichtlich sehr einfach gehalten, da der Käufer bewuÿt oder unbewuÿt das strategische Verhalten des Verkäufers ignoriert und nur die relativen Häu gkeiten der Qualitätszustände zählt und nach diesen Beobachtungen seine Erwartungen bildet.

Vereinfacht beschrieben: der Käufer überlegt sich vor jedem Kauf, welchen durchschnittlichen monetären Nutzen er bisher zu dem in dieser Periode angebotenen Preis erhalten hat und wenn der Preis höher ist als sein Nutzen, wird er nicht kaufen. Mathematisch betrachtet erfolgt diese Abschätzung über eine[Abbildung in dieser Leseprobe nicht enthalten], wobei die erste Spalte den bisherige Durchschnittsnutzen und die zweite Zeile die Anzahl der bisherigen Kaufaktionen zu diesem Preis ev anzeigt. Eine Matrix

Abbildung in dieser Leseprobe nicht enthalten

würde also bedeuten, dass der Käufer bereits 3 Mal zum Preis e0 gekauft hat und dadurch einen durchschnittlichen Nutzen von 2.5 erzielt hat. Zum Preis e1 hat er bereits 5 mal gekauft, während er zu diesem Preis einen durchschnittlichen Nutzen von 3.5 erreicht hat.

Der monetäre Durchschnittsnutzen in Periode t zum Preis ev wird berechnet durch

Abbildung in dieser Leseprobe nicht enthalten

wobei[Abbildung in dieser Leseprobe nicht enthalten]die Anzahl der[Abbildung in dieser Leseprobe nicht enthalten] 's ist, die bis zu dieser Periode t zum Preis ev verkauft wurden. Bei dem Faktor Avq handelt es sich um die Anfangserwartung des Käufers, welche die Erwartungs-Matrix b vor der ersten Periode mit Werten füllt.

Der Käufer kauft nur dann in Periode t zum Preis ev , wenn der beobachtete Preis[Abbildung in dieser Leseprobe nicht enthalten]ist, denn nur in diesem Fall war sein bisheriger Durchschnittsnutzen bei diesem Preis positiv.

Nach jeder Periode passt der Käufer seine Erwartungs-Matrix b durch folgende Formeln an:

Abbildung in dieser Leseprobe nicht enthalten

Wenn es also zum Kaufgeschäft kommen sollte, wird der Zähler für die bisher durchgeführten Kaufaktionen zum Preis ev um 1 erhöht. Sollte es zu keinem Kaufgeschäft kommen, wird der Zähler nicht erhöht.

Abbildung in dieser Leseprobe nicht enthalten

Der bisherige Durchschnittsnutzen vom Preis ev verändert sich dahingehend, dass im Zähler der Nutzen, der durch die aktuelle Kaufaktion entstanden ist, addiert wird. Der Nenner wiederum steigt um 1.

Das Modell ist nun vollständig beschrieben und wir werden nun den Fall mit und ohne Abzinsung betrachten.

3.4 Fall ohne Abzinsung

Beim Fall ohne Abzinsung gewichtet die Lernregel alle Beobachtungen gleich stark. Somit wird die Nutzenanpassung der Matrix b immer kleiner um so mehr Kaufaktionen vorgefallen sind. Das bedeutet natürlich, dass der Käufer nach mehreren Kaufaktionen eher den Kauf von niedriger Qualität für einen hohen Preis akzeptieren wird. Es stellt sich jedoch die Frage, ob der Verkäufer die Situation systematisch zum Nachteil des Käufers ausnutzen kann?

Von Thadden zeigt in seiner Arbeit, dass dies nicht möglich ist, da in der Summe aller Kaufaktionen der erwartete Gewinn des Verkäufers nie höher sein kann als der Durchschnittsnutzen ūdes Käufers. Denn eine Strategie des Verkäufers mit höherem Gewinn würde zwangsläu g dazu führen, dass irgendwann der Käufer aus dem Markt austreten und nicht mehr kaufen würde. Dies steht jedoch im Widerspruch zur optimalen Strategie des Ver- käufers. Da der Beweis intuitiv nicht schwer zu erfassen ist und ich auch den Rahmen dieser Seminararbeit nicht sprengen will, verweise ich für den vollständigen Beweis auf den Appendix des Papers von Ernst-Ludwig von Thadden.

Man kann somit als Aussage festhalten, dass der Verkäufer nicht mehr alsūvom Käufer bekommen kann, was einer ehrlichen Preisbildung nach der Wertschätzung des Käufers entspricht.

Darüber hinaus stehen dem Verkäufer unbegrenzt viele andere Preissetzungsmöglichkeiten, wie z.B den Fall mit zwei Preisen uL und ev > uL, zur Verfügung, welche das gleiche Ergebnis liefern.

Beginnen wir mit ein paar De nitionen, die für die folgende Aussage über die Strategie des Verkäufers notwendig sind:

Definition 1 [Abbildung in dieser Leseprobe nicht enthalten]

rv ist somit der relative Abstand von ev zu uH und legt fest, wieviel Betrügen seitens des Verkäufers möglich ist.

De nition 2 [Abbildung in dieser Leseprobe nicht enthalten] bezeichnet 〈x〉 die kleinste nicht-negative Zahl, die gerade nicht kleiner ist als x. (also z.B. bei [Abbildung in dieser Leseprobe nicht enthalten])

De nition 3 Die Strategie ρv des Verkäufers ist gegeben durch:

1. [Abbildung in dieser Leseprobe nicht enthalten]. Also verkaufe bei hoher Qualität zum Preis ev , und . . .
2. für jedes k ∈ N, nach 〈krv 〉 Realisationen von θH , verkaufe das nächste [Abbildung in dieser Leseprobe nicht enthalten] für ev um die Anzahl der verkauften [Abbildung in dieser Leseprobe nicht enthalten]'s zum Preis ev auf k zu erhöhen. In jeder anderen Situation [Abbildung in dieser Leseprobe nicht enthalten].

Vereinfacht gesprochen wählt der Verkäufer immer den Preis ev bei hoher Qualität und den niedrigen Preis uL bei niedriger Qualität, ausser er hat durch den bisherigen Verkauf genug Ruf aufgebaut, dass er niedrige Qualität zum hohen Preis verkaufen kann. Dies ist natürlich nur möglich, da der Verkäufer für hohe Qualität nicht den vollen Preis, sondern nur [Abbildung in dieser Leseprobe nicht enthalten] verlangt.

Behauptung 1 [Abbildung in dieser Leseprobe nicht enthalten] , ρv is optimal.

Beweis. Betrachten wir Formel (3) mit der der Käufer seine Erwartung über den zukünftigen Nutzen bewertet, nachdem der Verkäufer betrogen hat:

Abbildung in dieser Leseprobe nicht enthalten

Anhand dieser Formel kann gezeigt werden, dass selbst nach einem Betrug, πv nicht kleiner als ev wird und somit der Käufer immer kaufen wird.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Durchschnittsnutzenverlauf für ev .

Anhand der Abbildung kann man dies sehr gut für den Fall [Abbildung in dieser Leseprobe nicht enthalten] und [Abbildung in dieser Leseprobe nicht enthalten] erkennen. Der Durchschnittsnutzen πv fällt nach jedem Betrug zurück auf 1, 75, jedoch verhindert die Strategie ρv , dass der Verkäufer zu häu g betrügt.

Gleichzeitig kann man den erwarteten Pro t des Verkäufers nach t Perioden mit folgender Gleichung beschreiben,

Abbildung in dieser Leseprobe nicht enthalten

welcher nachūstrebt, wenn [Abbildung in dieser Leseprobe nicht enthalten].

Somit haben wir gezeigt, dass der Verkäufer im Fall ohne Abzinsung jede beliebige Preiskombination aus einem Preis gröÿer oder gleich dem Pooling- preis in Verbindung mit uL verwenden kann, um eine optimale Strategie zu entwickeln. In jeder dieser Strategien hat der Preis ev eine zugehörige Anzahl von Betrugsfällen, die durch ρv de niert und deren Anzahl so begrenzt ist, dass der Käufer immer kauft.

3.5 Fall mit Abzinsung

Beim Fall mit Abzinsung hat der Verkäufer eine strikte Präferenz für heuti- gen Nutzen und es wird im Folgenden gezeigt werden, dass die Strategie aus dem Fall ohne Abzinsung nicht optimal ist. Wichtig hierbei ist, dass die Präferenz für heutigen Nutzen nicht zu groÿ sein darf, weil es sonst zu einer kurzsichtigen Handlung des Verkäufers kommen kann, bei der er seinen Ruf ruiniert, den Durchschnittsnutzen πv zu weit nach unten treibt und der Käufer nicht mehr kaufen wird. Ein zweiter wichtiger Hinweis bezieht sich auf die Anfangserwartung Av des Käufers, welche in diesem Fall nicht zu hoch sein sollte, da wir uns nicht auf die optimale Ausbeutung der Anfangs- erwartung seitens des Verkäufers konzentrieren wollen, sondern auf der Suche nach einem langfristigen Gleichgewicht mit 2 Preisen im Fall mit Abzinsung sind.

Behauptung 2 Wenn σ eine Strategie mit [Abbildung in dieser Leseprobe nicht enthalten] ist, dann ist σ nicht optimal.

Angenommen der Verkäufer will zum Preis [Abbildung in dieser Leseprobe nicht enthalten] verkaufen, so ist es nicht schwierig zu zeigen, dass der Verkäufer sich strikt besser stellen kann, wenn er alle Entscheidungen pt(ht) = ev durch [Abbildung in dieser Leseprobe nicht enthalten] ersetzt. Den aufgrund seiner Präferenz für heutigen Nutzen ist es sinnvoll, immer den maximalen Gewinn abzuschöpfen, als erst rv mal hohe Qualität zum Preis ev zu verkaufen um dann einmal θL für ev zu verkaufen. Somit wird der Verkäufer in jedem Fall auf lange Sicht die Preise uL und uH wählen und sich somit die ehrliche Preissetzung durchsetzen.

Behauptung 3 Die einzige Lösung für den Fall mit Abzinsung bei unendlichem Zeithorizont sind die Screeningpreise uL und uH .

Beweis Der Beweis folgt aus den folgenden Bedingungen:

1.[Abbildung in dieser Leseprobe nicht enthalten]
2. [Abbildung in dieser Leseprobe nicht enthalten]ist nicht optimal und
3. [Abbildung in dieser Leseprobe nicht enthalten]darf nicht gröÿer als uH sein, weil sonst der Käufer nicht mehr kaufen würde.

3.6 Alternative Lernregeln

Die in dieser Arbeit betrachtete Lernregel für µ und π kann als ein Extrembeispiel für adaptive Lernregeln gesehen werden und die folgenden zwei Abwandlungen zeigen, dass auch für weniger extreme Beispiele die Hauptaussage ihre Gültigkeit behält.

Bei den η-Regeln werden die Beobachtungen unterschiedlich gewichtet. So wird die aktuelle Beobachtung voll gewichtet, jedoch gehen alle vergangenen (t − 1) Beobachtungen nur noch mit dem Gewicht ηt in die Erwartungs- Matrix b ein.

Abbildung in dieser Leseprobe nicht enthalten

In dieser Arbeit wurde die η = 1 Regel verwendet, während z.B. bei der 5 Verwendung der η = 0 Regel ein tit-for-tat Spiel beschrieben worden wäre.5

Entscheidend jedoch bei allen η Regeln ist, dass bei jeder η Regel mit [Abbildung in dieser Leseprobe nicht enthalten], die minimale Anzahl der zu verkaufenden θH's gröÿer ist, als bei der [Abbildung in dieser Leseprobe nicht enthalten] Regel, bevor man ein θL zu einem höheren Preis verkaufen kann. Der Verkäufer kann somit bei [Abbildung in dieser Leseprobe nicht enthalten] weniger betrügen , als bei η = 1.

Eine zweite Abwandlung der verwendeten Lernregel sind die N-Regeln,

Abbildung in dieser Leseprobe nicht enthalten

bei denen[Abbildung in dieser Leseprobe nicht enthalten]dasTuplederletztenkBeobachtungen zum Preis ev sind, welche von und bis einschliesslich der Periode t zurückgezählt wurden. Mt ist die Gesamtanzahl der bisherigen Beobachtungen zum Preis ev bis zur aktuellen Periode t.

Bei der N Regel ist somit das Gedächtnis des Käufers beschränkt, da er sich nur an die letzten N Beobachtungen errinnern kann und diese gleich gewichtet. Für [Abbildung in dieser Leseprobe nicht enthalten] haben wir die in dieser Arbeit verwendete Regel und für N = 1 haben wir wieder ein tit-for-tat Spiel.

4 Schluÿbemerkung

Die Arbeit von Ernst-Ludwig von Thadden kombiniert eine einfache Lern- regel des Käufers mit einer sich wiederholenden Kaufaktion mit asymme- trischen Informationen. Das zentrale Ergebnis seiner Arbeit ist, dass diese auf den ersten Blick nicht strategisch rationale Kaufregel trotz ihrer Einfach- heit das gleiche Ergebnis liefert wie eine Lernregel mit rationaler Erwartungs- bildung und vollständigen Informationen. Die Lernregel ist somit a bit more realistic and a bit (or even a lot) less rational gemäÿ der Forderung von Bray und Kreps (1987).

Man sollte die Arbeit von von Thadden jedoch nicht als Au orderung sehen, dass sich Individuen nicht mehr rational verhalten sollten, sondern von Thadden überprüft die Auswirkungen einer vereinfachten Lernregel, mo- tiviert durch die vielfältigen Beweise aus der Soziologie, Psychologie und experimenteller Mikroökonomie, dass Individuen sich nicht immer rational verhalten.

Dass kein Modell aufgrund seiner getro enen Annahmen die Realität perfekt abbilden kann, ist jedem bewuÿt. So sollte man jedoch die Arbeit von von Thadden als Au orderung sehen, die Grundannahme rational agierender Individuen in Frage zu stellen. Individuen haben durchaus Anreize sich nicht rational zu verhalten. Sie verfügen nicht immer über die Möglichkeit und die Zeit, vollständige Informationen und Erwartungen zu bilden. Das ist unter bestimmten Umständen auch nicht notwendig, da genau dieses Modell zeigt, dass ein nicht strategisches Verhalten sie nicht zwangsläu g schlechter stellen muss. (Oder sie wollen dies auch gar nicht, da andere Kaufmotive vorliegen.)

Literatur

[1] Akerlof, George A. (1970), The Market for Lemons: Quality Uncer- tainty and the Market Mechanism, Quarterly Journal of Economics, 84, 488-500.

[2] Bray, M., and Kreps, D. M. (1987) Rational Learning and Rational Expectations in: Feiwel, G. R. (Hrsg.): Arrow and the Ascent of Modern Economic Theory, Houndsmills, London: MacMillan & Co.

[3] Camerer, Colin F., Teck-Hua Ho and Juin Kuan Chong (2004) Be- havioural Game Theory: Thinking, Learning and Teaching, in: Huck, Ste en (Hrsg.): Advances in understanding strategic behaviour game theory, experiments and bounded rationality, Palgrave Macmillan: 120- 121.

[4] Ellison, Glenn (2006) Bounded Rationality in Industrial Organization, in: Burnell, Richard (Hrsg.): Advances in Economics and Econometrics: Theory and Applications, Cambridge University Press.

[5] Fudenberg, Drew and Tirole, Jean (1993) Game Theory, The MIT Press: 48-49.

[6] Gabler Wirtschaftslexikon (2004) Homo Oeconomicus, 15. Au age, Gabler, Wiesbaden: 1457.

[7] Gibbons, Robert (1992) A Primer in Game Theory, Financial Times Prent.Int: Preface xii.

[8] Gross, Peter (1994) Die Multioptionsgesellschaft, 10. Au age, Suhrkamp.

[9] Hart, Oliver and John Moore (1988), Incomplete Contracts and Rene- gotiation Econometrica 56, 755-785.

[10] Heal, Geo rey (1976), Do Bad Products Drive out Good?, Quarterly Journal of Economics, 90, 499-502.

[11] Niejahr, Elisabeth (2007) Der überforderte Verbraucher, in: DIE ZEIT, Nr. 45: 23-24.

[12] Simon, Herbert (1955), A Behavioral Model of Rational Choice, Quar- terly Journal of Economics, 69, 99-118.

[13] Thadden, Ernst-Ludwig (1992), Optimal pricing against a Simple learn- ing Rule, Games and Economic Behavior, 4, 627-649.

[14] Wilson, Robert (1985), Reputations in Games and Markets, in: Roth, Alvin E. (Hrsg.): Game-Theoretic Models of Bargaining, Cambridge University Press: 27-62.

[...]


1 Ein Aussage, die sich auch bei Gross (1994) nden lässt.

2 Die verwendete Werteinheit wie z.B. Euro oder Dollar ist für dieses Beispiel ohne weitere Relevanz, da die Logik davon unabhängig ist.

3 Auswertung des Erscheinungsjahrs der verö entlichten Texte mit dem Keyword bound- ed rationality auf http://www.repec.org vom 18.12.2007

4 Einen Preis größer als Ū würde der Käufer nicht akzeptieren und mehrere Preise sind wegen des fehlenden screenings und signalings unmöglich.

5 eine tit-for-tat -Strategie befolgt 4 Anweisungen: sei nett, provozierbar, versöhnlich und durchschaubar. Auf unseren Fall angewendet würde das bedeuten: Glaube dem Verkäufer, dass er einen berechtigten Preis verlangt, aber sollte einmal der Preis nicht berechtigt sein, dann kaufe zu diesem Preis nie mehr.

19 von 19 Seiten

Details

Titel
Optimal Pricing against a simple learning rule
Hochschule
Ruprecht-Karls-Universität Heidelberg
Veranstaltung
Seminar: Behavioral Industrial Organization
Note
2,0
Autor
Jahr
2008
Seiten
19
Katalognummer
V131519
ISBN (Buch)
9783640372249
Dateigröße
600 KB
Sprache
Deutsch
Anmerkungen
Seminararbeit zum Thema: Strategisches Denken und Wettbewerbspolitik.
Schlagworte
optimal pricing, spieltheorie, von Thadden, Universität Heidelberg, Rational Choice, bounded rationality, strategisches denken und wettbewerbspolitik, seminararbeit, christoph dyllick-brenzinger
Arbeit zitieren
Christoph Dyllick-Brenzinger (Autor), 2008, Optimal Pricing against a simple learning rule, München, GRIN Verlag, https://www.grin.com/document/131519

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Optimal Pricing against a simple learning rule



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden