Inhaltsverzeichnis
Abk ürzungsverzeichnis. 4
1. Einleitung. 5
2. Einführung in die Warenkorbanalyse 6
2.1 Ursachen und Bestimmungsfaktoren des Kaufverbunds 8
2.2 Modelle der Warenkorbanalyse 11
2.2.1. Explorative Ansätze 11
2.2.2. Explanative Ansätze. 12
2.3 Theoretische Grundlagen der Warenkorbanalyse. 14
2.3.1. Das diskrete Wahlmodell und die Nutzenmodellierung 14
2.3.2. Die Verteilung der Fehlerterme: Probit und Logit. 16
3. Konsumentenheterogenität in der Warenkorbanalyse 19
3.1 Arten der Heterogenität 19
3.2 Modellierung von Heterogenität 21
3.3 Erweiterung des Logit-Modells 22
4. Die Modellierung der Wahl eines Warenkorbes. 25
4.1 Der Modellansatz 25
4.1.1. Modellspezifikation 28
4.1.2. Erwartete Ergebnisse 29
4.2 Einbeziehung von Heterogenität in das Warenkorbmodell 30
4.2.1. Das homogene gemischte Modell mit Zufallseffekt. 31
4.2.2. Das heterogene gemischte Modell 32
5. Daten und Operationalisierung 33
5.1 Datenbasis. 33
5.1.1. Beschreibung der Kategorien. 35
5.1.2. Datenaufbereitung. 36
5.2 Schätzung der Parameter 38
5.3 Ergebnisse aus der Parameterschätzung 41
5.3.1. Schätzergebnisse für das homogene gemischte Logit-Modell. 41
5.3.2. Schätzergebnisse für das homogene gemischte Logit-Modell mit
Zufalleseffekt 43
5.3.3. Heterogenes nichtlineares gemischtes Logit-Modell. 48
5.4 Kritische Anmerkungen zur Datenanalyse 51
5.5 Zusammenfassung der Ergebnisse und Schlussfolgerung 52
2
6. Fazit und Ausblick 53
Literaturverzeichnis 56
Anhang. 60
Code zur Datenaufbereitung 62
Code zur Datenanalyse 85
3
Abkürzungsverzeichnis
d.h. das heißt
EB-Schätzer Empirischer Bayes Schätzer
EM Expectation-Maximization
et al. et alii
vgl. vergleiche
z.B. zum Beispiel
4
1. Einleitung
Handelsunternehmen sind daran interessiert, ihren Kunden individuell zugeschnittene Angebote zu machen und somit die Kunden an das jeweilige Unternehmen zu binden. Zusätzlich sollen Marketing-Maßnahmen effektiv sein und so den gesamten Gewinn des Handelunternehmens maximieren. Um diese Zielsetzung zu realisieren ist es notwendig, über genügend Informationen in Form von Daten über den einzelnen Kunden zu verfügen. Dies geschieht heutzutage vielfach über Kundenkarten wie Payback oder HappyDigits, die meist mit integriertem Bonussystem einerseits Kunden durch Vorteile beim Einkauf an sich binden und andererseits wichtige Daten erfassen, die Auskünfte über das Kaufverhalten liefern (vgl. Boztuğ, Silberhorn 2006). Anhand dieser Daten können Kundensegmente gebildet werden, die darüber Aufschluss geben, ob eine Präferenz für bestimmte Produkte oder Verbünde von gemeinsam gekauften Produkten vorliegen. Diese Informationen können dann beispielsweise für gezielte Marketing-Aktionen zur Umsatzsteigerung und Kundenbindung oder aber zur Sortimentsoptimierung verwendet werden (vgl. ebenda). Denn anhand der Kaufgeschichte der Konsumenten kann die Reaktion auf Marketing-Maßnahmen wie z.B. Preissenkungen untersucht werden. An diesen Informationen sind Hersteller und Händler gleichermaßen interessiert. Hersteller benötigen diese Informationen, um ihre Erlöse in einer Produktkategorie zu maximieren oder eine dominante Marktstellung in einer oder mehreren Kategorien zu erreichen (vgl. Klapper 2000). Ziele der Händler sind beispielsweise die Maximierung der Absätze bzw. der Gewinne in einer Produktkategorie.
In dieser Arbeit wird eine Warenkorbanalyse auf Kategorienebene durchgeführt, die Kaufentscheidungen in mehreren Kategorien simultan betrachtet und die Abhängigkeiten zwischen den Kategorien berücksichtigt. Dabei wird untersucht, ob Marketing-Mix-Variablen, haushaltsspezifische Variablen und die Beziehung zwischen den Kategorien einen Einfluss auf die Kaufwahrscheinlichkeit in einer Kategorie haben. Ein wesentlicher Untersuchungsgegenstand dieser Arbeit ist die Heterogenität von Konsumenten, die in die Warenkorbanalyse einbezogen werden muss, da sonst verzerrte Parameterschätzungen resultieren.
In Kapitel 2 erfolgt eine generelle Einführung in die Warenkorbanalyse. Dabei werden Ursachen für den gemeinsamen Kauf von Produkten aus verschiedenen Kategorien aufgezeigt und mögliche Modellierungsansätze vorgestellt. Weiterhin wird der Leser in die
5
theoretischen Grundlagen des Logit-Modells eingeführt, das auf einem diskreten Wahlmodell und einem Nutzenmodell basiert. Das dritte Kapitel widmet sich dann der Heterogenität der Konsumenten. Hier werden die verschiedenen Arten der Heterogenität vorgestellt, sowie Möglichkeiten der Einbeziehung von Heterogenität in ein Warenkorbmodell. In Kapitel 4 wird der in dieser Arbeit verwendete Modellansatz vorgestellt, in dem schrittweise eine Einbeziehung von Heterogenität erfolgt. Kapitel 5 umfasst den empirischen Teil der Arbeit, in dem die verwendeten Daten beschrieben werden, die Datenaufbereitung erläutert wird und die Ergebnisse aus der Parameterschätzung vorgestellt werden. Das sechste Kapitel liefert ein zusammenfassendes Fazit sowie einen Ausblick.
2. Einführung in die Warenkorbanalyse
Um Handlungsanweisungen für das Marketing-Management ableiten zu können, ist es notwendig, das Kauf- und Entscheidungsverhalten der Konsumenten zu verstehen. Die Modellierung des Entscheidungsverhaltens erfolgt in der Regel mithilfe der Warenkorbanalyse. Die Warenkorbanalyse umfasst Methoden zur Untersuchung der Zusammensetzung eines Bündels verschiedener Produkte (den Warenkorb oder auch Kaufverbund), die von einem Haushalt gemeinsam während eines einzelnen Einkaufs erworben wurden (vgl. Russell, Petersen 2000). Im Mittelpunkt der Analyse steht die Aufdeckung und Erklärung von Zusammenhängen zwischen den gemeinsam gekauften Produkten. Dabei können verschiedene Entscheidungen des Konsumenten modelliert werden: die Kaufentscheidung an sich, die Markenwahl, die Mengenwahl, die Geschäftswahl oder mehrere Wahlentscheidungen kombiniert.
Während eines einzelnen Einkaufs trifft der Konsument eine Auswahl an Produkten aus verschiedenen Produktkategorien, das heißt, es wird z.B. Mehl und Badreiniger aus den Kategorien „Backzutaten“ und „Reinigungsmittel“ zusammen gekauft. Eine Kategorie bezeichnet eine Menge von Produkten, die das gleiche Bedürfnis eines Konsumenten erfüllen und ihm einen gleich hohen intrinsischen Nutzen liefern, relativ zum Gesamtnutzen (vgl. Russell et al. 1999). Die Waren innerhalb einer Produktkategorie sind für den Konsumenten somit gleichwertige Alternativen zur jeweiligen Bedürfnisbefriedigung. Aus der Sicht des Konsumentenverhaltens dient die Kategorisierung dazu, die Kaufentscheidungen für den Konsumenten zu vereinfachen (vgl. Russell et al. 1999). Aus der Fülle der angebotenen Produkte werden die Artikel
6
zusammengefasst, die ein ähnliches Bedürfnis befriedigen. Diese Einteilung ist jedoch flexibel und wird geleitet von den jeweiligen Zielen und Motiven des Konsumenten, wie z.B. der Absicht, sich gesund zu ernähren (vgl. Russell et al. 1999). Ferner ist der Kaufentscheidungsprozess situationsabhängig, d.h. die Präferenz eines Konsumenten für eine bestimmte Produkteigenschaft hängt von dem jeweiligen Kontext ab. So beeinflusst beispielsweise die Tatsache, dass ein Konsument eine Party veranstalten möchte, die Kaufentscheidung bei Snacks (salzig, süß, zum Dippen, einfach zu verzehren, geeignet für den Verzehr auf einer Party).
Eine grundlegende Annahme der Warenkorbanalyse ist, dass die Kaufentscheidungen innerhalb einer einzelnen Kategorie von den Entscheidungen in allen anderen Kategorien abhängig sind. Auch in der Realität sind die Kaufentscheidungen der Konsumenten in verschiedenen Kategorien nicht unabhängig voneinander, denn die Entscheidung, in einer Kategorie zu kaufen wird durch andere Kategorie-Entscheidungen beeinflusst. Die Wahrscheinlichkeit, ein Produkt in einer Kategorie zu wählen, wird beeinflusst durch die Anwesenheit von Produkten in anderen Kategorien. Diese Art von Kaufentscheidungen, bei denen mehrere Produkte gekauft werden und bei denen der Kaufentscheidungsprozess für ein Produkt von der Präsenz eines anderen Produktes in einer anderen Kategorie beeinflusst wird, wird als multi-kategoriell bezeichnet (vgl. Russell et al. 1997). Russell et al. (1997) beschreiben ein multiples Kategorieentscheidungsproblem als eine Auswahl von Produkten aus verschiedenen Kategorien für eine gegebene Menge an Alternativen innerhalb einer Kategorie. Dabei kann der Konsument seine Kaufentscheidung in allen, in keiner oder in einer beliebigen Anzahl an vorhandenen Kategorien treffen (so genannte „pick-any“ Wahlsituation, vgl. Russell, Petersen 2000). Die Herausforderung für die Warenkorbanalyse ist nun, herauszufinden, ob Beziehungen zwischen den Kaufentscheidungen in verschiedenen Kategorien tatsächlich bestehen und wie Marketing-Manager diese Abhängigkeiten nutzen können um geeignete Strategien zu entwickeln (Russell, Petersen 2000). Es müssen also mit Hilfe der Warenkorbanalyse Faktoren gefunden werden, die Einfluss auf die Kaufwahrscheinlichkeit haben und die wiederum vom Management beeinflusst werden können. Wenn die bestehenden Abhängigkeiten bekannt sind, können z.B. Marketing-Mix-Variablen dazu genutzt werden, die Kaufentscheidung der Konsumenten, die Markenwahl und die Mengenwahl in jeder Kategorie zu beeinflussen.
7
Die Annahme der Abhängigkeit der Kaufentscheidungen ist besonders relevant für die Sortimentoptimierung innerhalb eines Handelsgeschäftes. So kann eine
Produktentscheidung für sich betrachtet sinnvoll sein, in Verbindung mit anderen Produkten kann sie sich jedoch als schädlich für den Händler herausstellen. Kaum profitable Produkte sollten z.B. nicht aus dem Sortiment entfernt werden, wenn sie häufig gemeinsam mit sehr profitablen Produkten gekauft werden (vgl. Boztuğ, Silberhorn 2006).
Doch wie entstehen eigentlich die Abhängigkeiten zwischen verschiedenen Kategorien? Diese Frage versucht der folgende Abschnitt zu beantworten, indem bisherige Forschungsansätze zu dem Thema Kaufverbund vorgestellt werden, die mögliche Ursachen und Bestimmungsfaktoren eines Kaufverbunds liefern.
2.1 Ursachen und Bestimmungsfaktoren des Kaufverbunds
In der Marketingforschung wurden bislang verschiedenste Erklärungen für multi-kategorielle Kaufentscheidungen abgegeben. Frühe Ansätze wie Böcker (1974, 1975) erklären den Kaufverbund - den Warenkorb - mit einem Bedarfsverbund und einem Nachfrageverbund. Zwischen den einzelnen Produkten besteht ein innerer Bedarfsverbund, wenn sie gemeinsam verbraucht werden. Demnach werden diese Produkte auch gemeinsam nachgefragt. Weiterhin sind die Konsumenten aus Bequemlichkeits- und Zeitgründen oder aber aufgrund von Marketingaktionen außerhalb des Geschäftes bestrebt, möglichst viel in einem einzigen Geschäft nachzufragen („one-stop-shopping“), was zu einem Nachfrageverbund führt. Jedoch wird nur ein Teil der im Nachfrageverbund enthaltenen Güter tatsächlich gekauft, der so genannte kaufwirksame Nachfrageverbund. Der Kaufverbund letztendlich umfasst alle Güter, die während eines einzelnen Einkaufs erworben wurden. Hierbei verstärken zusätzlich Marketingaktionen innerhalb des Geschäfts den kaufwirksamen Nachfrageverbund. Während die Kaufdaten den Kaufverbund und somit das beobachtbare Verhalten tatsächlich abbilden können, sind der Bedarfs- und Nachfrageverbund nicht beobachtbar und stellen somit einen theoretischen Erklärungsansatz für das Kaufverhalten dar.
Neuere Ansätze verbinden die Warenkorbanalyse mit dem Verhalten der Konsumenten. So untersuchten Bell und Lattin (1998) anhand der Anschaffungsneigung von Konsumenten, wie die Wahl der Einkaufsstätte durch die Preisstrategie des Geschäftes über mehrere Produktkategorien beeinflusst wird. Sie fanden heraus, dass Konsumenten z.B. aufgrund von Zeitdruck entweder Haupteinkäufe tätigen, in denen sie alle Bedürfnisse
8
während eines einzigen Einkaufs befriedigen oder häufiger kleine Einkäufe zur Ausnutzung von kurzfristigen Preissenkungsaktionen durchführen. Kunden mit Großeinkäufen haben in der Regel eine größere Anzahl an Produkten im Warenkorb, wodurch ein stärkerer Zusammenhang zwischen den einzelnen Produktkategorien existiert.
Eine weitere verhaltenstheoretische Erklärung für den gemeinsamen Kauf in verschiedenen Produktkategorien kann z.B. Bequemlichkeit sein, denn ein einziger Haupeinkauf ist bequemer als mehrere kleine Einkäufe (vgl. Boztuğ, Silberhorn 2006). Eine finanzielle Restriktion kann ebenso dazu führen, dass Kategorien miteinander korrelieren, wenn z.B. nur bestimmte, preiswerte Produkte gekauft werden können (Song, Chintagunta 2004). Die kreuzkategorielle Abhängigkeit wird in diesen Erklärungsansätzen jedoch nicht auf der Konsumentenebene erklärt, denn der Haushalt selbst sieht die Käufe in den verschiedenen Kategorien in der Entscheidungssituation als unabhängig voneinander.
Andere Ansätze gehen davon aus, dass die Präferenz der Konsumenten maßgeblich ist für Korrelationen zwischen Kategoriekäufen und diese im Entscheidungsprozess eines jeden Konsumenten auftauchen. Singh, Hansen und Gupta (2005) zeigen, dass das Kaufverhalten hauptsächlich durch die Präferenz eines Konsumenten für die Eigenschaftsausprägungen eines Produktes bestimmt wird. Produkteigenschaften sind z.B. Preis, Verpackungsgröße oder Markenname, die jeweils verschiedene Ausprägungen aufweisen. Diese Eigenschaften können gleichzeitig mehrere Produkte in verschiedenen Kategorien besitzen. Somit besteht eine Präferenz für bestimmte Produkteigenschaften über alle Kategorien und bestimmt neben anderen Variablen einen Großteil des Kaufprozesses. Zum Beispiel sind Konsumenten mit einer Präferenz für gesundes Essen darauf bedacht, Bio- oder fettreduzierte Produkte über verschiedene Kategorien hinweg zu kaufen.
Russell et al. (1999) gehen davon aus, dass Korrelation zwischen verschiedenen Kategorien unter drei Umständen entstehen kann. Erstens empfindet der Konsument die Artikel aus unterschiedlichen Kategorien als Substitute zur Erfüllung eines Bedürfnisses. Beispielsweise können Bücher und Fernsehen als Alternativen für die Unterhaltung gesehen werden, wobei jedoch nur eines gewählt wird. An zweiter Stelle nennen die Autoren verhaltensspezifische Variablen, wie Präferenzen für Produkteigenschaften und Lernen aus Erfahrung. So kann die Erfahrung mit einem Produkt einer Marke die Kaufentscheidung für weitere Produkte der Marke in anderen Kategorien beeinflussen. Als dritter Grund für kategorieübergreifende Korrelationen wird die Produktbündelung
9
genannt, bei der mehrere Artikel zusammen ein Bedürfnis des Konsumenten erfüllen. Ergebnisse der Produktbündelung können z.B. der gemeinsame Kauf von Computer Hard-und Software oder ein Einkaufskorb in der Drogerie sein.
In Anlehnung an Manchanda et al. (1999) wird in dieser Arbeit von hauptsächlich drei Gründen für Abhängigkeiten beim gemeinsamen Kauf verschiedener Kategorien ausgegangen: Komplementarität, Heterogenität der Konsumenten und Zufallseffekte. Die einzelnen Ursachen werden im Folgenden schrittweise erklärt.
Komplementarität:
Die Kaufentscheidungen zwischen den einzelnen Kategorien sind deshalb voneinander abhängig, weil die Produktbeziehung komplementär oder substitutiv sein kann, d.h. Produkte aus unterschiedlichen Kategorien werden entweder aus einem gemeinsamen Zweck heraus erworben (z.B. Kaffe und Kaffeesahne) oder aber sie sind untereinander ersetzbar (z.B. Kaffee und Tee). Daneben können Produktkategorien eine unabhängige Beziehung aufweisen, wenn sie in keinem direkten Zusammenhang zueinander stehen, wie z.B. Tee und Toilettenpapier (vgl. Hildebrandt, Boztuğ 2007). Allerdings ist zwischen Kauf- und Konsumkomplementarität zu unterscheiden, d.h. zwischen dem gemeinsamen Kauf und dem gemeinsamen Konsum. Marketingaktionen sollen eine Kauf-Komplementarität zwischen zwei Kategorien bewirken, sodass z.B. eine Preisaktion in der einen Kategorie die Kaufentscheidung in einer anderen Kategorie beeinflusst. Die Kauf-Komplementarität wäre somit nicht nur beobachtbar sondern auch kontrollierbar. Da aber die Konsumabsicht den Kauf beeinflusst und somit der Kaufverbund auch von der Absicht des gemeinsamen Konsums abhängt, muss dieser bei der Modellierung eines Kaufverbunds berücksichtigt werden.
Heterogenität:
Die Heterogenität der Konsumenten zeigt sich in verschiedenen Präferenzen hinsichtlich Produkteigenschaften, in ihren Kaufmotiven und dem Nutzen, den ihnen eine Alternative stiftet. Ferner gibt es Unterschiede in der Reaktion auf Marketingaktionen (vgl. Boztuğ, Silberhorn 2006). Bestehen die Präferenzen, Motive und Reaktionen über die Produktkategorien hinweg, so entstehen Abhängigkeiten zwischen den Kategorien. Demographische Merkmale, die einen Teil der Unterschiede zwischen Konsumenten erklären können, sind direkt beobachtbar, während die Reaktion auf Marketingaktionen indirekt über das Kaufverhalten beobachtet werden kann. Präferenzen und Motive können
10
zwar über Fragebögen erfragt werden, sind allerdings nicht messbar zu beeinflussen. Konsumentenheterogenität wird im dritten Kapitel ausführlich betrachtet.
Zufallseffekte:
Zusätzlich zu den zwei bisher betrachteten Ursachen für den gemeinsamen Kauf von verschiedenen Kategorien bestehen nicht beobachtbare Residuen, die alle restlichen Ursachen für Verbundkäufe zusammenfassen, die noch nicht mit den ersten beiden erfasst wurden. Diese Zufallseffekte beinhalten beispielsweise verhaltenstheoretische Motive wie das Lernen aus Erfahrung, Produktbündelung seitens der Händler (vgl. Russell et al. 1999), Bequemlichkeit, Gewohnheit und Zeitdruck, die Ladengestaltung und die Anordnung der Produkte im Regal (vgl. Boztuğ, Silberhorn 2006).
2.2 Modelle der Warenkorbanalyse
Zahlreiche Wissenschaftler haben sich bereits mit der Warenkorbanalyse beschäftigt, um den gemeinsamen Kauf von Produkten aus verschiedenen Kategorien zu erklären die Struktur und die Stärke der Beziehungen zwischen den Kategorien zu untersuchen. Neben den frühen bivariaten Betrachtungsweisen (z.B. Böcker 1975, 1978) orientieren sich neuere Untersuchungen eher auf die Analysemethoden (vgl. Hildebrandt, Boztuğ 2007). Dieser Abschnitt gibt einen kurzen Überblick über den Forschungsstand auf dem Gebiet der Warenkorbanalyse und zeigt mögliche Modellierungsansätze auf.
Grundsätzlich lassen sich die bisherigen Untersuchungen zu den Zusammenhängen zwischen verschiedenen Produktkategorien in explorative und explanative Ansätze unterteilen (vgl. Boztuğ, Silberhorn 2006; Hildebrandt, Boztuğ 2007). Beide Forschungsrichtungen sind an der methodischen Weiterentwicklung der früheren stark qualitativ geprägten Analysen auf dem Gebiet der Verbundanalyse (beispielsweise Böcker 1975) interessiert. Jedoch unterscheiden sie sich in ihrer Zielsetzung, die in den beiden folgenden Abschnitten jeweils kurz dargelegt wird.
2.2.1. Explorative Ansätze
Explorative Ansätze wollen die versteckten Abhängigkeitsstrukturen in Warenkörben aufdecken und für Marketingmanager anschaulich und aussagekräftig verdichten (vgl. Boztuğ, Silberhorn 2006). Konventionelle explorative Modelle sind zum Beispiel Assoziationsmaße, Assoziationsregeln, Clusteranalyse und Multidimensionale Skalierung. Neuere Ansätze stellen dagegen Vektor-Quantisierung, eine moderne Form der
11
Clusteranalyse, und Collaborative Filtering, das basierend auf dem Verhalten von Personen das Verhalten einer Zielperson vorhersagt, dar. Zur weiteren Darstellung dieser Modelle sei an dieser Stelle auf Boztuğ und Silberhorn (2006) verwiesen, die einen umfassenden Überblick über die verschiedenen Methoden in der Warenkorbanalyse geben. Nachteilig an den explanativen Ansätzen ist, dass diese meist keine Marketing-Mix-Variablen berücksichtigen (vgl. Hildebrandt, Boztuğ 2007).
2.2.2. Explanative Ansätze
Explanative Modelle hingegen untersuchen die Einflüsse von kontrollierbaren Marketingvariablen auf die Kaufwahrscheinlichkeit von Produkten. Dabei sollen kategorieübergreifende Effekte identifiziert und quantifiziert werden (vgl. Boztuğ, Silberhorn 2006). Modelle dieser Art sind z.B. Logit- und Probit-Modelle, die in Abschnitt 2.3.2 ausführlicher betrachtet werden. Beide Modelle basieren auf dem Prinzip der Nutzenmaximierung und unterscheiden sich lediglich in der Definition der Fehlerterme. Obwohl auch Kombinationen von explorativen und explanativen Ansätzen möglich sind (wie z.B. Boztuğ, Reutterer 2006) werden in dieser Arbeit aufgrund der quantitativen Ausrichtung nur Modelle im Rahmen der explanativen Ansätze behandelt. Innerhalb der explanativen Ansätze können folgende Entscheidungen der Konsumenten modelliert werden:
• die Kaufentscheidung an sich (Kauf ja/nein) (vgl. z.B. Russell, Petersen 2000; Chib et al. 2002),
• die Markenwahl (z.B. Russell, Kamakura 1997; Ainslie, Rossi 1998),
• die Geschäftswahl (Bodapati, Srinivasan 2001) oder
• mehrere Wahlentscheidungen kombiniert (Deepak et al. 2004; Niraj et al. 2004; Song, Chintagunta 2004).
Einige dieser Warenkorbmodelle seien im Folgenden kurz vorgestellt und dahingehend untersucht, inwieweit die in Abschnitt 2.1 herausgestellten Bestimmungsfaktoren des Kaufverbunds in die Modelle integriert wurden. Für einen umfassenden Überblick über bisherige Modellierungsansätze in der Warenkorbanalyse sei auf Boztuğ, Silberhorn (2006) sowie Seetharaman et al (2005) verwiesen.
Russell und Petersen (2000) modellieren in ihrem Logit-Ansatz die Kaufentscheidung auf der Kategorienebene. Über die ergänzend eingeführte Variable „Kategorie-Loyalität“ soll die Konsumentenheterogenität betrachtet werden. Sie erweitern die bisherigen
12
Warenkorbmodelle durch Techniken aus der räumlichen Statistik und definieren mittels dieser Techniken ein globales Wahlmodell für Warenkörbe. Allerdings betrachten Russell und Petersen (2000) nur wenige Kategorien und unterlassen die Berücksichtigung von Zufallseffekten in ihrer Modellierung.
Niraj, Padmanabhan und Seetharaman (2004) modellieren das Kaufereignis und die Mengenentscheidung über ein zweistufiges bivariates Logit-Modell und lassen asymmetrische Kreuzeffekte zwischen den Kategorien zu. Dieser Ansatz gehört zu den ersten, die mehrere Entscheidungen simultan modellieren. Allerdings lassen Niraj et al. (2004) konsumentenspezifische Merkmale sowie die Zufallseffekte als ein Bestimmungsfaktor für Warenkörbe bei ihrer Modellierung außer Acht.
Song und Chintagunta (2004) betrachten in ihrem komplexen Modell die Kauf- und Mengenentscheidung sowie die Markenwahl und berücksichtigen somit als Erste alle drei Bestimmungsfaktoren (Komplementarität, Heterogenität und Zufallseffekte) des Kaufverbunds in einem Logit-Modell. Jedoch bezieht sich dieser Ansatz nur auf die Konsum-Komplementarität und berücksichtigt aufgrund der Komplexität ebenfalls nur eine geringe Anzahl an Kategorien.
Die Modellierung der Kaufentscheidung kann auch über einen Probit-Ansatz erfolgen, wie bei Manchanda, Ansari und Gupta (1999). Sie lassen zusätzlich noch asymmetrische Korrelationen zwischen den Kategorien zu und finden heraus, dass Komplementarität und Zufallseffekte einen erheblichen Einfluss auf die Kaufentscheidung haben.
Ainslie und Rossi (1998) präsentieren ein hierarchisches Probit-Modell, in dem sie die Markenwahl in verschiedenen Kategorien mit ähnlichen Marketing-Mix-Sensitivitäten der Haushalte über die Kategorien hinweg erklären wollen. Über eine Zerlegung der Varianzkomponenten der Marketing-Mix-Koeffizienten in haushalts-und
kategoriespezifische Komponenten werden signifikante Korrelationen in den Sensitivitäten über Kategorien hinweg geschätzt. Allerdings gehen Ainslie und Rossi von einer Unabhängigkeit der Käufe in verschiedenen Kategorien aus und lassen somit die Beziehung zwischen den Kategorien außer Acht.
Insgesamt kann festgehalten werden, dass es schwierig ist, in Logit-Modellen den Faktor Zufallseffekte zu kontrollieren und zwischen gemeinsamen „Kauf“ und „Nicht-Kauf“ zu unterscheiden. Ferner ist es wichtig, neben der Kauf-Komplementarität auch die
13
Konsum-Komplementarität in einem Modell zu berücksichtigen (vgl. Boztuğ, Silberhorn 2006).
2.3 Theoretische Grundlagen der Warenkorbanalyse
Für ein genaueres Verständnis der Warenkorbanalyse wird nun auf theoretische Grundlagen der Modellierung eingegangen. Dabei werden das allgemeine diskrete Wahlmodell mit dem zugrunde liegenden Nutzenmodell als auch das Logit-Modell vorgestellt.
2.3.1. Das diskrete Wahlmodell und die Nutzenmodellierung
Die Warenkorbmodellierung erfolgt über diskrete Wahlmodelle, in denen die abhängige Variable eine kategoriale Zufallsvariable ist und nur eine endliche oder abzählbar unendliche 1 Anzahl an Werten annehmen kann (vgl. Bleymüller et al. 1998). Diskrete Wahlmodelle beschreiben die Wahl eines Entscheiders zwischen mehreren Alternativen (vgl. Train 2003). Der Entscheidungsträger kann dabei ein Haushalt, ein Individuum oder eine andere Entscheidungsinstitution sein. Alternativen können Marken, Mengen, Handlungsweisen oder sonstige Wahlmöglichkeiten sein. Ziel des diskreten Wahlmodells ist, eine Wahrscheinlichkeit für das Eintreten der betrachteten Ereignisses in Abhängigkeit von den Einflussfaktoren zu erhalten. So kann z.B. die Wahrscheinlichkeit für den Eintritt des Ereignisses „Kauf in der Kategorie i“ in Abhängigkeit von dem Preis der Kategorie i und den Merkmalen von Konsument k modelliert werden.
Wahlmodelle basieren gewöhnlich auf der Nutzenmaximierungstheorie, d.h. auf der Annahme des nutzenmaximierenden Verhaltens des Entscheiders (vgl. Train 2003). Grundidee des Nutzenmodells ist, dass ein Entscheider k aus einer Menge J an Alternativen diejenige Alternative i auswählt, die ihm den höchsten Nutzen U ki stiftet. Dabei werden jeweils zwei Alternativen miteinander verglichen, die Nutzenaussage ist also immer relativ zu einer anderen Alternative zu betrachten. Daraus resultiert ein wesentlicher Aspekt von diskreten Wahlmodellen: für das Verhalten eines Entscheiders als auch für den Forscher zählt nicht der absolute Nutzenwert einer Alternative, sondern nur die Differenz der Nutzenwerte (vgl. ebenda). Da immer Paare von Alternativen miteinander verglichen werden, ist die Wahlwahrscheinlichkeit abhängig von der Nutzendifferenz der
1 Eine Menge ist abzählbar unendlich, wenn sie zwar unendlich viele Elemente besitzt, aber jedem einzelnen Element eine natürliche Zahl zuzuordnen ist (vgl. Bleymüller, Gehlert, Gülicher 1998).
14
Alternativen. Die Wahrscheinlichkeit, dass Konsument k die Alternative i aus einer Menge mit J Alternativen wählt, ist damit gegeben durch (vgl. ebenda)
Ein Konsument wird demnach Alternative i wählen, wenn der Nutzen des Konsumenten für diese Alternative größer ist als der Nutzen für Alternative j, bzw. wenn die Differenz zwischen U ki und U kj positiv ist. Die Wahlwahrscheinlichkeit P ki ergibt sich dann aus den paarweisen Vergleichen der Alternative i mit allen Alternativen aus der Alternativenmenge J.
Die Nutzenmaximierungsannahme ist essentiell für das Wahrenkorbmodell, da sie eine Entscheidungsgrundlage bietet, durch die Entscheidungen erst modelliert werden können. Ohne das Prinzip der Nutzenmaximierung würde es an einer Entscheidungsregel fehlen, die festlegt, unter welchen Bedingungen sich ein Individuum für eine bestimmte Alternative entscheidet. Somit sind die Modellierung und das Verstehen der Zusammensetzung des Nutzens von großer Wichtigkeit. Der Nutzen U besteht neben einer beobachtbaren Komponente auch aus einer nicht beobachtbaren Komponente, sodass der Nutzen nicht definitiv bestimmt werden kann. Der Nutzen einer Alternative i für Konsument k lässt sich somit beschreiben durch U ki = V ki + ε ki . Dabei wird die Funktion V ki als beobachtbare, deterministische Nutzenkomponente bezeichnet und ergibt sich aus V ki =X ki ´β k . Der deterministische Nutzen V ki ist eine lineare Funktion der unabhängigen Einflussvariablen X ki , die die beobachtbaren Eigenschaften der Alternativen (z.B. Preis) abbildet, und deren Einflussstärke β k auf den Nutzen. Die Ausprägung der Einflussvariable kann beobachtet werden, die Parameter β k sind dagegen unbekannt und müssen geschätzt werden. Die zweite Nutzenkomponente ε ki wird auch als Zufallseffekt oder Fehlerkomponente bezeichnet und beinhaltet zufällige, nicht beobachtbare Einflüsse auf den Nutzen. Dies können die individuelle Präferenz eines Konsumenten oder die Sensitivität gegenüber Marketinginstrumenten sein. Mit dieser Nutzendefinition kann Gleichung (1) umgeformt werden zu (vgl. Train 2003):
Dieser Ausdruck beschreibt die Wahrscheinlichkeit, dass die Fehlerdifferenz für jede betrachtete Alternative kleiner ist als der beobachtbare Nutzeneinfluss.
15
Da der Nutzen zufällige Komponenten enthält, kann über das Eintreten eines Ereignisses, wie die Wahl einer Alternative nur eine Wahrscheinlichkeitsaussage getroffen werden. Der Forscher kann mittels der Dichtefunktion (bzw. Wahrscheinlichkeitsfunktion bei diskreten Variablen) f und der Verteilungsfunktion F des Zufallseffekts ε ki bestimmen, wie wahrscheinlich es ist, dass das betrachtete Individuum eine bestimmte Alternative auswählt (vgl. Bleymüller, Gehlert, Gülicher 1998).
2.3.2. Die Verteilung der Fehlerterme: Probit und Logit
Die genaue Form eines diskreten Wahlmodells hängt nun von der Spezifizierung der Verteilung der zufälligen Effekte in der Population ab. Unterschiedliche Verteilungsannahmen ergeben dabei verschiedene Modelle, die nun kurz dargestellt werden.
Werden die Fehlerterme ε ki aus der Nutzengleichung als multivariat normalverteilt angenommen, erhält man das so genannte Probit-Modell. Probit-Modelle werden in der Regel mit Methoden der Markov Chain Monte Carlo Technik geschätzt, die allerdings ernorm aufwendig sind, sowohl in der formalen Umsetzung als auch in der Schätzung (vgl. Hildebrandt, Boztug 2007). Auf der anderen Seite können Zufallseffekte in Probit-Modellen explizit berücksichtigt werden, indem die Fehler entsprechend modelliert werden. Zur beispielhaften Darstellung einer Probit-Modellierung sei an dieser Stelle auf Manchanda et al. 1999 verwiesen.
Das Logit Modell dagegen nimmt an, dass die unbeobachtete Nutzenkomponente iid (independent and identical distributed) und extremwertverteilt ist (vgl. Train 2003). Nach dieser Verteilungsannahme sind die Fehler
• unabhängig voneinander verteilt (keine Korrelation der Fehlerterme)
• identisch verteilt (identische Varianzen, d.h. die Fehlerterme haben bei allen Alternativen die gleiche Verteilung)
• und sie sollen eine bestimmte Verteilungsform aufweisen (meist Extremwertverteilung, auch Weibull-Verteilung genannt).
Sind die Fehlerterme iid extremwertverteilt, so folgen die Fehlerdifferenzen der logistischen Verteilung und es ergibt sich die typische Logit-Wahlwahrscheinlichkeit (zur Herleitung siehe Train 2003):
16
Dabei bezeichnet P k (y=1) die Wahrscheinlichkeit, dass die von Konsument k gewählte Alternative aus einer Menge an Alternativen J der Alternative i entspricht ist. P k (y=0) bezeichnet dann die Gegenwahrscheinlichkeit für dieses Ereignis.
Mit der Annahme der unabhängigen und identischen Verteilung der Fehlerterme gehen jedoch einige Probleme einher, die neben weiteren Schwächen nun im Folgenden kurz dargestellt werden und jeweils anschließend Lösungsansätze aufgezeigt werden. Zum einen impliziert die Verteilungsannahme ein sehr spezielles Substitutionsmuster, das in vielen Fällen unrealistisch sein kann: die Unabhängigkeit von irrelevanten Alternativen (Independence of Irrelevant Alternatives). Unter der IIA-Annahme darf das Gewinnverhältnis zweier Alternativen nicht von den Merkmalen dritter Alternativen beeinflusst werden. Beim Wegfall einer Alternative wird diese proportional substituiert, d.h. die Gewinnchance verteilt sich nun auf die übrigen Alternativen (vgl. Hangartner 2006). Besonders bei ähnlichen Alternativen ist diese Eigenschaft problematisch. Ist die IIA-Eigenschaft jedoch nicht gültig, obwohl sie vorausgesetzt wird, sind unter Umständen die Fehlerterme in der Nutzenfunktion nicht mehr unabhängig voneinander, was zu verzerrten Schätzergebnissen führen kann. Zur weiteren Diskussion der IIA-Eigenschaft sei auf Train (2003) verwiesen. Eine Lösung der Problematik der IIA-Eigenschaft in Verbindung mit sehr ähnlichen Alternativen wurde mit dem Nested Logit-Modell gefunden. Ein genestetes Logit erhält man, wenn eine generalisierte Extremwertverteilung (GEV) für die Fehlerterme angenommen wird. Hier werden ähnliche Alternativen in Gruppen zusammengefasst und in einer hierarchischen Struktur abgebildet. Dadurch kann die IIA-Eigenschaft zumindest zwischen den Gruppen neutralisiert werden, jedoch nicht innerhalb der Gruppen (vgl. Urban 1993).
Eine weitere Schwäche des Logit-Modells besteht in seiner Fähigkeit, Heterogenität abzubilden. Aufgrund der restriktiven Annahme der identischen Verteilung der Zufallskomponenten kann die Heterogenität der Konsumenten nicht direkt abgebildet werden, sondern kann nur über zusätzliche Annahmen berücksichtigt werden (vgl. Boztuğ, Silberhorn 2006). Eine identische Varianz der Fehlerterme setzt voraus, dass die Konsumenten homogene Präferenzen und Sensitivitäten besitzen. Diese Unzulänglichkeit versucht eine Weiterentwicklung des Logit-Modells - das gemischte Logit (Mixed Logit) -
17
zu beheben. Hier wird angenommen, dass ein Teil der unbeobachtbaren Fehlerkomponente eine Verteilung annimmt, die durch den Forscher spezifiziert wird und ein Teil, der iid extremwertverteilt ist (vgl. Train 2003). Die Wahlparameter β können in diesem Modell konsumentenspezifisch modelliert werden, indem die Parameter zufällig über die Konsumenten hinweg variieren. Das gemischte Logit-Modell wird in Abschnitt 4.2 ausführlich beschrieben.
Weitere Schwächen des Logit-Modells sind (vgl. Boztuğ, Hildebrandt 2006):
• die Annahme der Weibull verteilten Fehlerterme. Der Grund für die Wahl dieser Verteilung ist nicht erkennbar, da viele weitere Verteilungen für die Fehlerterme möglich wären.
• die lineare Formulierung der Nutzenfunktion, wodurch eine Reihe an weiteren (nichtlinearen) Möglichkeiten, den Nutzen zu beschreiben, ausgeschlossen ist und für die es keine ökonomische Rechtfertigung gibt.
Insgesamt ist wegen der Annahme der unabhängig und identisch verteilten Fehlerterme eine Berücksichtigung von Korrelationen zwischen verschiedenen Produktkategorien im Logit-Modell nicht möglich. Die Kategorieabhängigkeiten können allerdings explizit über eine Parameterdarstellung modelliert werden. Wie oben herausgestellt wurde, ist das herkömmliche Logit-Modell auch nicht dazu geeignet, Heterogenität abzubilden (vgl. Boztuğ, Silberhorn 2006). Jedoch können Erweiterungen des Logit-Modells entwickelt werden, die die genannten Unzulänglichkeiten teilweise beheben und es ermöglichen, realistischere Annahmen insbesondere bezüglich der Präferenzen und Sensitivitäten der Konsumenten zu treffen.
Da das Hauptaugenmerk der Arbeit auf der Einbeziehung von
Konsumentenheterogenität in die Warenkorbanalyse liegt, widmet sich das folgende Kapitel völlig dieser Problematik. Nachdem die verschiedenen Arten von Heterogenität betrachtet werden (Abschnitt 3.1), werden als eine mögliche Erweiterung des herkömmlichen Logit-Modells, das gemischte Logit und seine verschiedenen Ausführungen in Abschnitt 3.2 genauer untersucht. Dabei wird auf die Wichtigkeit der Berücksichtigung von Heterogenität eingegangen sowie auf mögliche Arten ihrer Modellierung.
18
Arbeit zitieren:
Christina Jordan, 2007, Eine empirische Warenkorbanalyse unter Berücksichtigung von Konsumentenheterogenität, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Christina Jordan hat einen neuen Text hochgeladen
Management des Liquiditätsrisikos in Banken: Analyse und Beurteilung d...
Christoph Dürrnagel
Statistical Modeling of the National Assessment of Educational Progres...
Irit Aitkin, Murray Aitkin
Foundations of Statistical Analyses and Applications with SAS
Michael Falk, Frank Marohn, Bernward Tewes
Statistische Verfahren und ihr...
Walter Krämer, Olaf Schoffer, Lars Tschiersch
SAS for Linear Models SAS for Linear Models SAS for Linear Models SAS ...
Ramon C. Littell, Walter Stroup, Rudolf Jakob Freund
0 Kommentare