Fake Reviews und ihr Einfluss auf die Hotellerie

Die Identifikation von gefälschten Rezensionen


Hausarbeit, 2020

24 Seiten, Note: 1.0

Anonym


Leseprobe


Inhaltsverzeichnis

Abstract

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung

2 Stand der Forschung

3 Identifikation von Fake Reviews
3.1 Grundlage der Forschung
3.2 Übersicht der Studien
3.3 Lernart
3.4 Klassifikatoren

4 Motivation zu Fake Reviews
4.1 Interne Faktoren
4.2 Machtempfinden

5 Bewertungen in der Hotellerie

6 Diskussion

7 Fazit

Literaturverzeichnis

Bemerkung

Aufgrund der Lesbarkeit wird in der vorliegenden Arbeit die gewohnte männliche Sprachform verwendet. Dies soll jedoch keine Benachteiligung des weiblichen Geschlechts und anderweitigen Geschlechteridentitäten implizieren, sondern soll im Sinne der sprachlichen Vereinfachung als geschlechtsneutral verstanden werden.

Abstract

Bewertungsportale gewinnen zunehmend an Relevanz, mit ihnen rücken auch Fake Reviews in den Vordergrund der Forschung. Die Arbeit beschäftigt sich mit dem aktuellen Stand der Forschung und den Hauptforschungsfeldern, der Identifikation von gefälschten Bewertungen und der Motivation diese zu verfassen. Es wird deutlich, dass bisher keine universelle Lösung zur Erkennung von gefälschten Rezensionen entwickelt wurde und eine Vielzahl an verschiedensten Herangehensweisen existieren. Zudem liegt die Motivation diese zu verfassen an diversen Hintergründen. Die vorliegende Arbeit untersucht dabei hauptsächlich die Motive von Kunden. Der Wunsch nach Rache und die Markenliebe zu einem Unternehmen bilden dabei signifikante Motive (Thakur et al., 2018, S. 189). Zuletzt wird der Bezug zur Hotellerie hergestellt. Bewertungen spielen für das Buchungsverhalten der Kunden eine große Rolle (Öğüt & Onur Taş, 2012, S. 202). Gefälschte Bewertungen als Hotelier zu schreiben kann sich positiv auf das Buchungsverhalten auswirken, bringt aber auch Konsequenzen mit sich.

Abbildungsverzeichnis

Abbildung 1: Anzahl der Publikationen pro Jahr

Tabellenverzeichnis

Tabelle 1: Übersicht der Studien zum Thema der Identifikation

Tabelle 2: Übersicht der Studien hinsichtlich ihrer betrachteten Merkmale

Abkürzungsverzeichnis

AMT Amazon-Mechanical-Turker-Methode

LIWC Linguistic Inquiry and Word Count

NB Naїve Bayes

RF Random-Forest

SVM Support Vector Machine

1 Einleitung

Seit der Einführung des Web 2.0 in den 2000er Jahren, ist „User-Generated-Content“, also Inhalte, die von Internet-Nutzern selbst produziert werden, nicht mehr aus dem Alltag wegzudenken. Videoplattformen, Blogs und Bewertungsportale bieten eine neue Form der Kommunikation und des Austausches (Dittler, 2017, S. 31 f.). Auch in der Tourismusbranche, welche vermehrt den Onlinevertriebsweg ausbaut, spielen vor allem Bewertungsportale eine zunehmend größere Rolle. Denn die digitale Zielgruppe hat sich nahezu zur relevantesten Zielgruppe der touristischen Unternehmen entwickelt. 90% der potenziellen Urlaubsgäste lesen vor der Buchung einer Reise Bewertungen auf entsprechenden Verbraucherportalen. Dabei werden im Durchschnitt sechs bis zwölf Bewertungen gelesen. Wer als Hotelier höhere Weiterempfehlungsraten und eine Vielzahl an aktuellen Bewertungen vorzuweisen hat, wird eher gebucht und ist wirtschaftlich erfolgreicher. Allerdings werden zunehmend Fake Reviews auf Hotelbewertungsportalen identifiziert. Bewertungen, sowie deren Portale verlieren dadurch an Vertrauen (Inger, 2017). Hotelbewertungsportale versuchen zunehmend gegen gefälschte Bewertungen anzugehen. Im Februar 2019 ging das Portal „Holiday Check“ erfolgreich gegen ein Unternehmen vor, welches gezielt gefälschte Rezensionen an Hotels verkauft hatte. Das Portal gibt zudem an, dass 19% aller abgegebenen Bewertungen nicht veröffentlicht werden, da ein Verdacht auf Fälschung besteht (HolidayCheck AG, 2020).

Im Fokus der vorliegenden Arbeit steht daher die Frage, wie der allgemeine Stand im Forschungsgebiet gefälschter Bewertungen ist. Da die meisten Studien zu diesem Thema den Fragen der Identifikation von Fake Reviews und der Motivation zum Verfassen derer nachgehen, wird sich die Arbeit nachfolgend vertiefend mit diesen Themen auseinandersetzen (Wu et al., 2020, S. 6). Anschließend wird der Bezug zur Hotellerie vorgenommen und mögliche Auswirkungen für die Hoteliers abgewogen.

2 Stand der Forschung

In der aktuellen Studie „Fake online reviews: Literature review, synthesis, and directions for future research“ aus dem Jahr 2020, haben Wu et al. eine Vielzahl an Studien und Artikeln zum Thema Fake Reviews analysiert. Dabei sind sie zu dem Ergebnis gekommen, dass bis zu diesem Zeitpunkt insgesamt 165 Artikel in 122 verschiedenen Journals zum Thema gefälschte Bewertungen veröffentlich worden sind. Zu den thematischen Inhalten der Journals zählen beispielsweise Informationstechnologie, Marketing und Tourismus. Seit dem Jahr 2010 bis zum Jahr 2019 haben sich die Veröffentlichungen von eins auf 40 erhöht.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Anzahl der Publikationen pro Jahr

Hierbei ist besonders auffällig, dass sich die Anzahl der Publikationen in den Jahren 2016 bis 2018 mehr als verdoppelt hat. Die Darstellung zeigt folglich die zunehmende Relevanz des Themas und die damit gekoppelte Verbreitung von Bewertungs- und Verbraucherportalen. Allerdings wird durch die Studie von Wu et al. (2020) auch deutlich, dass sich vorrangig die USA, China und Indien mit dem Thema beschäftigen. China mit 45 Artikeln zum Thema Fake Reviews ist Vorreiter in der Forschung auf diesem Gebiet. Deutschland mit gerade mal vier Veröffentlichungen zählt zu den letzten 18% der Forschungsregionen. Insgesamt haben Autoren aus 29 verschiedenen Ländern zu diesem Thema geforscht (Wu et al., 2020, S. 6). Die Ergebnisse von Wu et al. basieren auf der Scopus Datenbank, eine der größten Datenbanken für Forschungsliteratur. Die Journals wurden aus der Datenbank mit dreizehn verwandten Schlüsselwörtern zum Thema Fake Reviews gefiltert mit einem Datenstand zum 28.10.2019. Wie viele Studien es zum Thema gefälschte Bewertungen in der Hotellerie gibt ist nicht eindeutig auszumachen. Allerdings ist es auffällig, dass sich viele Studien mit dem Thema in Bezug auf die Tourismusbranche und Gastronomie beschäftigen. Dies ist vor allem an den verwendeten Datensätzen festzustellen, welche oftmals auf synthetischen sowie realen Hotel- und Gastronomiebewertungen beruhen.

3 Identifikation von Fake Reviews

3.1 Grundlage der Forschung

Die Identifikation von Fake Reviews ist eines der zentralen Hauptforschungsgebiete im Themenfeld der gefälschten Bewertungen (Wu et al., 2020, S. 6). Es gibt bereits zahlreiche Studien, welche sich mit diesem Thema auseinandersetzen. Ein Großteil der Studien wurde an Datensätzen von Yelp getestet, eines der meist genutzten Verbraucherportale, welches auch für seine Nutzer Hotelbewertungen bereitstellt. Bereits im Jahr 2015 konnte yelp.com durchschnittlich 142 Millionen monatliche Besucher und insgesamt 77 Millionen veröffentlichte Bewertungen verzeichnen. Dabei strebt die Plattform an, gefälschte Rezensionen automatisch herauszufiltern. Der dabei verwendete Algorithmus wird nicht preisgegeben (Zhang et al., 2016, S. 464). Der Datensatz wurde dennoch als vertrauenswürdig eingestuft, dies wurde bereits in der Studie „What Yelp Fake Review Filter Might Be Doing?“ belegt. Er eignet sich daher für die Verwendung des Trainierens und Testens zur Erkennung von Fake Reviews (Mukherjee et al., 2013, S. 417).

Zudem wurden bereits Studien durchgeführt, welche auf Datensätzen von reinen Hotelbewertungen beruhen. Die in der untenstehenden Tabelle 1 aufgelisteten Studien berücksichtigen alle Ergebnisse, der von Ott et al. durchgeführten Studie „Finding Deceptive Opinion Spam by Any Stretch of the Imagination“, welche 2011 veröffentlicht wurde. Obwohl diese bereits vor neun Jahren durchgeführt worden ist, basiert auch eine Vielzahl von aktuellen Studien auf deren Ergebnissen. Wie Wu et al. (2020) festgestellt haben, ist im Jahr 2010 lediglich eine Arbeit zum Thema Fake Reviews publiziert worden. Somit ist das Jahr 2011 als eines der Anfänge in diesem Forschungsgebiet zu betrachten. Ott et al. (2011) legten, schließend aus den zahlreichen Zitationen der Arbeit, einen der Grundsteine. Daher wird die Studie nachfolgend im Detail erläutert.

Ott et al. (2011) haben vor allem den entwickelten Datensatz „gold-standard“ geprägt, welcher in der danach entstanden Forschung oftmals verwendet wird, um Forschung bezüglich der Identifikation von Fake Reviews zu betreiben. Der Datensatz enthält insgesamt 800 Bewertungen in Textform, welche inhaltlich 20 verschiedene Hotels in Chicago, USA betrachten. Die Bewertungen wurden der Plattform „TripAdvisor“ entnommen, dort können unter anderem Hotels, Restaurants und Aktivitäten mit eins bis zu fünf Sternen bewertet werden. Dafür entnahmen Ott et al. (2011) alle bis dahin 6.977 abgegebenen Bewertungen der 20 Hotels. Sie sortierten 4.853 Bewertungen aufgrund von Unbrauchbarkeit (nicht englisch) und dem Verdacht auf Fälschung (weniger als 150 Zeichen) aus. Von den verbliebenden 2.124 Bewertungen, welche als vertrauenswürdig eingestuft werden konnten, wurden 400 zur weiteren Betrachtung ausgewählt. Die 400 gefälschten Bewertungen, welche den Datensatz aus insgesamt 800 Bewertungen vervollständigen, sind durch die Amazon-Mechanical-Turk-Methode (AMT) erstellt worden. Dabei werden so genannte „Turker“ (anonyme Online-Beschäftigte) beauftragt, gefälschte Bewertungen zu verfassen. Im Gegenzug erhalten diese einen Dollar pro Bewertung. Die AMT-Methode ist eine gängige Methode, um synthetische Datensätze herzustellen (Wu et al., 2020, S. 4). Auch in den im Folgenden erläuterten Studien kommt diese zum Einsatz (Hassan & Islam, 2019; Munzel, 2016; Zhang et al., 2016). Der Datensatz wurde zu einem späteren Zeitpunkt weiterentwickelt und beinhaltet Bewertungen für Hotels, Restaurants und Ärzte. Die Entwicklung des neuen Datensatzes basiert auf den gleichen Methoden wie der oben beschriebene „gold-standard“ Datensatz (Jiweil et al., 2014, S. 1566). Da sich die vorliegende Arbeit an der Erkennung von Fake Reviews in der Hotellerie orientiert, wird im Folgenden die Studie mit dem Datensatz von 2011 weiter beschrieben, da dieser lediglich Hotelbewertungen untersucht und bis heute in der Forschung zum Einsatz kommt.

Die Autoren formulierten außerdem drei Klassifizierungstechniken, diese werden beispielsweise auch von Hassan & Islam (2019) in ihrer durchgeführten Studie beschrieben. Dabei werden drei Erkennungstechniken von Fake Reviews vorgestellt: die Identifikation des Genres, die psycholinguistische Täuschung und die Text-Kategorisierung. Bei der Identifikation des Genres werden den Rezensionen Tags für verschiedene Wortarten zugeteilt. Anhand der Anzahl der verschiedenen Tags wird eine Vorhersage zur Entscheidung (gefälscht oder glaubhaft) getroffen. Die psycholinguistische Täuschung beinhaltet die Zuordnung von psycholinguistischen Bedeutungen zu den Schlüsselmerkmalen einer Bewertung. Dazu wurde die Linguistic Inquiry and Word Count Software (LIWC) verwendet, welche bis zu 4.500 Schlüsselwörter 80 verschiedenen psychologischen Bedeutungen zuordnet. Die Kategorisierung des Textes (glaubhaft/gefälscht) wird mithilfe des n-Gramm-Modells vorgenommen (Ott et al., 2011, S. 313 f.). Das n-Gramm-Modell ist eine häufig verwendete Methode, um Texte in Fragmente zu zerlegen und zu kategorisieren. Die Elemente können aus einer Folge von Wörtern, Zeichen, Silben oder Bytes der Länge n bestehen. Dabei geht es oftmals um die Häufigkeit eines bestimmten Wortes (Ahmed et al., 2018, S. 6). Ott et al. (2011) haben aus dem n-Gramm-Modell, basierend auf Textfragmenten, die Merkmale Monogramm, Bigramm und Trigramm genauer betrachtet. Die Merkmale geben an, wie viele Buchstaben ein jeweiliges Fragment beinhaltet (Monogramm = ein Buchstabe, Bigramm = zwei Buchstaben, Trigramm = drei Buchstaben).

Die drei Techniken wurden am „gold-standard“ Datensatzes angewandt und sind miteinander verglichen und kombiniert worden. Gleichzeitig wurden drei Studenten gebeten, die Fälschungen unter den Bewertungen zu identifizieren, um einen Vergleich zwischen der menschlichen Fähigkeit und den Klassifizierungstechniken ziehen zu können. Die Ergebnisse zeigen, dass jeder automatische Klassifikator die menschlichen Entscheider in der Genauigkeit übertrifft. Die Kombination der beiden Techniken psycholinguistische Täuschung und Text-Klassifikation durch das n-Gramm-Modell weisen eine Erfolgsrate von 89,9% im Hinblick auf die Erkennung von gefälschten Rezensionen auf. Dabei wurde die LIWC-Software mit Bigrammen der n-Gramm-Methode kombiniert. Bei der Betrachtung der Ergebnisse lässt sich allgemein sagen, dass die Text-Kategorisierung, alle Techniken alleinstehend betrachtet, mit 87,6% am genausten arbeitet. Die LIWC-Software erzielt alleinstehend Ergebnisse von 76,8% und die Genre-Identifikation schneidet mit 73% am schlechtesten ab. Ott et al. (2011) stellen mit ihrer Studie außerdem die Wichtigkeit dar, nicht nur den Text einer Rezension (z.B. Bigramme), sondern auch die Motivation der Schreibenden zu untersuchen (LIWC-Software) (Ott et al., 2011, S. 317). In ihrer Arbeit wird der Fokus auf die Analyse des Texts gelegt. Es wurde festgestellt, dass echte Rezensionen eher dazu neigen, konkrete und beschreibende Wörter zu enthalten, als gefälschte Rezensionen.

3.2 Übersicht der Studien

Die in der nachfolgenden Tabelle 1 aufgeführten Studien beschäftigen sich alle mit der Erkennung von gefälschten Bewertungen im Internet und berücksichtigen die Ergebnisse der von Ott et al. (2011) durchgeführten Forschung. Die seit 2013 bis 2019 durchgeführten Studien treten mit unterschiedlichen Vorgehensweisen an die Entdeckung von Fake Reviews heran, der Großteil von ihnen beschreibt die Erkennung mithilfe von maschinellem Lernen. Um eine bessere Übersicht zu erhalten, werden in der nachfolgenden Tabelle 1 die Methoden, sowie die Erkenntnisse und die betrachtete Branche dargestellt. Zum Verständnis der tiefergehenden Vorgehensweisen wird zuerst der Begriff „Algorithmus“ erläutert.

Unter einem Algorithmus versteht man im allgemeinen Sinn eine Folge von Anweisungen, welche definiert wurden, um eingegebene Parameter in eine Ausgabe umzuwandeln. Algorithmen sind die praktische Umsetzung des maschinellen Lernens. „Maschinelles Lernen bedeutet, Computer so zu programmieren, dass ein Leistungskriterium auf der Basis eines Beispiels oder früherer Erfahrungswerte optimiert wird“ (Alpaydin, 2019, S. 6). Im Themengebiet der gefälschten Bewertungen gibt es noch keinen formulierten Algorithmus, der mit einer hundertprozentigen Genauigkeit die echten von den gefälschten Bewertungen unterscheidet. Die Eingabe des Algorithmus wäre eine Bewertung und die Ausgabe wäre „gefälscht“ oder „echt“, welche den Wahrheitsgehalt der Rezension angibt. Allerdings wurde noch keine Definition gefunden, welche die Eingabe in eine sichere Ausgabe transformiert. Dies liegt vor allem an der unterschiedlichen Wahrnehmung der Bewertungen (Alpaydin, 2019, S. 68). Im Themengebiet der gefälschten Bewertungen ist man meist auf der Suche nach einem Klassifizierungsalgorithmus, der die Bewertungen in „echt“ oder „gefälscht“ einordnen kann.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Übersicht der Studien zum Thema der Identifikation (Quelle: eigene Darstellung)

[...]

Ende der Leseprobe aus 24 Seiten

Details

Titel
Fake Reviews und ihr Einfluss auf die Hotellerie
Untertitel
Die Identifikation von gefälschten Rezensionen
Hochschule
Frankfurt University of Applied Sciences, ehem. Fachhochschule Frankfurt am Main
Note
1.0
Jahr
2020
Seiten
24
Katalognummer
V1021331
ISBN (eBook)
9783346415165
ISBN (Buch)
9783346415172
Sprache
Deutsch
Schlagworte
Fake Reviews, Motivation zu gefälschten Bewertungen, Gefälschte Bewertungen in der Hotellerie, Fake Reviews - Stand der Forschung, Fake Reviews Identifizierten, Fake Reviews Identifikation, Erkennen von gefälschten Bewertungen, Fake Reviews Hotel, Gefälschte Bewertungen Hotel, Gefälschte Bewertungen Stand der Forschung, Fake Reviews Motivation
Arbeit zitieren
Anonym, 2020, Fake Reviews und ihr Einfluss auf die Hotellerie, München, GRIN Verlag, https://www.grin.com/document/1021331

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Fake Reviews und ihr Einfluss auf die Hotellerie



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden