Inhalt
1. Einleitung 3
2. Grundlagen 4
2.1. Empfehlungssysteme 4
2.2. Soziale Netzwerke 9
2.3. Zusammenspiel 10
3. Stand der Forschung 12
3.1. Realisierung eines Zusammenspiels 12
3.1.1. Datenfluss innerhalb des sozialen Netzwerkes 13
3.1.1.1. Empfehlung von Objekten 13
3.1.1.2. Empfehlung von Subjekten 15
3.1.2. Datenfluss aus dem sozialen Netzwerk heraus 17
3.1.3. Datenfluss in das soziale Netzwerk hinein 18
3.2. Generierung von Benutzer-Profilen 18
3.2.1. Quantifizierung 19
3.2.2. (Social) Data Mining 19
3.2.3. Tagging und Ontologien 20
3.3. Empirische Studien 21
3.3.1. Trade-Off: Social vs. Expert 21
3.3.2. Vergleich: Empfehlungen von Computer vs. Mensch 22
3.3.3. Missbrauch von Empfehlungssystemen 22
4. Zusammenfassung 22
Literaturverzeichnis 25
Abk ürzungsverzeichnis 28
Seite 2
1. Einleitung
Als „Information Overload“ bezeichnete Toffler (1970, S. 350) bereits 1970 einen Zustand, in dem man zu viele Informationen besitzt, um eine Entscheidung zu treffen. Dieser Begriff prägt das heutige Internet: Die Zahl der Internetnutzer ist seit Anfang der neunziger Jahre rasant angestiegen. Heute nutzen über eine Milliarde Menschen das World Wide Web 1 . Und seit dem Auftreten des Web 2.0 sind Konsumenten immer öfter auch Produzenten. Denn im Unterschied zu klassischen Medien wie Print und TV können im Internet von jedermann neue Inhalte generiert und Informationen veröffentlicht werden. Täglich wächst die Anzahl abrufbarer Informationen und Medien in großem Umfang. Heute erschwert daher in vielen Situationen eine Informationsflut eine schnelle Entscheidungsfindung. In diesen Situationen können Empfehlungssysteme (ES) eine hilfreiche Filterfunktion übernehmen. Vor allem im E-Commerce sind solche Systeme bereits weit verbreitet. Eine Gemeinsamkeit vieler bestehender Empfehlungssysteme ist die Empfehlung von Objekten (Dingen) an Subjekte (Personen).
In den letzten Jahren ist ein Trend entstanden sich online in soziale Netzwerke einzubinden und dort zu präsentieren. Individuen werden zunehmend in Social-Network-Plattformen, Stellenbörsen und Dating-Plattformen katalogisiert. Und auch hier ist der Einsatz von Empfehlungssystemen sinnvoll. Zum einen können diese innerhalb eines sozialen Netzwerkes Objekte an Subjekte empfehlen, zum anderen aber auch Subjekte an Subjekte. Dieser zweite Fall birgt Schwierigkeiten, mit denen sich die Wissenschaft in letzter Zeit zunehmend befasst. Denn während Informationen über Objekte meist explizit, z.B. in Form von Datensätzen vorliegen, sind Informationen über Subjekte nur schwer zu gewinnen. Ein Personaler könnte beispielweise Bewerber anhand von „harten“ und somit leicht verfügbaren Daten wie Abschlussnote, Studiendauer oder Alter aussuchen. In der Realität trifft er seine Entscheidung jedoch aufgrund „weicher“ Faktoren wie Persönlichkeit, soziale Kompetenz oder Vertrauenswürdigkeit (vgl. Junge Karriere 2008, S. 21). Ähnlich ist es bei der Partnerwahl oder dem Zusammenstellen von Arbeitsgruppen. Es sind Ansätze nötig, die es ermöglichen solche Faktoren in Empfehlungssysteme mit aufzunehmen.
Nachdem sich die Wissenschaft in der Vergangenheit vor allem mit methodischen Ansätzen, Algorithmen und deren Güte auseinander gesetzt hat, steigt nun immer mehr das Interesse an der Reaktion von Personen auf Empfehlungssysteme. Es wird beispielweise untersucht, ob Personen solchen Systemen vertrauen und deren Empfehlungen annehmen.
1 http://comscore.com/Press_Events/Press_Releases/2009/1/Global_Internet_Audience_1_Billion (23.01.2009, Abruf 10.06.2009)
Das Ziel dieser Arbeit ist es Möglichkeiten über das Zusammenwirken von Empfehlungssystemen und sozialen Netzwerken aufzuzeigen und einen Überblick über den aktuellen Stand der Forschung in diesem Bereich zu geben. Gleichzeitig wird auch die Wirkung von ES auf Suchende, also einzelne Mitglieder sozialer Netzwerke, vorgestellt. In dieser Arbeit werden Gedankengänge anderer gesammelt und neu geordnet. Eine Ausnahme ist die im Absatz 2.3 vorgestellte Systematisierung eines Zusammenspiels von Empfehlungssystemen und sozialen Netzwerken. Sie baut auf eigene Überlegungen auf.
Nach dieser Einleitung werden Grundlagen des Themengebietes vorgestellt. Nach dem Aufzeigen von Möglichkeiten zum Zusammenwirken von ES und sozialen Netzwerken werden aktuelle Forschungsthemen aus diesem Bereich zusammengefasst. Ein Augenmerk liegt auf den Möglichkeiten „weiche“ Faktoren mit in den Empfehlungsprozess einzubeziehen. Abschließend befasst sich diese Arbeit mit einigen empirischen Studien zu der Thematik.
2. Grundlagen
In diesem Kapitel werden neben den Funktionsweisen und Methoden von Empfehlungssystemen, die Grundlagen über soziale Netzwerke und das Zusammenspiel zwischen diesen und Empfehlungssystemen vorgestellt.
2.1. Empfehlungssysteme
Klahold (2009, S.1) definiert ein ES als „System, das einem Benutzer B in einem gegebenen Kontext K aus einer gegebenen Entitätsmenge M aktiv eine Teilmenge nützlicher Elemente T empfiehlt. Der Kontext K konstituiert sich dabei aus dem Benutzerprofil P, der Entitätsmenge M und der Situation S.“
Die formale Aufgabe eines ES besteht nach Klahold also in der folgenden Optimierung:
Max(Nutzer (B, K, T)) mit K = (P, M, S)
Die Verfahren, die zu der Selektion von optimierten Empfehlungen eingesetzt werden, werden traditionell in drei Gruppen unterteilt (vgl. Klahold 2009, S.2). Collaborative Filtering (CF) vergleicht Nutzerprofile, um Empfehlungen zu generieren. Content-based-Filtering (CBF) vergleicht dagegen Eigenschaften der Entitäts-Menge M. Werden diese beiden Verfahren gemeinsam verwendet, so spricht man von Hybrid-Verfahren.
Collaborative Filtering
Der Begriff Collaborative Filtering wurde 1992 von Goldberg et.al. (1992 S.61) eingeführt. Das damals vorgestellte Tapestry Project des Xerox PARC verwendete CF in einem Email-System.
Der Ansatz fußt auf der Ähnlichkeit von Nutzerprofilen. Diese Profile speichern das Nutzerverhalten anhand von Bewertungen von Objekten oder Subjekten und repräsentieren somit Präferenzen des Nutzers. Bewertungen können explizit durch den Nutzer erfolgen oder implizit durch sein Verhalten, wie dem Kauf eines Artikels oder dem Anklicken eines Links. Es wird eine User-Item-Rating-Matrix erstellt. Unter der Annahme, dass unter Nutzern ähnlicher Profile auch ähnliche Präferenzen bestehen, können Empfehlungen vorhergesagt werden, die für den Suchenden potenziell interessant sein könnten (Höhfeld; Kwiatkowski 2007, S. 265).
Das grundlegende Verfahren arbeitet wie folgt (vgl. Klahold 2009, S. 63): Auf der Basis von n Benutzern und m Empfehlungselementen wird eine Matrix R(ij) mit i=1..n und j=1..m erzeugt. Die Bewertung eines Nutzers i für das Element j wird durch r ij repräsentiert. Die Aufgabe besteht darin die Relevanz R(I,U) des Empfehlungselementes I für den Nutzer U zu berechnen. Der Nutzer U kennt das Element I noch nicht. Die Relevanz wird auf Basis von Ähnlichkeits- und Distanzmaßen zu anderen Nutzer berechnet.
Die eingesetzten CF-Verfahren werden in speicher- und modellbasierte Verfahren untergliedert (Klahold 2009, S.65). Speicherbasierte Verfahren nutzen statistische Verfahren zur Berechnung von ähnlichen Profilen. Sie arbeiten auf der gesamten Basis der Nutzerprofile und sind somit rechenintensiv. Modellbasierte Verfahren arbeiten nur auf einem Teil der Nutzerprofile. Empfehlungen können so schneller erzeugt werden. Möglich wird dies durch den Einsatz von Custerbildung oder Bayes’schen Netzen (vgl. Breese et al. 1998, S. 5-7) sowie durch den Einsatz neuronaler Netze (vgl. Jennings; Higuchi 1993, S.1). Jedoch gehen bei einer In-formationsverdichtung auch Informationen verloren und neue Daten können bei diesen Verfahren nur aufwendig hinzugefügt werden. Abbildung 1 auf der folgenden Seite zeigt eine User-Item-Rating-Matrix und die aus dieser resultierenden Cluster.
Collaborative Filtering bietet den Vorteil, dass keine Informationen über die Empfehlungselemente benötigt werden. Zusätzlich ist die Empfehlung nicht auf ähnliche Elemente beschränkt (vgl. Bohnert 2004, S. 14). Stellt das System fest, dass sich viele Nutzer für Mathematik Fachbücher und gleichzeitig für Mickey Mouse Hefte interessieren, kann es auch entsprechende „exotische“ Empfehlungen generieren. Probleme bereiten die Aufnahme neuer
Empfehlungselemente oder Nutzer in das System, da die entsprechende Zeile oder Spalte in der User-Item-Rating-Matrix erst mit Informationen gefüllt werden muss. Noch schwieriger ist der Kaltstart eines solchen Systems. Eine leere Matrix muss mit Einträgen in Form von Bewertungen gefüllt werden, bevor Empfehlungen errechnet werden können (vgl. Klahold 2009, S. 66). Ähnlich ist das Problem der Spärlichkeit. Es entsteht in Systemen mit vielen Nutzern und vielen Elementen, aber nur wenigen Bewertungen (vgl. Yildirim; Krishnamoorthy 2008).
Abbildung 1: User-Item Matrix und Generierung von Clustern in dieser.
Quelle: http://www.is.informatik.uni-duisburg.de/wiki/index.php/ASDL:Recommendersysteme
Content-based Filtering
„The Information Lens“ (Malone et al. 1986, S. 3) war eines der ersten Systeme, das auf Content-based Filtering aufbaute. Das System von 1986 war in der Lage elektronische Nachrichten zu filtern und aufgrund deren Inhalte Empfehlungen für diese zu generieren.
Content-based Filtering hat seinen Ursprung im Information Retrieval und fußt auf der Ähnlichkeit von Empfehlungselementen. Im Gegensatz zum Collaborative Filtering spielt hier das Verhalten anderer Nutzer keine Rolle. Eine Eigenschaftsanalyse bestimmt charakteristische Eigenschaften der Empfehlungselemente, die einen algorithmischen Vergleich zwischen diesen ermöglichen. Diese Eigenschaften werden gespeichert. Das System kann dann Elemente suchen, deren Attribute gleich oder ähnlich zu bisher vom Nutzer positiv bewerteten Elementen sind. Es werden somit Elemente empfohlen, die ähnlich zu denen sind, die einem Nutzer bereits in der Vergangenheit gefallen haben.
Wichtige Verfahren, die für die Eigenschaftsanalyse eingesetzt werden können, sind der Ein-
satz von Schlagwörtern, das TF-IDF-Verfahren und Latent Semantic Indexing (vgl. Klarhold, 2009, S. 42-61). Schlagwörter sind Wörter, die einem Element zu dessen Inhaltsbeschreibung zugeordnet werden. Üblich ist dies bei Textdokumenten. Aber auch beliebigen anderen Elementen wie Filmen, Fotografien oder Produkten können Schlagwörter zugewiesen werden. Das Akronym TF-IDF-Verfahren steht für Term Frequency - Inverse Document Freqency. Das Verfahren untersucht die Häufigkeit des Auftretens von Wörtern in Texten. Das häufige Auftreten von einem Wort in einem konkretem Text (Term Frequency) wird „belohnt“, das häufige Auftreten über alle untersuchten Texte (inverse Document Frequency) dagegen „bestraft“. Mit diesem Verfahren können bedeutsame Wörter gefunden werden und Empfehlungselemente über diese verglichen werden (vgl. Klahold 2009, S. 43). Beim Latent Semantic Indexing (LSI) wird eine Matrix aus Empfehlungselementen (z.B. Texten) und deren Eigenschaften (z.B. Wörter) aufgespannt. Aufgrund der Aufnahme aller vorkommenden Eigenschaften entsteht eine große, nur spärlich besetzte Matrix. Anschließend wird durch Single Value Decomposition (SVD) diese große Matrix auf eine auf Bedeutungen reduzierte Matrix verkleinert. Dabei werden Begriffe wie „Vehikel“, „Kiste“ und „PKW“ zu einem einzelnen Begriff wie „Fahrzeug“ zusammengefasst. Anhand dieser Matrix können Ähnlichkeiten errechnet werden (Deervester et al. 1999, S. 2-16). Das Verfahren erkennt Synonyme, hat jedoch Probleme bei der Verarbeitung von Polysemen - Wörtern mit mehreren Bedeutungen.
Im Gegensatz zu Colaborative Filtering ermöglicht Content-based Filtering einen einfachen Kaltstart des Systems. Anhand der gespeicherten Eigenschaften können sofort Empfehlungen generiert werden. Analog können neue Elemente und Nutzer einfach in das System aufgenommen werden. Allerdings ist beim CBF ein ständiges Pflegen der Datenbestände nötig und die Eigenschaftsanalyse kann insbesondere bei der Profilerstellung von Subjekten Probleme bereiten (vgl. Wollenweber 2004, S.80-81). Da nur mit den Eigenschaften von Empfehlungselementen gearbeitet wird, kann es vereinzelt zu einer Überspezialisierung von Empfehlungen kommen (Höhfeld; Kwiatkowski 2007, S. 268). Kauft beispielweise ein User nur die Harry Potter Bände I bis V und keine weiteren Bücher, liegt es nahe, dass das System Band VI für einen weiteren Kauf empfiehlt. Interessant wären jedoch auch andere Autoren des gleichen Genres oder themenfremde Literatur, die den Suchenden dennoch interessieren könnte.
Hybride Systeme
Hybride Empfehlungssysteme kombinieren meist die Stärken von Collaborative Filtering und Content-based Filtering. So entstehen Synergien, die die Nachteile beider einzelnen Ansätze
Arbeit zitieren:
Marc Willems, 2009, Stand der Forschung bei Empfehlungssystemen im Zusammenhang mit sozialen Netzwerken, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Soziale Netzwerke und ihre Vor- und Nachteile
Speziell: Cybermobbing
Medien / Kommunikation - Multimedia, Internet, neue Technologien
Seminararbeit, 30 Seiten
Der Weg in die Selbstständigkeit - Ein Leitfaden für Unternehmensgründ...
BWL - Unternehmensgründung, Start-ups, Businesspläne
Seminararbeit, 15 Seiten
"Lange Nacht der Museen" als Instrument des Stadtmarketing
Hausarbeit (Hauptseminar), 24 Seiten
Datenschutz und informationelle Selbstbestimmung
Informatik - Angewandte Informatik
Hausarbeit, 12 Seiten
Finanzierungsmöglichkeiten für Start-Ups
BWL - Investition und Finanzierung
Hausarbeit (Hauptseminar), 30 Seiten
Informationelle Selbstbestimmung – Persönlichkeitsrecht
Informationen als ökonomisches...
Studienarbeit, 16 Seiten
Informationsabfragen und Recom...
Bachelorarbeit, 15 Seiten
Eventtourismus am Beispiel der Fußball-EM 2008
Motive und Anforderungen an da...
Seminararbeit, 26 Seiten
Online Communities – Potenziale und Risiken für jugendliche Nutzer
Hausarbeit, 23 Seiten
Auswirkungen von Sportgroßveranstaltungen auf Destinationen
Seminararbeit, 55 Seiten
Chancen und Risiken für den Tourismus durch den Einfluß eines Mega-Eve...
Diplomarbeit, 109 Seiten
Der Businessplan als Voraussetzung zur Finanzierung von Existenzgründe...
BWL - Unternehmensgründung, Start-ups, Businesspläne
Seminararbeit, 43 Seiten
Veränderte Marketingstrategien der Lufthansa im Wettbewerb zu Billigfl...
BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung
Seminararbeit, 30 Seiten
Erstellung eines Business-Plans
BWL - Unternehmensgründung, Start-ups, Businesspläne
Hausarbeit, 34 Seiten
Informationswissenschaften, Informationsmanagement
Seminararbeit, 20 Seiten
Marc D. Willems's Text Stand der Forschung bei Empfehlungssystemen im Zusammenhang mit sozialen Netzwerken ist nun auf dem Buchmarkt erhältlich
Marc D. Willems hat den Text Stand der Forschung bei Empfehlungssystemen im Zusammenhang mit sozialen Netzwerken veröffentlicht
Marc D. Willems hat einen neuen Text hochgeladen
Autonomous Intelligent Systems: Agents and Data Mining
International Workshop, AIS-AD...
Vladimir Gorodetsky, Victor A. Skormin, Jiming Liu
Data Mining Using Grammar Based Genetic Programming and Applications
Man Leung Wong, Leung Wong Man Leung Wong, Sak Leung Kwong Sak Leung
Clinical Data Mining for Physician Decision Making and Investigating H...
Patricia Cerrito, John Cerrito
Data Mining Cookbook: Modeling Data for Marketing, Risk, and Customer ...
Olivia C. Rud, O. C. Rud, Olivia Parr Rud
0 Kommentare