Zusammenfassung
Der seit Beginn des 21. Jahrhunderts einsetzende Trend der Individuumsorientierung hält als gesellschaftliche Strömung auch Einzug in den ökonomischen Sektor. Der Bedarf an individuellen Diensten und Produkten, die an die persönlichen Bedürfnisse und Interessen des Kunden angepasst sind, wächst. Die Philosophie ”Der Kunde ist König” ist nicht mehr nur alleine in der ”alten Ökonomie” eine grundlegende Voraussetzung für wirtschaftlichen Erfolg. Besonders seit der Entdeckung des Internets und seiner Möglichkeiten durch Betriebe und Unternehmen entwickelt sich ein Kampf um den Kunden. Dieser ist nämlich in der Lage, von einer Sekunde zur nächsten einen anderen Online-Dienst zu nutzen. Um den Kunden zu halten, muss ein Mehr-Wert generiert werden, so dass sich dieser wohl und verstanden fühlt und gerne wieder zurückkehrt. Die Anpassung von Informationen, Werbung und Angeboten an die persönlichen Interessen des Kunden fördert dieses Gefühl. Doch dazu müssen dessen Interessen erst einmal bekannt sein. Effektive Methoden zur Profilgenerierung sind gefragt. Dabei sollen die gesammelten Daten nicht nur umfangreich und korrekt sein, sondern der Kunde soll während dieses Prozesses auch möglichst wenig zeitlich involviert bzw. belastet werden.
Um beide Anforderungen zu erfüllen, kommen Dialogsysteme zum Einsatz, an die bzgl. Komplexität und Performanz abhängig vom Einsatzgebiet verschiedene Ansprüche gestellt werden. Von einfachen, zustandsbasierten Systemen bis zu Agenten, die für die Dialogführung auf Techniken der künstlichen Intelligenz (KI) zurückgreifen, unterliegt das komplette Spektrum dieser Verfahren intensiven Forschungsbemühungen, die von industrieller Seite interessiert beobachtet und begrüßt werden. Jedoch stellt sich bei den meisten technischen Verfahren, die im Dialog mit dem Menschen agieren sollen, das Problem, natürliche Sprache zu verarbeiten oder sogar zu verstehen. Neben der Tatsache, dass die Verarbeitung natürlicher Sprache ein Teilgebiet der KI ist, stellt darin der Problemkreis der Disambiguierung, d.h. das Auflösen von Mehrdeutigkeiten, die größten Schwierigkeiten für einen umfangreichen Einsatz sprachverarbeitender Systeme in der Praxis dar, wie beispielsweise in den Bereichen information retrieval oder machine translation. Da es aber auch für Systeme, die anhand eines Benutzerprofils Produktempfehlungen aussprechen, einen Unterschied macht, ob ein Kunde mit dem Wort ’Dichtung’ literarische Werke oder eine Vorrichtung zum Abdichten meint, erfährt die Disambiguierung ebenfalls im Umfeld der Profilgenerierung ihr berechtigtes Interesse.
Im Rahmen dieser Arbeit soll für ein Profilerhebungssystem ein bereits bestehender Dialog Manager, als zentrale Komponente eines Dialogsystems, weiterentwickelt werden. Das Ziel ist dabei die Entwicklung eines Verfahrens zur Disambiguierung von Kundeneingaben während des Dialogs. Dazu werden im Vorfeld die verschiedenen Varianten von Profilerhebungssystemen, Dialogsystemen und Disambiguierungsverfahren diskutiert, die bereits existieren und zum Teil auch praktisch eingesetzt werden. Auf dieser Basis erfolgt die Betrachtung der vorhandenen Systemgegebenheiten und
ii
Ressourcen, um vor diesem Hintergrund eine effektive und effiziente Strategie zur Disambiguierung zu entwickeln, zu implementieren und letztlich in das bestehende Profilerhebungssystem zu integrieren.
Inhaltsverzeichnis
1 Einführung 1
1.1 Motivation 2
1.2 Aufgabenstellung und Abgrenzung 3
1.3 Aufbau der Arbeit 4
2 Bestehende Ansätze, Verfahren und Systeme 5
2.1 Profilerhebung 5
2.1.1 Implizite Verfahren 6
2.1.2 Explizite Verfahren 7
2.1.3 Erweiterte Ansätze 8
2.1.4 Zusammenfassung und Diskussion 9
2.2 Dialogsysteme 9
2.2.1 Kategorisierung 10
2.2.2 Typische Systemkomponenten 15
2.2.3 Zusammenfassung und Diskussion 18
2.3 Disambiguierung 19
2.3.1 Ambiguität 19
2.3.2 Disambiguierung von Wortbedeutungen - ein Überblick 20
2.3.3 Einsatzgebiete von Disambiguierungsverfahren 24
2.3.4 Kategorisierung 25
2.3.5 Stochastische Verfahren 27
2.3.6 KI-basierte, nicht-stochastische Verfahren 31
2.3.7 Hybridverfahren 33
2.3.8 Evaluierung 33
3 Ausgangssituation 35
3.1 Darstellung des Profilerhebungssystems 35
3.1.1 Konzeptbeschreibung 35
3.1.2 Aufbau und Struktur des Benutzerprofils 37
3.2 Architektur des Profilerhebungssystems 39
3.2.1 Language Analysis 39
3.2.2 Profile Manager 40
3.2.3 Target Group Matching 43
3.2.4 Dialog Manager 43
3.3 GermaNet 44
iii
iv Inhaltsverzeichnis
3.3.1 Architektur 44
3.3.2 Relationen 46
3.3.3 Einsatzmöglichkeit 46
3.4 Ablauf/Kontrollfluss 48
3.5 Zusammenfassung und Diskussion 49
4 Anforderungsanalyse 51
4.1 Funktionale Anforderungen 51
4.2 Nicht-funktionale Anforderungen 52
5 Entwicklung der Disambiguierungskomponente 55
5.1 Betrachtung und Auswahl bestehender Ansätze 55
5.1.1 Situationsspezifische Betrachtung 56
5.1.2 Semantische Verwandtschaft/Ähnlichkeit - Begriffe 60
5.1.3 Semantische Verwandtschaft/Ähnlichkeit - Verfahren 63
5.1.4 Semantische Verwandtschaft/Ähnlichkeit - Bewertung 66
5.1.5 Auswahl und Einordnung des Verfahrens 68
5.2 Algorithmus zur Disambiguierung 70
5.2.1 Vorausgehende Überlegungen 70
5.2.2 Beschreibung des Algorithmus 72
5.3 Systemdesign 78
5.4 Implementierung 79
5.4.1 Konfiguration 79
5.4.2 Packages und Klassen 81
5.4.3 Methoden 82
5.4.4 Datenmodelle 86
5.5 Evaluierung 86
5.6 Zusammenfassung und Diskussion 89
6 Zusammenfassung und Ausblick 91
Literaturverzeichnis 95
Abbildungsverzeichnis
2.1 Strategien zur Dialogsteuerung 11
2.2 Dialogbeispiel für ein Finite-state-basiertes System 12
2.3 Dialogbeispiel für ein Frame-basiertes System 13
2.4 Dialogbeispiel für ein Agent-basiertes System 15
2.5 Typische Komponenten eines Dialogsystems 15
3.1 XML-Darstellung eines Interessensknoten 39
3.2 Komponenten des SFB-582 Profilerhebungssystems 40
3.3 Übergang vom Ergebnis der LA zum Interessensknoten 41
3.4 Auszug aus einem Profilknoten 42
3.5 Beispiel einer Klassifikation in GermaNet 45
4.1 Einordnung des WSD-Moduls im Dialogsystem 52
5.1 Befehlsumfang des GermaNet-Tools ’gwn’ 59
5.2 Synsets in GermaNet für das Wort ’Geld’ 60
5.3 Beispielablauf des entwickelten WSD-Systems 88
v
Tabellenverzeichnis
2.1 Notations-Konventionen für Bayes-Klassifikator 29
3.1 Mögliche Attribute innerhalb eines Benutzerprofils 38
3.2 Die wichtigsten GermaNet Relationen 47
5.1 semantische Ähnlichkeit, Korrelationskoeff. im Englischen (a) 67
5.2 semantische Ähnlichkeit, Korrelationskoeff. im Englischen (b) 67
5.3 semantische Ähnlichkeit, Korrelationskoeff. im Deutschen 67
vii
Kapitel 1
Einführung
Im Rahmen des Sonderforschungsbereich 582 (SFB582) - Marktnahe Produktion individualisierter Produkte, welcher durch die Deutsche Forschungsgemeinschaft (DFG) an der TU München bewilligt wurde, sollen Ideen und Ansätze entwickelt werden, auf welche Weise zukünftig jeder Kunde ein individuell angefertigtes Produkt zu Konditionen eines entsprechenden Standarderzeugnisses ”in place”, d.h. vor Ort bekommen kann.
In diesem interdisziplinären Vorhaben, welches in 14 Teilprojekte untergliedert ist, erarbeiten rund 30 Wissenschaftler der Fakultäten Maschinenbau, Informatik und Wirtschafts- und Sozialwissenschaften “ [...]Methoden, Werkzeuge und Verfahren, um kundenindividuelle Produkte entwickeln und marktnah produzieren zu können - zu Bedingungen einer vergleichbaren Serienproduktion!” [87]. Die Umsetzung dieser Idee soll in sog. ”Minifabriken” erfolgen, die weltweit verteilt von Kunden besucht werden können. Diese können dort direkt ihre persönlichen Wünsche und Vorstellungen anbringen und auf diese Weise ihr eigenes Produkt spezifizieren und konfigurieren. Anschließend kann dieses vor Ort hergestellt werden. Die Realisierung dieser Vision ist als Antwort auf den einsetzenden Trend der Individuumsorientierung zu sehen, welcher zu Beginn des 21.Jahrhunderts die Vorgängerströmungen Produkt-und Marktorientierung abzulösen scheint. Begriffe wie ”Cocooning”, mittlerweile von bekannten Zukunfts- und Trendforschern, wie z.B. Faith Popcorn geprägt, deuten bereits heute auf diese Situation hin.
Innerhalb des Teilprojekts P3 wurde dem Teilbereich des Lehrstuhls Informatik XI die Aufgabe übertragen, individualisierte Produktinformation zu generieren und interaktiv anzupassen. Wie die im Emblem des SFB582 befindliche Krone andeutet, gilt der Kunde als König. Auf dessen Bedürfnisse, Wünsche und Vorstellungen soll individuell eingegangen werden. Eine grundlegende Voraussetzung dafür ist jedoch, erst einmal diese Kundeninformationen zu kennen, d.h. z.B. Arbeitsverhältnis, Familien-stand, Hobbies, Sportvorlieben, politische Interessen, usw. Es ergeben sich dadurch viele Kategorien, denen bzgl. eines bestimmten Anwendungsgebiets unterschiedliche Prioritäten zugeordnet werden können. Beispielsweise ist die Kenntnis über politische Vorlieben des Kunden in einem Online-Shop, der Angelbedarf führt, von relativ niedriger Priorität. Mit steigender Kundenorientierung bedarf es also Verfahren, individuelle Kundendaten zu generieren bzw. zu sammeln und diese letztlich, z.B. in einem Kundenprofil, zur weiteren Verwendung abzuspeichern. In einer fortgeschrit- tenen Weise führt dies zu Kommunikationssituationen zwischen einem technischen
2 1. Einführung
System und einem Menschen (Kunden), quasi einem Dialog der von Seiten des Systems zu dem Zweck geführt wird, um individuelle Informationen über den Kunden zu gewinnen.
1.1 Motivation
Wie die Kapitel 2.1 und 2.2 zeigen werden, gibt es sowohl mehrere Ansätze, Kundenprofile zu generieren als auch verschiedene Konzepte von Dialogsystemen. Das System, welches im SFB582 zur Profilgenerierung eingesetzt wird und auch dieser Arbeit zugrunde liegt, hebt sich von alternativen Verfahren dadurch ab, dass es in der Lage ist, nicht-vordefinierte, in natürlicher Sprache geäußerte Kundeninteressen als Eingaben zu verarbeiten. Aufgrund dieser Flexibilität ist es dem System möglich, adaptiv, d.h. sich an bereits vorhandenem Wissen über den einzelnen Kunden orientierend, zielgerichtet ein individuelles Profil desselben aufzubauen. Wie oft in der Informatik, verdeutlicht die Vorstellung eines Spiels (Gegenspielerbeweise, wissensbasierte Systeme) die vorangegangene Aussage: Man stelle sich ein Frage-Antwort-Spiel vor, in dem der fragende Teilnehmer (System) dem antwortenden Teilnehmer (Kunde) Fragen stellt, die auf dessen vorausgegangenen Antworten basieren und zwar solange bis entweder eine festgesetzte Anzahl von Fragen erreicht ist oder die gewünschte Menge an spezifischen Informationen gesammelt werden konnte. Eine detaillierte Beschreibung dieses Ablaufs wird in Kapitel 3.1 auf Seite 35 beschrieben. Die Möglichkeit, dass hier Kundeneingaben nicht vordefiniert sind, sondern frei und in natürlicher Sprache formuliert werden können, führt jedoch zu zusätzlichen Problemstellungen. Zum einen stellt sich die Analyse und Verarbeitung natürlicher Sprachen als wesentlich komplexer dar, als dies z.B. etwa bei formalen Sprachen, wie z.B. Programmiersprachen, der Fall ist (siehe auch Kapitel 3.2.1). Zum anderen sind in fast allen natürlichen Sprachen darin verwendete Wörter oftmals mit mehreren Bedeutungen behaftet. Neben der syntaktischen Analyse, erschwert dieser Umstand ganz besonders die semantische Zuordnung. Würde nämlich ein Kunde erklären, dass eines seiner Interessen ”Dichtung” sei, wäre es ohne zusätzliche Informationen für das System a priori nicht möglich, eindeutig zu entscheiden, ob dieser den Bereich der ”Sprachkunstwerke” oder eine ”Vorrichtung zum Abdichten an Verbindungsstellen von Geräten und Maschinen” meint. Wie Kapitel 2.3 zeigt, ist die Existenz von Mehrdeutigkeiten (Ambiguität bzw. allg. Polysemie) (siehe unten) eines der Hauptprobleme in manchen Bereichen der Informatik, wie z.B. information retrieval oder machine translation.
Ambiguität urspr. aus dem Lateinischen: Zweideutigkeit, Doppelsinn [90] heute allg.: Mehrdeutigkeit
Polysemie die Erscheinung, dass dasselbe Wort mehrere Bedeutungen hat, z.B. das Schloss (Gebäude - Türschloss) [90]
1.2 Aufgabenstellung und Abgrenzung 3
disambiguieren einen Ausdruck durch Einordnen in bestimmte syntaktische und semantische Zusammenhänge seiner Mehrdeutigkeit entheben; etwas eindeutig machen, Zweideutigkeit aufheben [90]
Diese Problematik der eindeutigen Zuordnung findet auch im Aufbau eines Kundenprofils ihren Einschlag. Es besteht für das System die vordringliche Aufgabe, möglicherweise mehrdeutige Kundeneingaben zu disambiguieren (siehe oben), d.h. herauszufinden, was der Kunde tatsächlich meint. Die Generierung von derartigen Profilen ist ja nur dann sinnvoll, wenn die so gesammelten Daten später in irgendeiner Weise weiterverwendet werden sollen, z.B. für Statistiken oder innerhalb von Empfehlungssystemen [57]. Um beim obigen Beispiel zu bleiben, würden Empfehlungen von Handwerkerprodukten den Kunden vermutlich doch sehr verwundern, falls er im Vorfeld dem System mitgeteilt hat, dass er sich für Dichtung und ganz besonders für Werke von Goethe und Schiller interessiert. Die Akzeptanz eines solchen Systems auf Anwenderseite schwindet.
Die Konsequenzen einer derartigen Fehldeutung erscheinen offenkundig, da einerseits die Korrektheit und Sinnhaftigkeit der gesammelten Datenmenge in Frage gestellt werden muss und andererseits psychologische Aspekte auf Kundenseite in Mitleidenschaft gezogen werden. Man kann leicht selbst nachvollziehen, dass es recht schwierig ist, zu einem System - und letztlich zur dahinter stehenden Firma -Vertrauen aufzubauen, wenn dieses nicht verlässlich ist oder nicht korrekt arbeitet. Sollte man häufig Produkte empfohlen bekommen, die nicht mit den eigentlichen persönlichen Interessen korrelieren, fühlt man sich als Kunde zunehmend nicht individuell behandelt und wird eher nach Konkurrenzfirmen Ausschau halten. Vor diesem Hintergrund wird klar, dass eine effektive Strategie zur Auflösung von Wort-Mehrdeutigkeiten, kurz WSD 1 , im Rahmen eines Profilerhebungssystems einen kritischen Aspekt in Bezug auf Kundenakzeptanz und -vertrauen darstellt und damit auch auf den wirtschaftlichen Nutzen und Erfolg eines Unternehmens wichtigen Einfluss haben kann.
1.2 Aufgabenstellung und Abgrenzung
Wie aus dem Titel der Diplomarbeit zu entnehmen, ist der Schwerpunkt dieser Arbeit der Entwurf und die Implementierung einer Strategie zur WSD von Kundeneingaben zur Profilgenerierung. Die Wichtigkeit einer solchen Komponente (auch benennbar als WSD-Modul) für jegliche Form von Profilerhebungssystem auf Basis nicht-vordefinierter Kundeneingaben wurde bereits im vorangehenden Abschnitt beleuchtet. Vorausgreifend muss jedoch darauf hingewiesen werden, dass die in dieser Arbeit entwickelte Systemkomponente als proprietär zu betrachten ist, d.h. sie orientiert sich stark an den aktuellen Gegebenheiten des Profilerhebungssystems und ist somit kaum ohne entsprechende Anpassungen in andere Systemkontexte portierbar. Aufgrund wechselnder Systemvorgaben, -gegebenheiten und Kontextinformationen
1 engl., word sense disambiguation
4 1. Einführung
existieren nämlich eine Vielzahl unterschiedlicher und z.T. recht gegenläufiger Ansätze zur WSD in den verschiedensten Einsatzbereichen. Dieser Sachverhalt wird im einzelnen in Kapitel 2.3 und im speziellen in Kapitel 5 herausgearbeitet. Als Weiterentwicklung eines bestehenden Profilerhebungssystems im Rahmen des SFB582 sind somit im Vorfeld ebenfalls dessen momentanen Gegebenheiten und Abläufe zu untersuchen und in die Design- und Implementierungsentscheidungen für die Entwicklung des WSD-Moduls mit einzubeziehen. Kapitel 3.1 wird dieser Notwendigkeit gerecht. Ein Dialogmanager, in welchen das WSD-Modul integriert werden soll, wird für die zentrale Steuerung innerhalb des Profilerhebungsvorgangs zuständig sein. Dieser, wie auch Funktionskomponenten zur Verarbeitung der natürlich-sprachlichen Eingaben des Kunden sind bereits vorhanden und werden somit nicht im Rahmen dieser Arbeit entwickelt. Die Beschreibung und Erläuterung der gerade erwähnten Systembestandteile sind jedoch für das weitere Verständnis der Arbeitsweise und Integration des zu entwickelnden WSD-Moduls unverzichtbar, und werden mitunter in den Kapiteln 3.2.4 und 3.2.1 erfolgen.
1.3 Aufbau der Arbeit
Zunächst werden im Kapitel 2 die Bereiche der Profilerhebung, der Dialogsysteme und der Auflösung von Mehrdeutigkeiten (Disambiguierung, WSD) betrachtet. Dabei werden bestehende Ansätze und Realisierungen herausgearbeitet und ggf. Beispiele für bereits existierende Referenzsysteme skizziert. Im Anschluss daran werden die Ausgangssituation und die Grundlagen für diese Arbeit genauer betrachtet: Nach einer Einordnung des gegebenen Profilerhebungssystem in bestehende Kategorien, erfolgt eine Darstellung der Systemarchitektur samt Beschreibung der Funktionsweisen der vorhandenen Teilkomponenten. Dieses Kapitel 3 endet mit einer Erläuterung des verwendeten lexikalisch-semantischen Wortnetzes für die deutsche Sprache, GermaNet [88]. Nach einer kurzen Untersuchung der Anforderungen, die das zu entwickelnde Modul zur WSD erfüllen soll (Kapitel 4), steht die Entwicklung der Disambiguierungskomponente im Rahmen des bestehenden Dialogsystems im Mittelpunkt. Neben der Einordnung in die aktuelle wissenschaftliche Forschung, beschreibt Kapitel 5 die Algorithmusidee, das Design und letztlich die Implementierungssituation dieser Komponente bzw. Moduls. Kapitel 6 schließlich beendet diese Arbeit mit einer Zusammenfassung der behandelten Themen und einem Ausblick, beinhaltend möglicher Verbesserungs- und Erweiterungsvorschläge. Um den Lese- und Verständnisfluss nicht zu unterbrechen, soll im folgenden die Konvention gelten, dass erklärungsbedürftige Wörter oder Begriffe, die in dieser Arbeit Verwendung finden, bei ihrem ersten Auftreten definiert werden und nicht etwa in einem separaten Kapitel.
Kapitel 2
Bestehende Ansätze, Verfahren und
Systeme
Die Überschrift dieses Kapitels wurde bewusst allgemein gehalten, da es Raum bietet für drei grosse Bereiche, die in ihrer folgenden Darstellung logisch-kausal mit-einander zusammenhängen. Diese Themengebiete ’Erhebung von Benutzerprofilen’, ’technische Systeme zur Dialogführung’ und ’Disambiguierung von Mehrdeutigkeiten’ sollen nun vor dem Hintergrund einiger grundlegenden Fragen, wie: • Welche Ideen liegen bestehenden Ansätzen jeweils zugrunde? • Wie können diese Ansätze in Verfahren umgesetzt werden? • Gibt es bereits experimentelle/praktisch einsetzbare (Beispiel-)Systeme? beleuchtet werden.
2.1 Profilerhebung
Nicht nur im technisch-technologischen, sondern auch ganz besonders im öffentlichwirtschaftlichen Bereich spielen Kunden- bzw. Benutzerprofile eine immer wichtigere Rolle. Sei es zum einen die Möglichkeit, die Einstellungen seines Rechners, Handys oder anderer technischer Geräte auf die persönlichen Bedürfnisse und Vorlieben einzustellen, interessiert sich zum anderen in der Ökonomie nicht nur der Kunde für eine Möglichkeit seine Interessen vermitteln zu können. Ganz besonders auch Firmen und Unternehmen, die ihre Produkte und Dienstleistungen eben diesem Kunden schmackhaft machen wollen, wären verständlicherweise sehr an derartigen Informationen interessiert. Mehrere hundert Millionen Euro, die von Firmen jährlich an Marketing- und Trendforschungsfirmen gezahlt und somit in Meinungsumfragen und Kundenbefragungen investiert werden, sind ein deutliches Indiz. In Zeiten, in denen das gesellschaftliche, wirtschaftliche und private Leben für jeden einzelnen nicht nur immer schneller, sondern auch immer komplexer zu werden scheint, entstehen Gegenströmungen, wie mitunter das Bedürfnis nach Sicherheit, Verlangsamung und ganz besonders nach Vereinfachung [22]. Ein Medium, welches sowohl eines der Gründe für die erstgenannte ”Zivilisationsbeschleunigung” war und ist, kann nun ebenso auch als Werkzeug dienen, um das Leben von Anwendern, Kunden, Benutzern leichter und bequemer zu machen: das Internet.
6 2. Bestehende Ansätze, Verfahren und Systeme
Gerade im Internet hat man stets die Qual der Wahl: Welche Suchmaschine nutze ich heute? Wo möchte ich welches Buch zu welchem Teilgebiet kaufen? Wer kann mir wie bei der Lösung eines Problems helfen? Bei welcher Online-Versicherung soll ich abschließen? usw. Oftmals sehnt man sich nach Hinweisen, die einem die Entscheidung abnehmen oder zumindest Hilfestellung geben sollen. Bekannte Konzepte sind dabei, Top-Ten- bzw. Top-100-Listen, Kundenrezensionen, Kritiken, Foren, usw. Neben der Tatsache, dass es sich dabei wieder um zusätzliche, z.T. widersprüchliche Informationen handeln kann, sind diese oftmals sehr subjektiv geprägt und können somit auch völlig an den ursprünglichen Anforderungen und Ansprüchen des Kunden vorbeigehen. Eine adäquate Lösung kann somit nur sein, Angebote und Informationen an die tatsächlichen und individuellen Bedürfnisse des einzelnen Benutzers anzupassen; ein Ansatz wie er in einigen Empfehlungssystemen (recommender systems) verfolgt wird, z.B. [63].
Auf diese Weise schließt sich der Kreis und die Notwendigkeit und der Sinn von Benutzerprofilen, gerade in web-basierten Anwendungen wird deutlich. Ein derartiges Benutzerprofil filtert quasi für einen individuellen Benutzer die Flut an Informationen gemäß der darin abgespeicherten Daten (Interessen, Vorlieben, Bedürfnisse, usw.). An diese Idealvorstellung schließen sich jedoch sofort einige interessante Fragen an: 1. Gibt es Standards, Ontologien, Datenmodelle für das Design und die Struktur von Benutzerprofilen?
2. Welche Daten bzw. Typen oder Klassen von Daten bilden ein solches Benutzerprofil?
3. Wie können individuelle Daten für das Benutzerprofil gewonnen werden? 4. Wie verhält es sich mit der Qualität der Daten im Benutzerprofil, d.h. Aktualität, Korrektheit, Gültigkeit?
5. Wer verwaltet das Benutzerprofil bzw. wer kann es modifizieren? In den folgenden Abschnitten soll der Fokus auf die Punkte 3. und 4. gelegt werden, während den restlichen Aspekten der Aufzählung besonders in Kapitel 3.1 Rechnung getragen wird.
2.1.1 Implizite Verfahren
Laut [25] gewinnt der Hauptteil der aktuellen kommerziellen Empfehlungssysteme die Informationen für ihre Benutzerprofile aus der Beobachtung des Benutzerverhaltens und seiner Aktionen. Darunter kann das ”Klickverhalten” innerhalb von Websites, die Verweildauer auf bestimmten Webseiten und die Dokumentation von Einkaufsgewohnheiten fallen. Man denke z.B. nur an bekannte Internetversand- und Einkaufs-plattformen und erkennt vielleicht auch aus eigener Erfahrung auf Anhieb einen der Nachteile eines solchen impliziten Ansatzes zur Profilerhebung: Bestellt man einmal etwas für einen Bekannten oder Freund mit oder möchte ein Präsent einkaufen, so
2.1 Profilerhebung 7
ist das eigene Benutzerprofil ebenfalls um die Information dieses Produktes reicher. In Zukunft bekommt man dann auch durch diesen Filter Produktempfehlungen offeriert, ob man es möchte oder nicht. Man kann als Kunde somit weder direkt auf die Konstruktion des Profils Einfluss nehmen, noch im nachhinein auf etwaige Falschdaten im Profil korrigierend einwirken. Das bedeutet, dass das auf diese Weise erzeugte Profil häufig nicht adäquat die eigentlichen Interessen des Kunden widerspiegelt. Ein weiterer Nachteil stellt die Tatsache dar, dass durch implizite Verfahren oftmals nicht genügend Informationen über den Benutzer gesammelt werden können [25]. Ein Vorteil jedoch ist die Unaufdringlichkeit des Verfahrens. Es läuft quasi im Hintergrund ab und der Kunde muss nicht aktiv mitwirken; oftmals eine willkommene Entlastung. Siteseer [63], ein Empfehlungssystem für Webseiten verwendet z.B. die Bookmarks von Besuchern als Informationsquelle. Die offensichtliche Idee hinter diesem Ansatz ist die Vermutung, dass ein Benutzer nur die Site-URLs 1 als Bookmarks abspeichert, die ihn auch interessieren. Kritisch kann man jedoch den Gedanken dagegen halten, dass auch Bookmarks von Websites aufgenommen werden könnten, die eher auf einer zeitlich befristeten Aufmerksamkeit gründen, als einem tatsächlichen Interesse entsprechen und viele Adressen erst gar nicht abgespeichert werden, da sie eben regelmäßig und häufig aufgesucht werden. Berechtigterweise stellt sich somit auch bei diesem Anwendungsbeispiel die bereits erwähnte Frage nach Vollständigkeit und Korrektheit der auf implizite Weise für das Benutzerprofil gesammelten Daten.
2.1.2 Explizite Verfahren
In Bezug auf Korrektheit von Benutzerinformationen sind direkte bzw. explizite Anwendungsverfahren von größerer Bedeutung. [71] bekräftigt diese Tatsache, weist jedoch auch auf daraufhin, dass gerade wegen der Notwendigkeit für den Benutzer, zusätzlich Informationen in das System einzugeben, dieser Ansatz noch keinen umfangreichen Einsatz in der Praxis erfahren hat. Ist der Benutzer nämlich gezwungen, Fragebögen auszufüllen, Multiple-Choice Fragen zu beantworten oder, wie im Fall von GroupLens [26], einem Filtersystem für Usenet News, Artikel bzw. allgemein Produkte zu bewerten, so kann dies schnell für Überdruss oder Verstimmung führen; einmal aufgrund des notwendigen Zeiteinsatzes des Benutzers, und zum zweiten, falls die zu bearbeitenden Themenbereich in keinster Form mit den Interessen des Benutzers übereinstimmt. Für eine Firma können dabei entstehende negative Emotionen recht schnell zum Verlust eines potentiellen bzw. bestehenden Kunden führen, was natürlich nicht gewünscht sein kann.
Standardisierte und statische Fragebögen oder Bewertungsverfahren, existieren auch in einer adaptiven bzw. antwort-sensitiven Form. Das bedeutet, dass der Kunde bzgl. gegebener Antworten oder Ratings spezifischer in damit verbundenen Themengebieten weiter befragt wird. Dennoch kann auch in diesem Fall nur wiederum ein eingeschränktes und modellhaftes Profil erstellt werden, da durch die themenbezoge-
1 uniform ressource locator, eindeutige Bezeichnung einer Ressource im Internet
8 2. Bestehende Ansätze, Verfahren und Systeme
ne Konstruktion der Verfahren nicht in beliebig viele Interessensgebiete vorgestoßen werden kann.
2.1.3 Erweiterte Ansätze
Eine Lösung dieses Problems wäre z.B. bereits beim Informationsgewinnungsprozess auf die individuellen Bedürfnisse des Kunden einzugehen, d.h. Fragen zu stellen bzw. Situationen zu schaffen, die mit dessen Interessen konform gehen. Diese Forderung verlangt jedoch nach einem flexibleren als den bisher geschilderten Verfahren. Das System muss nämlich nicht nur in der Lage sein, nicht-vordefinierte Eingaben des Kunden zu verarbeiten, sondern auch während der Interaktion mit diesem dessen individuellen Interessen stets im Auge zu behalten. Eine Erweiterung des Konzepts alleiniger Sammlung von Kundeninformationen stellt das System LifeStyle Finder [28] dar. Die Grundidee hierbei ist es, dem Benutzer Fragen zu stellen, um ihn anhand seiner Antworten - die hier jedoch vorgegeben sind - in Gruppen(modelle) einzuteilen, von denen man ausgeht, dass die jeweiligen Gruppenmitglieder ähnliche Interessen teilen. Wesentlich weiter geht jedoch das dieser Arbeit zugrunde liegende Profilerhebungssystem, das im Projekt SFB582 Anwendung findet. Das Ziel ist dabei, den Benutzer mittels gezielter Fragen nicht nur in ein soziologisches Gruppenmodell einzuordnen, sondern darüberhinaus dessen individuelles Benutzerprofil basierend auf konfigurierbaren Parametern, wie z.B. der Anzahl der vom System zu stellenden Fragen, möglichst umfassend zu erweitern [69]. Die Bedeutung des Begriffs ”soziologisches Gruppenmodell” wird im Kapitel 3.2.3 eingehend erläutert. Zum vorübergehenden Verständnis stelle man sich einfach eine Einteilung von Kunden in vordefinierte Gruppenkonzepte vor, die gemäß bestimmter Kriterien definiert sind, wie z.B. etwa Einkaufsgewohnheiten oder sportliche Vorlieben. Grundlage für dieses Vorgehen ist die Annahme, dass Mitglieder derselben Gruppe ähnliche Verhaltensweisen in ihrer Konsumtätigkeit aufweisen. Zum einen hat hier also der Benutzer die Möglichkeit in Freitext zu antworten, zum anderen werden die Fragen ausgewählt basierend auf den Informationen, die bereits über den Benutzer bekannt sind [71]. Auf diese Weise entsteht ein adaptiver Dialog zwischen Kunden und System, der hauptsächlich über das aktuelle, spezifische Benutzerprofil gesteuert wird. Vor diesem Hintergrund kann ein solcher Dialog wesentlich früher und ökonomischer zum Abschluss gebracht werden, als z.B. standardisierte Online-Fragebögen. Darüberhinaus wird damit auch die eingangs geforderte Interessenskonformität erreicht.
Wenn es für den Benutzer möglich sein soll, in Freitext zu korrespondieren, muss das System auch in der Lage sein, natürliche Sprache zu verarbeiten. Diese NLP-Fähigkeit 2 ist ein zusätzlicher Pluspunkt, denn wie [8] anführt, belegte eine Umfrage unter Internet-Nutzer, dass diese mit 79% einer natürlich-sprachlichen Navigation in eCommerce Sites den Vorzug geben würden, während nur 21% die Menü-geführte Steuerung favorisierten. Die Möglichkeit einer Kombination mit impliziten Verfahren
2 natural language processing
2.2 Dialogsysteme 9
ist ebenfalls gegeben.
Eine genaue Beschreibung des Profilerhebungssystems, welches zwar für den Einsatz im Rahmen des SFB582 konzipiert wurde, jedoch grundlegend für jeden webbasierten Anwendungsbereich mit Kundeninteraktion Verwendung finden kann, erfolgt in Kapitel 3.1.
2.1.4 Zusammenfassung und Diskussion
Verfolgt man die oben angeführte Gliederung der Verfahrensarten von den impliziten über die expliziten Ansätze, bis schließlich zur letztgenannten Möglichkeit, über natürlich-sprachliche Interaktion in flexibler und adaptiver Weise, Benutzerdaten zu gewinnen, so impliziert diese Reihenfolge die Zunahme von Qualität der Kun-deninformationen auf Kosten einer Zunahme von Komplexität sowohl auf Seite des Kunden als auch des Systems. Wie sooft muss also ein ”Tradeoff” gemacht werden. Hier: Je genauer die Informationen sein sollen, desto aktiver muss der Kunde in den Prozess mit einbezogen werden. Je weniger der Kunde dabei (zeitlich) beansprucht werden soll, desto mehr algorithmischen Aufwand (Komplexität) muss das System übernehmen.
Unabhängig von der Art oder Qualität der Informationsgewinnung, soll jedoch daraufhin gewiesen werden, dass es keine statische Anwendung in diesem Bereich geben kann, da sich Interessen und Vorlieben von Menschen im Laufe der Zeit verändern. Dies führt auf Seiten des Systems zur Notwendigkeit, in regelmäßigen Abständen Kundenprofile auf den neuesten Stand zu bringen. Die persönliche Einschätzung des Autors führt zu der Vermutung, dass die Akzeptanz und das Vertrauen einem System zur Profilgenerierung gegenüber zunehmen dürfte, wenn der Benutzer am wenigsten das Gefühl hat, mit einem technischen System im Dialog zu stehen. Dialogsysteme, in welche o.g. explizite Verfahren zur Profilgenerierung eingebettet werden, sind dafür als effektive ’Trägersysteme’ einsetzbar. Welche Arten von Dialogsystemen es gibt und wie diese klassifiziert werden können, zeigt das nächste Kapitel.
2.2 Dialogsysteme
Nach [41] ermöglichen Dialogsysteme (DS) dem Benutzer die Interaktion mit Computer-basierten Anwendungen, wie Datenbanken oder Expertensystemen unter Verwendung natürlicher Sprache. Sie stellen also eine Schnittstelle in der Mensch-Maschine-Kommunikation dar. Entwickelt aus der Forschung über gesprochene Sprache bereiten DS somit die Grundlagen für ausgeprägte Interaktivität von Applikationen und sind dabei häufig stark anwendungsspezifisch (bereichsspezifisch) ausgerichtet. Laut [44] gab es in den letzten Jahrzehnten starke theoretische und praktische Bemühungen zur Erforschung der Eigenheiten und der Struktur des Dialogvorgangs im allgemeinen und der Mensch-Maschine-Kommunikation im speziellen. Grosses Inter-
10 2. Bestehende Ansätze, Verfahren und Systeme
esse dafür kam besonders aus den Forschungsbereichen der künstlichen Intelligenz 3 und Computerlinguistik (computational linguistic). und mittlerweile, stark gefördert durch die Entwicklung des Internets, haben mit DS verbundene Technologien auch ihren Einzug in die Bereiche von Wirtschaft und Ökonomie angetreten [41]. Z.B. helfen DS im Kontext von eCommerce Websites bei der Reduzierung von Mausklicks durch den Besucher, während dieser nach einem bestimmten Produkt oder Dienstleistung sucht [5]. Es ist somit das Ziel, den Suchaufwand des Kunden zu reduzieren und ”Sackgassen” beim Suchvorgang zu vermeiden, da Untersuchungen gezeigt haben, dass die Geduld des Kunden mit der Zunahme der Mausklicks exponentiell abnimmt. Im Vergleich zu Suchmaschinen oder einer Menüsteuerung, ermöglicht ein adaptiver Dialog mit dem Kunden eine zielgerichtete Navigation und stellt dadurch für diesen eine Erleichterung und somit eine Verbesserung gegenüber den beiden erstgenannten Verfahren dar.
Im Umfeld des Beispiel-Systems Natural Language Sales Assistant [8] durchgeführte Studien belegen, dass ca. 80% der Anwender eine Dialog-basierte Navigation einer Menü-basierten vorziehen. Gründe für dieses Ergebnis sind z.T. praktischer Natur, wie z.B. die Reduzierung von notwendigen Mausklicks um knapp 63% und eine damit verbundene Zeitersparnis für den Suchvorgang auf Seiten des Kunden von ca. 33% im Durchschnitt. Neben diesen Vorteilen, existieren aber auch einige kritische Kernpunkte für den erfolgreichen praktischen Einsatz: • die Fragenformulierung muss an die Erfahrungen und den Wissensstand des Benutzers angepasst sein; andernfalls besteht die Gefahr der Überforderung und Frustration [5].
• die Fehlerrate bei der Interpretation der Kundeneingabe sollte gering sein, ansonsten sind mehrmalige Umformulierung oder Wiederholungen durch den Benutzer nötig [5]. → schneller Interessensverlust.
• Tippfehler des Kunden sollte das System implizit und transparent korrigieren können [75].
• der Anwender muss verstehen, was das System tut bzw. was es gerade zu erreichen versucht; andernfalls kann der Kunde nur schwer Vertrauen zur Arbeit des Systems aufbauen [41].
Der angesprochene Natural Language Sales Assistant kann in den Bereich der Agentenbasierten (agent-basierten) DS eingeordnet werden. Welche weiteren Kategorien zusätzlich existieren und worin sie sich unterscheiden wird im Folgenden beleuchtet.
2.2.1 Kategorisierung
Grundsätzlich bestehen mehrere Ansätze, um DS zu kategorisieren. Die Intelligenz des DS sieht [44] dabei als eine Möglichkeit an. Die Definition des Begriffs ”Intelli-
3 KI, engl.: artificial intelligence, AI
Finite-State-basierte Systeme
Finite-state-basierte Systeme werden in den meisten kommerziellen Anwendungen verwendet, weil sie leicht zu implementieren sind [20]. Sie ähneln Transitionssystemen, in denen die Dialogstruktur einem Zustands-Übergangs-Netz entspricht. Der Dialog folgt einem vordefinierten Ablauf, einer Sequenz vordefinierter Schritte. Der
4 Beschreibung siehe http://www.turing.org.uk/turing/scrapbook/test.html
Abbildung 2.2: Dialogbeispiel für ein Finite-state-basiertes System (Quelle: [41])
kum von Finite-state-basierten Systemen zu erkennen: Die Dialogsteuerung bzw. die Initiative geht stets vom System aus. Auf diese Weise ist der Benutzer gezwungen zu reagieren und ist nicht in der Lage eventuell undefinierte Anfragen an das System zu stellen. Man kann dies auch als System-orientierten Ansatz bezeichnen.
Frame-basierte Systeme
Bei Frame-basierten Systemen handelt es sich grundlegend um eine Verfeinerung des vorherigen Graphen-basierten Ansatzes und ist ebenfalls in kommerziellen Anwendung vermehrt eingesetzt. Abhängig vom Einsatzgebiet, ist es oftmals das Ziel des Systems genügend Informationen vom Kommunikationspartner zu sammeln, um damit eine bestimmte Transaktion auszuführen, z.B. in Flugbuchungssysteme, Empfehlungssysteme, usw. Aus diesem Grund werden sie auch häufig als inquiry-oriented oder information-seeking Systeme bezeichnet [44].
Die zugrundeliegende Dialogstruktur ist das Template (einer Frage) mit ”Slots”, die mit den jeweiligen Attributen bzw. Variablen gefüllt werden, um damit die für die Ausführung der Transaktion noch benötigten Informationen zu erhalten. Aus der Betrachtung der Templates als Rahmen, der die ”Slots” umgibt, ergibt sich auch die Bezeichnung der Frame-basierte Systeme. Die Reihenfolge der Fragestellung ist da-
Abbildung 2.3: Dialogbeispiel für ein Frame-basiertes System (Quelle: [41])
ist nur begrenzt anwendbar, da keine allzu komplexen Transaktionen modelliert werden können. Es ist somit ebenfalls ein klar strukturierbares Anwendungsgebiet nötig, z.B. Verkauf von Büchern oder Ausgabe von Reiseinformationen, wie in Abbildung 2.3 auszugsweise dargestellt. Da die Kundenantworten in einem bestimmten Rahmen erwartet werden, kann es darüberhinaus auch keine Möglichkeit für freie Verhandlungen zwischen System und Kunden geben.
Während es sich wie bei den Finite-state-basierte Systemen auch hier hauptsächlich um einen System-gesteuerten Ansatz handelt, kann dennoch auch der Kunde vereinzelt die Dialogkontrolle bzw. -initiative übernehmen, wie es an Stelle ’User 5’ in Abbildung 2.3 der Fall ist. Somit tendieren die Frame-basierte Systeme zumindest in Richtung gemischter Dialogkontrolle, d.h. Dialogkontrolle von Seiten des Systems und/oder des Benutzers.
Agent-basierte Systeme
Diese Systeme sind aktuell eher theoretischer Natur und verwenden größtenteils Techniken aus dem Bereich der KI. Der hauptsächliche Grund für die geringere praktische Verbreitung dieser Systemklasse gegenüber den beiden vorherigen Systemtypen, liegt
14 2. Bestehende Ansätze, Verfahren und Systeme
in der höheren Komplexität freier, nicht vordefinierter Kommunikationswege innerhalb der Anwendungsbereiche. ’Freie Kommunikationswege’ soll an dieser Stelle den Umstand bezeichnen, dass die Kommunikation zwischen Mensch und Maschine ohne vordefinierte Dialogkonventionen oder -protokolle abläuft, d.h. Mensch und Maschine können jederzeit den Dialog initiieren, die Dialogkontrolle übernehmen, auf Fragen reagieren oder auch nicht, usw (der Autor). Falls der Dialog stets nur vom Benutzer bzw. von dessen Anfragen gesteuert wird, sei das zugrundeliegende DS als ’Benutzer-orientiert’ bezeichnet. Die grundlegende Idee ist:
Modelliere Kommunikation als Interaktion zwischen intelligenten Agenten. Praktisch gesehen konnte jedoch dieses anvisierte Level freier Kommunikation bislang noch nicht durch intelligente Maschinen erreicht werden konnte. Es existieren verschiedene Architekturen für unterschiedliche Einsatzbereiche: - Theorembeweiser:
Lösungen von Aufgaben (zur Erreichung des Dialogziels) werden dynamisch entwickelt basierend auf Aktionen, die durch einen ”domain processor” empfohlen werden. Basis für die nächste Aufgabe sind der Wissenszustand über den Benutzer als auch die aktuelle Kommunikationssituation. In jedem Schritt erhält die Dialogsteuerung die empfohlene Aktion vom ”domain processor” und entscheidet, ob der Benutzer nach fehlenden Axiomen gefragt oder ob dazu die Logik des Theorembeweisers verwendet werden soll. Dann entscheidet der Theorembeweiser, ob die aktuelle Aufgabe, gesteuert durch die Benutzerangaben, erfüllt ist. - Plan-basierter Dialog:
Äußerungen des Kunden werden als Aktionen betrachtet, die ausgeführt werden, um ein spezifisches Ziel zu erreichen. Dieser Ansatz ist nur für eingeschränkte Anwendungsbereiche anwendbar, da die Computerberechnungen des Plans, der vom Startzustand zum Zielzustand führt schnell zu komplex werden. - BDI (Belief-Desire-Intention) Modell:
Auf diesem Modell basiert ein Ereignis-gesteuertes Dialogmanagement, welches Glaubens- und Absichtszustände für das System kreiert, nicht aber für den Benutzer. Somit kann die Maschine nur raten, ob das berechnete Modell auch wirklich auf die Betrachtungsweise des Benutzers zutrifft.
Ein Ereignis-gesteuertes Dialogmanagement nähert sich der Reaktionsweise eines Rahmen-basierten Systems an; es verwendet aber komplexere Repräsentationen für das Wissen im Dialogkontext. - Rationale Interaktion (RI):
Hier wird Kommunikation betrachtet als Bestandteil intelligenten Verhaltens. Es wird eine Balance zwischen geistiger Einstellung des Agenten und den auszuführenden Plänen verlangt. Handelt es sich bei einem Plan z.B. ein illegales oder vertrauliches Vorhaben, dann soll der Agent in der Lage sein, diesen Plan ggf. abzuweisen. Dabei ist die geistige Einstellung eines Agenten beschreibbar als die Beziehung zwischen dem Agenten und einem Plan bzw. einem Objekt. Ebenso wichtig ist die Idee eines Glaubenszustands, welcher allgemein die geistige Einstellung eines Agenten zu seiner Umwelt widerspiegelt, wobei Ungewissheit des Agenten den Glaubenszustand
Arbeit zitieren:
Thorsten Eiseler, 2005, Weiterentwicklung eines Dialog Managers für ein Profilerhebungssystem: Auflösung von Mehrdeutigkeiten im benutzeradaptiven, natürlich-sprachlichen Dialog mit dem Kunden, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Thorsten Eiseler hat den Text Weiterentwicklung eines Dialog Managers für ein Profilerhebungssystem: Auflösung von Mehrdeutigkeiten im benutzeradaptiven, natürlich-sprachlichen Dialog mit dem Kunden veröffentlicht
Thorsten Eiseler hat einen neuen Text hochgeladen
"Natürlich stört das Leben ständig"
Perspektiven auf Entwicklung u...
Sylke Bartmann, Axel Fehlhaber, Sandra Kirsch, Wiebke Lohfeld
Gelassenheit durch Auflösung innerer Konflikte
Mentale Selbstregulation und I...
Angelika C. Wagner
Logique Dialogique: Une Introduction. Volume 1: Mthode de Dialogique: ...
Matthieu Fontaine, Juan Redmond
The Inclusion of Other Women: Breaking the Silence Through Dialogic Le...
Breaking the Silence Through D...
Montse Sanchez-Aroca, Lena de Botton, Lmdia Puigvert
Führungskommunikation. Dialoge
Kommunikation im Wandel - Wand...
Lars Dörfel, Ulrich E. Hinsen
0 Kommentare