Weiterentwicklung eines Dialog Managers für ein Profilerhebungssystem: Auflösung von Mehrdeutigkeiten im benutzeradaptiven, natürlich-sprachlichen Dialog mit dem Kunden


Diplomarbeit, 2005

110 Seiten, Note: 1.3


Leseprobe

Inhaltsverzeichnis

1 Einführung
1.1 Motivation
1.2 Aufgabenstellung und Abgrenzung
1.3 Aufbau der Arbeit

2 Bestehende Ansätze, Verfahren und Systeme
2.1 Profilerhebung
2.1.1 Implizite Verfahren
2.1.2 Explizite Verfahren
2.1.3 Erweiterte Ansätze
2.1.4 Zusammenfassung und Diskussion
2.2 Dialogsysteme
2.2.1 Kategorisierung
2.2.2 Typische Systemkomponenten
2.2.3 Zusammenfassung und Diskussion
2.3 Disambiguierung
2.3.1 Ambiguität
2.3.2 Disambiguierung von Wortbedeutungen - ein Überblick .
2.3.3 Einsatzgebiete von Disambiguierungsverfahren
2.3.4 Kategorisierung
2.3.5 Stochastische Verfahren
2.3.6 KI-basierte, nicht-stochastische Verfahren
2.3.7 Hybridverfahren
2.3.8 Evaluierung

3 Ausgangssituation
3.1 Darstellung des Profilerhebungssystems
3.1.1 Konzeptbeschreibung
3.1.2 Aufbau und Struktur des Benutzerprofils
3.2 Architektur des Profilerhebungssystems
3.2.1 Language Analysis
3.2.2 Profile Manager
3.2.3 Target Group Matching
3.2.4 Dialog Manager
3.3 GermaNet
3.3.1 Architektur
3.3.2 Relationen
3.3.3 Einsatzmöglichkeit
3.4 Ablauf/Kontrollfluss
3.5 Zusammenfassung und Diskussion

4 Anforderungsanalyse
4.1 Funktionale Anforderungen
4.2 Nicht-funktionale Anforderungen

5 Entwicklung der Disambiguierungskomponente
5.1 Betrachtung und Auswahl bestehender Ansätze
5.1.1 Situationsspezifische Betrachtung
5.1.2 Semantische Verwandtschaft/Ähnlichkeit - Begriffe . .
5.1.3 Semantische Verwandtschaft/Ähnlichkeit - Verfahren .
5.1.4 Semantische Verwandtschaft/Ähnlichkeit - Bewertung
5.1.5 Auswahl und Einordnung des Verfahrens .
5.2 Algorithmus zur Disambiguierung
5.2.1 Vorausgehende Überlegungen
5.2.2 Beschreibung des Algorithmus
5.3 Systemdesign
5.4 Implementierung
5.4.1 Konfiguration
5.4.2 Packages und Klassen
5.4.3 Methoden
5.4.4 Datenmodelle
5.5 Evaluierung
5.6 Zusammenfassung und Diskussion

6 Zusammenfassung und Ausblick

Literaturverzeichnis

Zusammenfassung

Der seit Beginn des 21. Jahrhunderts einsetzende Trend der Individuumsorientie-rung hält als gesellschaftliche Strömung auch Einzug in den ökonomischen Sektor. Der Bedarf an individuellen Diensten und Produkten, die an die persönlichen Be-dürfnisse und Interessen des Kunden angepasst sind, wächst. Die Philosophie ”Der Kunde ist König” ist nicht mehr nur alleine in der ”alten Ökonomie” eine grundle-gende Voraussetzung für wirtschaftlichen Erfolg. Besonders seit der Entdeckung des Internets und seiner Möglichkeiten durch Betriebe und Unternehmen entwickelt sich ein Kampf um den Kunden. Dieser ist nämlich in der Lage, von einer Sekunde zur nächsten einen anderen Online-Dienst zu nutzen. Um den Kunden zu halten, muss ein Mehr-Wert generiert werden, so dass sich dieser wohl und verstanden fühlt und gerne wieder zurückkehrt. Die Anpassung von Informationen, Werbung und Ange-boten an die persönlichen Interessen des Kunden fördert dieses Gefühl. Doch dazu müssen dessen Interessen erst einmal bekannt sein. Effektive Methoden zur Profilge-nerierung sind gefragt. Dabei sollen die gesammelten Daten nicht nur umfangreich und korrekt sein, sondern der Kunde soll während dieses Prozesses auch möglichst wenig zeitlich involviert bzw. belastet werden.

Um beide Anforderungen zu erfüllen, kommen Dialogsysteme zum Einsatz, an die bzgl. Komplexität und Performanz abhängig vom Einsatzgebiet verschiedene Ansprü-che gestellt werden. Von einfachen, zustandsbasierten Systemen bis zu Agenten, die für die Dialogführung auf Techniken der künstlichen Intelligenz (KI) zurückgreifen, unterliegt das komplette Spektrum dieser Verfahren intensiven Forschungsbemühun-gen, die von industrieller Seite interessiert beobachtet und begrüßt werden. Jedoch stellt sich bei den meisten technischen Verfahren, die im Dialog mit dem Menschen agieren sollen, das Problem, natürliche Sprache zu verarbeiten oder sogar zu verste-hen. Neben der Tatsache, dass die Verarbeitung natürlicher Sprache ein Teilgebiet der KI ist, stellt darin der Problemkreis der Disambiguierung, d.h. das Auflösen von Mehrdeutigkeiten, die größten Schwierigkeiten für einen umfangreichen Einsatz sprachverarbeitender Systeme in der Praxis dar, wie beispielsweise in den Bereicheninformation retrievalodermachine translation. Da es aber auch für Systeme, die anhand eines Benutzerprofils Produktempfehlungen aussprechen, einen Unterschied macht, ob ein Kunde mit dem Wort ’Dichtung’ literarische Werke oder eine Vorrich-tung zum Abdichten meint, erfährt die Disambiguierung ebenfalls im Umfeld der Profilgenerierung ihr berechtigtes Interesse.

Im Rahmen dieser Arbeit soll für ein Profilerhebungssystem ein bereits bestehen-der Dialog Manager, als zentrale Komponente eines Dialogsystems, weiterentwickelt werden. Das Ziel ist dabei die Entwicklung eines Verfahrens zur Disambiguierung von Kundeneingaben während des Dialogs. Dazu werden im Vorfeld die verschiedenen Va-rianten von Profilerhebungssystemen, Dialogsystemen und Disambiguierungsverfah-ren diskutiert, die bereits existieren und zum Teil auch praktisch eingesetzt werden. Auf dieser Basis erfolgt die Betrachtung der vorhandenen Systemgegebenheiten und

Ressourcen, um vor diesem Hintergrund eine effektive und effiziente Strategie zur Disambiguierung zu entwickeln, zu implementieren und letztlich in das bestehende Profilerhebungssystem zu integrieren.

Abbildungsverzeichnis

2.1 Strategien zur Dialogsteuerung

2.2 Dialogbeispiel für einFinite-state-basiertesSystem

2.3 Dialogbeispiel für einFrame-basiertesSystem

2.4 Dialogbeispiel für einAgent-basiertesSystem

2.5 Typische Komponenten eines Dialogsystems

3.1 XML-Darstellung eines Interessensknoten

3.2 Komponenten des SFB-582 Profilerhebungssystems

3.3 Übergang vom Ergebnis derLAzum Interessensknoten

3.4 Auszug aus einem Profilknoten

3.5 Beispiel einer Klassifikation in GermaNet

4.1 Einordnung des WSD-Moduls im Dialogsystem

5.1 Befehlsumfang des GermaNet-Tools ’gwn’

5.2Synsetsin GermaNet für das Wort ’Geld’

5.3 Beispielablauf des entwickelten WSD-Systems

Tabellenverzeichnis

2.1 Notations-Konventionen für Bayes-Klassifikator

3.1 Mögliche Attribute innerhalb eines Benutzerprofils

3.2 Die wichtigsten GermaNet Relationen

5.1 semantische Ähnlichkeit, Korrelationskoeff. im Englischen (a)

5.2 semantische Ähnlichkeit, Korrelationskoeff. im Englischen (b)

5.3 semantische Ähnlichkeit, Korrelationskoeff. im Deutschen

Kapitel 1 Einführung

Im Rahmen des Sonderforschungsbereich 582 (SFB582) - Marktnahe Produktion in-dividualisierter Produkte, welcher durch die Deutsche Forschungsgemeinschaft (DFG) an der TU München bewilligt wurde, sollen Ideen und Ansätze entwickelt werden, auf welche Weise zukünftig jeder Kunde ein individuell angefertigtes Produkt zu Kondi-tionen eines entsprechenden Standarderzeugnisses ”in place”, d.h. vor Ort bekommen kann.

In diesem interdisziplinären Vorhaben, welches in 14 Teilprojekte untergliedert ist, erarbeiten rund 30 Wissenschaftler der Fakultäten Maschinenbau, Informatik und Wirtschafts- und Sozialwissenschaften “ [...]Methoden, Werkzeuge und Verfah-ren, um kundenindividuelle Produkte entwickeln und marktnah produzieren zu kön-nen - zu Bedingungen einer vergleichbaren Serienproduktion!”87 . Die Umsetzung dieser Idee soll in sog. ”Minifabriken” erfolgen, die weltweit verteilt von Kunden besucht werden können. Diese können dort direkt ihre persönlichen Wünsche und Vorstellungen anbringen und auf diese Weise ihr eigenes Produkt spezifizieren und konfigurieren. Anschließend kann dieses vor Ort hergestellt werden. Die Realisierung dieser Vision ist als Antwort auf den einsetzenden Trend der Individuumsorientierung zu sehen, welcher zu Beginn des 21.Jahrhunderts die Vorgängerströmungen Produkt-und Marktorientierung abzulösen scheint. Begriffe wie ”Cocooning”, mittlerweile von bekannten Zukunfts- und Trendforschern, wie z.B. Faith Popcorn geprägt, deuten bereits heute auf diese Situation hin.

Innerhalb des Teilprojekts P3 wurde dem Teilbereich des Lehrstuhls Informatik XI die Aufgabe übertragen, individualisierte Produktinformation zu generieren und interaktiv anzupassen. Wie die im Emblem des SFB582 befindliche Krone andeutet, gilt der Kunde als König. Auf dessen Bedürfnisse, Wünsche und Vorstellungen soll in-dividuell eingegangen werden. Eine grundlegende Voraussetzung dafür ist jedoch, erst einmal diese Kundeninformationen zu kennen, d.h. z.B. Arbeitsverhältnis, Familien-stand, Hobbies, Sportvorlieben, politische Interessen, usw. Es ergeben sich dadurch viele Kategorien, denen bzgl. eines bestimmten Anwendungsgebiets unterschiedliche Prioritäten zugeordnet werden können. Beispielsweise ist die Kenntnis über politi-sche Vorlieben des Kunden in einem Online-Shop, der Angelbedarf führt, von relativ niedriger Priorität. Mit steigender Kundenorientierung bedarf es also Verfahren, in-dividuelle Kundendaten zu generieren bzw. zu sammeln und diese letztlich, z.B. in einem Kundenprofil, zur weiteren Verwendung abzuspeichern. In einer fortgeschrit-tenen Weise führt dies zu Kommunikationssituationen zwischen einem technischen System und einem Menschen (Kunden), quasi einem Dialog der von Seiten des Sys-tems zu dem Zweck geführt wird, um individuelle Informationen über den Kunden zu gewinnen.

1.1 Motivation

Wie die Kapitel 2.1 und 2.2 zeigen werden, gibt es sowohl mehrere Ansätze, Kunden-profile zu generieren als auch verschiedene Konzepte von Dialogsystemen. Das Sys-tem, welches im SFB582 zur Profilgenerierung eingesetzt wird und auch dieser Arbeit zugrunde liegt, hebt sich von alternativen Verfahren dadurch ab, dass es in der Lage ist, nicht-vordefinierte, in natürlicher Sprache geäußerte Kundeninteressen als Einga-ben zu verarbeiten. Aufgrund dieser Flexibilität ist es dem System möglich, adaptiv, d.h. sich an bereits vorhandenem Wissen über den einzelnen Kunden orientierend, zielgerichtet ein individuelles Profil desselben aufzubauen. Wie oft in der Informa-tik, verdeutlicht die Vorstellung eines Spiels (Gegenspielerbeweise, wissensbasierte Systeme) die vorangegangene Aussage: Man stelle sich ein Frage-Antwort-Spiel vor, in dem der fragende Teilnehmer (System) dem antwortenden Teilnehmer (Kunde) Fragen stellt, die auf dessen vorausgegangenen Antworten basieren und zwar solange bis entweder eine festgesetzte Anzahl von Fragen erreicht ist oder die gewünsch-te Menge an spezifischen Informationen gesammelt werden konnte. Eine detaillierte Beschreibung dieses Ablaufs wird in Kapitel 3.1 auf Seite 35 beschrieben.

Die Möglichkeit, dass hier Kundeneingaben nicht vordefiniert sind, sondern frei und in natürlicher Sprache formuliert werden können, führt jedoch zu zusätzlichen Problemstellungen. Zum einen stellt sich die Analyse und Verarbeitung natürlicher Sprachen als wesentlich komplexer dar, als dies z.B. etwa bei formalen Sprachen, wie z.B. Programmiersprachen, der Fall ist (siehe auch Kapitel 3.2.1). Zum anderen sind in fast allen natürlichen Sprachen darin verwendete Wörter oftmals mit mehreren Bedeutungen behaftet. Neben der syntaktischen Analyse, erschwert dieser Umstand ganz besonders die semantische Zuordnung. Würde nämlich ein Kunde erklären, dass eines seiner Interessen ”Dichtung” sei, wäre es ohne zusätzliche Informationen für das System a priori nicht möglich, eindeutig zu entscheiden, ob dieser den Bereich der ”Sprachkunstwerke” oder eine ”Vorrichtung zum Abdichten an Verbindungsstellen von Geräten und Maschinen” meint. Wie Kapitel 2.3 zeigt, ist die Existenz von Mehrdeutigkeiten (Ambiguität bzw. allg. Polysemie) (siehe unten) eines der Haupt-probleme in manchen Bereichen der Informatik, wie z.B.information retrievalodermachine translation.

Ambiguität urspr. aus dem Lateinischen: Zweideutigkeit, Doppelsinn90 heute allg.: Mehrdeutigkeit

Polysemie die Erscheinung, dass dasselbe Wort mehrere Bedeutungen hat, z.B. das Schloss (Gebäude - Türschloss) 90

1.2 Aufgabenstellung und Abgrenzung 3

disambiguieren einen Ausdruck durch Einordnen in bestimmte syntaktische und semantische Zusammenhänge seiner Mehrdeutigkeit entheben; etwas eindeutig machen, Zweideutigkeit aufheben90

Diese Problematik der eindeutigen Zuordnung findet auch im Aufbau eines Kun-denprofils ihren Einschlag. Es besteht für das System die vordringliche Aufgabe, möglicherweise mehrdeutige Kundeneingaben zu disambiguieren (siehe oben), d.h. herauszufinden, was der Kunde tatsächlich meint. Die Generierung von derartigen Profilen ist ja nur dann sinnvoll, wenn die so gesammelten Daten später in irgend-einer Weise weiterverwendet werden sollen, z.B. für Statistiken oder innerhalb von Empfehlungssystemen57 . Um beim obigen Beispiel zu bleiben, würden Empfehlun-gen von Handwerkerprodukten den Kunden vermutlich doch sehr verwundern, falls er im Vorfeld dem System mitgeteilt hat, dass er sich für Dichtung und ganz be-sonders für Werke von Goethe und Schiller interessiert. Die Akzeptanz eines solchen Systems auf Anwenderseite schwindet.

Die Konsequenzen einer derartigen Fehldeutung erscheinen offenkundig, da ei-nerseits die Korrektheit und Sinnhaftigkeit der gesammelten Datenmenge in Fra-ge gestellt werden muss und andererseits psychologische Aspekte auf Kundenseite in Mitleidenschaft gezogen werden. Man kann leicht selbst nachvollziehen, dass es recht schwierig ist, zu einem System - und letztlich zur dahinter stehenden Firma -Vertrauen aufzubauen, wenn dieses nicht verlässlich ist oder nicht korrekt arbeitet. Sollte man häufig Produkte empfohlen bekommen, die nicht mit den eigentlichen persönlichen Interessen korrelieren, fühlt man sich als Kunde zunehmend nicht in-dividuell behandelt und wird eher nach Konkurrenzfirmen Ausschau halten. Vor diesem Hintergrund wird klar, dass eine effektive Strategie zur Auflösung von Wort-Mehrdeutigkeiten, kurz WSD1 , im Rahmen eines Profilerhebungssystems einen kri-tischen Aspekt in Bezug auf Kundenakzeptanz und -vertrauen darstellt und damit auch auf den wirtschaftlichen Nutzen und Erfolg eines Unternehmens wichtigen Ein-fluss haben kann.

1.2 Aufgabenstellung und Abgrenzung

Wie aus dem Titel der Diplomarbeit zu entnehmen, ist der Schwerpunkt dieser Ar-beit der Entwurf und die Implementierung einer Strategie zur WSD von Kunden-eingaben zur Profilgenerierung. Die Wichtigkeit einer solchen Komponente (auch benennbar als WSD-Modul) für jegliche Form von Profilerhebungssystem auf Basis nicht-vordefinierter Kundeneingaben wurde bereits im vorangehenden Abschnitt be-leuchtet. Vorausgreifend muss jedoch darauf hingewiesen werden, dass die in dieser Arbeit entwickelte Systemkomponente als proprietär zu betrachten ist, d.h. sie orien-tiert sich stark an den aktuellen Gegebenheiten des Profilerhebungssystems und ist somit kaum ohne entsprechende Anpassungen in andere Systemkontexte portierbar. Aufgrund wechselnder Systemvorgaben, -gegebenheiten und Kontextinformationen existieren nämlich eine Vielzahl unterschiedlicher und z.T. recht gegenläufiger Ansätze zur WSD in den verschiedensten Einsatzbereichen. Dieser Sachverhalt wird im einzelnen in Kapitel 2.3 und im speziellen in Kapitel 5 herausgearbeitet.

Als Weiterentwicklung eines bestehenden Profilerhebungssystems im Rahmen des SFB582 sind somit im Vorfeld ebenfalls dessen momentanen Gegebenheiten und Ab-läufe zu untersuchen und in die Design- und Implementierungsentscheidungen für die Entwicklung des WSD-Moduls mit einzubeziehen. Kapitel 3.1 wird dieser Notwendig-keit gerecht. Ein Dialogmanager, in welchen das WSD-Modul integriert werden soll, wird für die zentrale Steuerung innerhalb des Profilerhebungsvorgangs zuständig sein. Dieser, wie auch Funktionskomponenten zur Verarbeitung der natürlich-sprachlichen Eingaben des Kunden sind bereits vorhanden und werden somit nicht im Rahmen dieser Arbeit entwickelt. Die Beschreibung und Erläuterung der gerade erwähnten Systembestandteile sind jedoch für das weitere Verständnis der Arbeitsweise und In-tegration des zu entwickelnden WSD-Moduls unverzichtbar, und werden mitunter in den Kapiteln 3.2.4 und 3.2.1 erfolgen.

1.3 Aufbau der Arbeit

Zunächst werden im Kapitel 2 die Bereiche der Profilerhebung, der Dialogsysteme und der Auflösung von Mehrdeutigkeiten (Disambiguierung, WSD) betrachtet. Dabei werden bestehende Ansätze und Realisierungen herausgearbeitet und ggf. Beispiele für bereits existierende Referenzsysteme skizziert. Im Anschluss daran werden die Ausgangssituation und die Grundlagen für diese Arbeit genauer betrachtet: Nach einer Einordnung des gegebenen Profilerhebungssystem in bestehende Kategorien, erfolgt eine Darstellung der Systemarchitektur samt Beschreibung der Funktionswei-sen der vorhandenen Teilkomponenten. Dieses Kapitel 3 endet mit einer Erläuterung des verwendeten lexikalisch-semantischen Wortnetzes für die deutsche Sprache, Ger-maNet88 . Nach einer kurzen Untersuchung der Anforderungen, die das zu entwi-ckelnde Modul zur WSD erfüllen soll (Kapitel 4), steht die Entwicklung der Disam-biguierungskomponente im Rahmen des bestehenden Dialogsystems im Mittelpunkt. Neben der Einordnung in die aktuelle wissenschaftliche Forschung, beschreibt Ka-pitel 5 die Algorithmusidee, das Design und letztlich die Implementierungssituation dieser Komponente bzw. Moduls. Kapitel 6 schließlich beendet diese Arbeit mit ei-ner Zusammenfassung der behandelten Themen und einem Ausblick, beinhaltend möglicher Verbesserungs- und Erweiterungsvorschläge.

Um den Lese- und Verständnisfluss nicht zu unterbrechen, soll im folgenden die Konvention gelten, dass erklärungsbedürftige Wörter oder Begriffe, die in dieser Arbeit Verwendung finden, bei ihrem ersten Auftreten definiert werden und nicht etwa in einem separaten Kapitel.

Kapitel 2 Bestehende Ansätze, Verfahren und Systeme

Die Überschrift dieses Kapitels wurde bewusst allgemein gehalten, da es Raum bie-tet für drei grosse Bereiche, die in ihrer folgenden Darstellung logisch-kausal mit-einander zusammenhängen. Diese Themengebiete ’Erhebung von Benutzerprofilen’, ’technische Systeme zur Dialogführung’ und ’Disambiguierung von Mehrdeutigkei-ten’ sollen nun vor dem Hintergrund einiger grundlegenden Fragen, wie:

- Welche Ideen liegen bestehenden Ansätzen jeweils zugrunde?
- Wie können diese Ansätze in Verfahren umgesetzt werden?
- Gibt es bereits experimentelle/praktisch einsetzbare (Beispiel-)Systeme? beleuchtet werden.

2.1 Profilerhebung

Nicht nur im technisch-technologischen, sondern auch ganz besonders im öffentlich-wirtschaftlichen Bereich spielen Kunden- bzw. Benutzerprofile eine immer wichtigere Rolle. Sei es zum einen die Möglichkeit, die Einstellungen seines Rechners, Handys oder anderer technischer Geräte auf die persönlichen Bedürfnisse und Vorlieben ein-zustellen, interessiert sich zum anderen in der Ökonomie nicht nur der Kunde für eine Möglichkeit seine Interessen vermitteln zu können. Ganz besonders auch Fir-men und Unternehmen, die ihre Produkte und Dienstleistungen eben diesem Kun-den schmackhaft machen wollen, wären verständlicherweise sehr an derartigen Infor-mationen interessiert. Mehrere hundert Millionen Euro, die von Firmen jährlich an Marketing- und Trendforschungsfirmen gezahlt und somit in Meinungsumfragen und Kundenbefragungen investiert werden, sind ein deutliches Indiz.

In Zeiten, in denen das gesellschaftliche, wirtschaftliche und private Leben für jeden einzelnen nicht nur immer schneller, sondern auch immer komplexer zu werden scheint, entstehen Gegenströmungen, wie mitunter das Bedürfnis nach Sicherheit, Verlangsamung und ganz besonders nach Vereinfachung22 . Ein Medium, welches sowohl eines der Gründe für die erstgenannte ”Zivilisationsbeschleunigung” war und ist, kann nun ebenso auch als Werkzeug dienen, um das Leben von Anwendern, Kunden, Benutzern leichter und bequemer zu machen: das Internet.

Gerade im Internet hat man stets die Qual der Wahl: Welche Suchmaschine nutze ich heute? Wo möchte ich welches Buch zu welchem Teilgebiet kaufen? Wer kann mir wie bei der Lösung eines Problems helfen? Bei welcher Online-Versicherung soll ich abschließen? usw. Oftmals sehnt man sich nach Hinweisen, die einem die Entschei-dung abnehmen oder zumindest Hilfestellung geben sollen. Bekannte Konzepte sind dabei, Top-Ten- bzw. Top-100-Listen, Kundenrezensionen, Kritiken, Foren, usw. Ne-ben der Tatsache, dass es sich dabei wieder um zusätzliche, z.T. widersprüchliche Informationen handeln kann, sind diese oftmals sehr subjektiv geprägt und können somit auch völlig an den ursprünglichen Anforderungen und Ansprüchen des Kunden vorbeigehen. Eine adäquate Lösung kann somit nur sein, Angebote und Informatio-nen an die tatsächlichen und individuellen Bedürfnisse des einzelnen Benutzers anzu-passen; ein Ansatz wie er in einigen Empfehlungssystemen (recommender systems) verfolgt wird, z.B.63 .

Auf diese Weise schließt sich der Kreis und die Notwendigkeit und der Sinn von Benutzerprofilen, gerade in web-basierten Anwendungen wird deutlich. Ein derartiges Benutzerprofil filtert quasi für einen individuellen Benutzer die Flut an Informationen gemäß der darin abgespeicherten Daten (Interessen, Vorlieben, Bedürfnisse, usw.). An diese Idealvorstellung schließen sich jedoch sofort einige interessante Fragen an:

1. Gibt es Standards, Ontologien, Datenmodelle für das Design und die Struktur von Benutzerprofilen?
2. Welche Daten bzw. Typen oder Klassen von Daten bilden ein solches Benut- zerprofil?
3. Wie können individuelle Daten für das Benutzerprofil gewonnen werden?
4. Wie verhält es sich mit der Qualität der Daten im Benutzerprofil, d.h. Aktua- lität, Korrektheit, Gültigkeit?
5. Wer verwaltet das Benutzerprofil bzw. wer kann es modifizieren?

In den folgenden Abschnitten soll der Fokus auf die Punkte 3. und 4. gelegt werden, während den restlichen Aspekten der Aufzählung besonders in Kapitel 3.1 Rechnung getragen wird.

2.1.1 Implizite Verfahren

Laut 25 gewinnt der Hauptteil der aktuellen kommerziellen Empfehlungssysteme die Informationen für ihre Benutzerprofile aus der Beobachtung des Benutzerverhaltens und seiner Aktionen. Darunter kann das ”Klickverhalten” innerhalb von Websites, die Verweildauer auf bestimmten Webseiten und die Dokumentation von Einkaufs-gewohnheiten fallen. Man denke z.B. nur an bekannte Internetversand- und Einkaufs-plattformen und erkennt vielleicht auch aus eigener Erfahrung auf Anhieb einen der Nachteile eines solchen impliziten Ansatzes zur Profilerhebung: Bestellt man einmal etwas für einen Bekannten oder Freund mit oder möchte ein Präsent einkaufen, so ist das eigene Benutzerprofil ebenfalls um die Information dieses Produktes reicher. In Zukunft bekommt man dann auch durch diesen Filter Produktempfehlungen offe-riert, ob man es möchte oder nicht. Man kann als Kunde somit weder direkt auf die Konstruktion des Profils Einfluss nehmen, noch im nachhinein auf etwaige Falschda-ten im Profil korrigierend einwirken. Das bedeutet, dass das auf diese Weise erzeugte Profil häufig nicht adäquat die eigentlichen Interessen des Kunden widerspiegelt. Ein weiterer Nachteil stellt die Tatsache dar, dass durch implizite Verfahren oftmals nicht genügend Informationen über den Benutzer gesammelt werden können25 . Ein Vor-teil jedoch ist die Unaufdringlichkeit des Verfahrens. Es läuft quasi im Hintergrund ab und der Kunde muss nicht aktiv mitwirken; oftmals eine willkommene Entlastung.

Siteseer63 , ein Empfehlungssystem für Webseiten verwendet z.B. die Book-marks von Besuchern als Informationsquelle. Die offensichtliche Idee hinter diesem Ansatz ist die Vermutung, dass ein Benutzer nur die Site-URLs1 als Bookmarks abspeichert, die ihn auch interessieren. Kritisch kann man jedoch den Gedanken da-gegen halten, dass auch Bookmarks von Websites aufgenommen werden könnten, die eher auf einer zeitlich befristeten Aufmerksamkeit gründen, als einem tatsächlichen Interesse entsprechen und viele Adressen erst gar nicht abgespeichert werden, da sie eben regelmäßig und häufig aufgesucht werden. Berechtigterweise stellt sich somit auch bei diesem Anwendungsbeispiel die bereits erwähnte Frage nach Vollständig-keit und Korrektheit der auf implizite Weise für das Benutzerprofil gesammelten Daten.

2.1.2 Explizite Verfahren

In Bezug auf Korrektheit von Benutzerinformationen sind direkte bzw. explizite An-wendungsverfahren von größerer Bedeutung.71 bekräftigt diese Tatsache, weist jedoch auch auf daraufhin, dass gerade wegen der Notwendigkeit für den Benutzer, zusätzlich Informationen in das System einzugeben, dieser Ansatz noch keinen um-fangreichen Einsatz in der Praxis erfahren hat. Ist der Benutzer nämlich gezwungen, Fragebögen auszufüllen, Multiple-Choice Fragen zu beantworten oder, wie im Fall von GroupLens26 , einem Filtersystem für Usenet News, Artikel bzw. allgemein Produkte zu bewerten, so kann dies schnell für Überdruss oder Verstimmung führen; einmal aufgrund des notwendigen Zeiteinsatzes des Benutzers, und zum zweiten, falls die zu bearbeitenden Themenbereich in keinster Form mit den Interessen des Benut-zers übereinstimmt. Für eine Firma können dabei entstehende negative Emotionen recht schnell zum Verlust eines potentiellen bzw. bestehenden Kunden führen, was natürlich nicht gewünscht sein kann.

Standardisierte und statische Fragebögen oder Bewertungsverfahren, existieren auch in einer adaptiven bzw. antwort-sensitiven Form. Das bedeutet, dass der Kunde bzgl. gegebener Antworten oder Ratings spezifischer in damit verbundenen Themen-gebieten weiter befragt wird. Dennoch kann auch in diesem Fall nur wiederum ein eingeschränktes und modellhaftes Profil erstellt werden, da durch die themenbezoge- ne Konstruktion der Verfahren nicht in beliebig viele Interessensgebiete vorgestoßen werden kann.

2.1.3 Erweiterte Ansätze

Eine Lösung dieses Problems wäre z.B. bereits beim Informationsgewinnungsprozess auf die individuellen Bedürfnisse des Kunden einzugehen, d.h. Fragen zu stellen bzw. Situationen zu schaffen, die mit dessen Interessen konform gehen. Diese Forderung verlangt jedoch nach einem flexibleren als den bisher geschilderten Verfahren. Das System muss nämlich nicht nur in der Lage sein, nicht-vordefinierte Eingaben des Kunden zu verarbeiten, sondern auch während der Interaktion mit diesem dessen individuellen Interessen stets im Auge zu behalten.

Eine Erweiterung des Konzepts alleiniger Sammlung von Kundeninformationen stellt das System LifeStyle Finder28 dar. Die Grundidee hierbei ist es, dem Benutzer Fragen zu stellen, um ihn anhand seiner Antworten - die hier jedoch vor-gegeben sind - in Gruppen(modelle) einzuteilen, von denen man ausgeht, dass die jeweiligen Gruppenmitglieder ähnliche Interessen teilen. Wesentlich weiter geht je-doch das dieser Arbeit zugrunde liegende Profilerhebungssystem, das im Projekt SFB582 Anwendung findet. Das Ziel ist dabei, den Benutzer mittels gezielter Fragen nicht nur in ein soziologisches Gruppenmodell einzuordnen, sondern darüberhinaus dessen individuelles Benutzerprofil basierend auf konfigurierbaren Parametern, wie z.B. der Anzahl der vom System zu stellenden Fragen, möglichst umfassend zu er-weitern69 . Die Bedeutung des Begriffs ”soziologisches Gruppenmodell” wird im Kapitel 3.2.3 eingehend erläutert. Zum vorübergehenden Verständnis stelle man sich einfach eine Einteilung von Kunden in vordefinierte Gruppenkonzepte vor, die ge-mäß bestimmter Kriterien definiert sind, wie z.B. etwa Einkaufsgewohnheiten oder sportliche Vorlieben. Grundlage für dieses Vorgehen ist die Annahme, dass Mitglieder derselben Gruppe ähnliche Verhaltensweisen in ihrer Konsumtätigkeit aufweisen.

Zum einen hat hier also der Benutzer die Möglichkeit in Freitext zu antworten, zum anderen werden die Fragen ausgewählt basierend auf den Informationen, die bereits über den Benutzer bekannt sind71 . Auf diese Weise entsteht ein adaptiver Dialog zwischen Kunden und System, der hauptsächlich über das aktuelle, spezifi-sche Benutzerprofil gesteuert wird. Vor diesem Hintergrund kann ein solcher Dialog wesentlich früher und ökonomischer zum Abschluss gebracht werden, als z.B. standar-disierte Online-Fragebögen. Darüberhinaus wird damit auch die eingangs geforderte Interessenskonformität erreicht.

Wenn es für den Benutzer möglich sein soll, in Freitext zu korrespondieren, muss das System auch in der Lage sein, natürliche Sprache zu verarbeiten. Diese NLP-Fähigkeit2 ist ein zusätzlicher Pluspunkt, denn wie8 anführt, belegte eine Umfrage unter Internet-Nutzer, dass diese mit 79% einer natürlich-sprachlichen Navigation in eCommerce Sites den Vorzug geben würden, während nur 21% die Menü-geführte Steuerung favorisierten. Die Möglichkeit einer Kombination mit impliziten Verfahren ist ebenfalls gegeben.

Eine genaue Beschreibung des Profilerhebungssystems, welches zwar für den Ein-satz im Rahmen des SFB582 konzipiert wurde, jedoch grundlegend für jeden web-basierten Anwendungsbereich mit Kundeninteraktion Verwendung finden kann, er-folgt in Kapitel 3.1.

2.1.4 Zusammenfassung und Diskussion

Verfolgt man die oben angeführte Gliederung der Verfahrensarten von den implizi-ten über die expliziten Ansätze, bis schließlich zur letztgenannten Möglichkeit, über natürlich-sprachliche Interaktion in flexibler und adaptiver Weise, Benutzerdaten zu gewinnen, so impliziert diese Reihenfolge die Zunahme von Qualität der Kun-deninformationen auf Kosten einer Zunahme von Komplexität sowohl auf Seite des Kunden als auch des Systems. Wie sooft muss also ein ”Tradeoff” gemacht werden. Hier: Je genauer die Informationen sein sollen, desto aktiver muss der Kunde in den Prozess mit einbezogen werden. Je weniger der Kunde dabei (zeitlich) beansprucht werden soll, desto mehr algorithmischen Aufwand (Komplexität) muss das System übernehmen.

Unabhängig von der Art oder Qualität der Informationsgewinnung, soll jedoch daraufhin gewiesen werden, dass es keine statische Anwendung in diesem Bereich geben kann, da sich Interessen und Vorlieben von Menschen im Laufe der Zeit verändern. Dies führt auf Seiten des Systems zur Notwendigkeit, in regelmäßigen Abständen Kundenprofile auf den neuesten Stand zu bringen.

Die persönliche Einschätzung des Autors führt zu der Vermutung, dass die Ak-zeptanz und das Vertrauen einem System zur Profilgenerierung gegenüber zunehmen dürfte, wenn der Benutzer am wenigsten das Gefühl hat, mit einem technischen Sys-tem im Dialog zu stehen. Dialogsysteme, in welche o.g. explizite Verfahren zur Profil-generierung eingebettet werden, sind dafür als effektive ’Trägersysteme’ einsetzbar. Welche Arten von Dialogsystemen es gibt und wie diese klassifiziert werden können, zeigt das nächste Kapitel.

2.2 Dialogsysteme

Nach 41 ermöglichen Dialogsysteme (DS) dem Benutzer die Interaktion mit Com-puter-basierten Anwendungen, wie Datenbanken oder Expertensystemen unter Ver-wendung natürlicher Sprache. Sie stellen also eine Schnittstelle in der Mensch-Maschine-Kommunikation dar. Entwickelt aus der Forschung über gesprochene Sprache be-reiten DS somit die Grundlagen für ausgeprägte Interaktivität von Applikationen und sind dabei häufig stark anwendungsspezifisch (bereichsspezifisch) ausgerichtet. Laut 44 gab es in den letzten Jahrzehnten starke theoretische und praktische Be-mühungen zur Erforschung der Eigenheiten und der Struktur des Dialogvorgangs im allgemeinen und der Mensch-Maschine-Kommunikation im speziellen. Grosses Inter- esse dafür kam besonders aus den Forschungsbereichen der künstlichen Intelligenz3 und Computerlinguistik (computational linguistic). und mittlerweile, stark gefördert durch die Entwicklung des Internets, haben mit DS verbundene Technologien auch ihren Einzug in die Bereiche von Wirtschaft und Ökonomie angetreten41 . Z.B. helfen DS im Kontext von eCommerce Websites bei der Reduzierung von Mausklicks durch den Besucher, während dieser nach einem bestimmten Produkt oder Dienst-leistung sucht5 . Es ist somit das Ziel, den Suchaufwand des Kunden zu reduzieren und ”Sackgassen” beim Suchvorgang zu vermeiden, da Untersuchungen gezeigt haben, dass die Geduld des Kunden mit der Zunahme der Mausklicks exponentiell abnimmt. Im Vergleich zu Suchmaschinen oder einer Menüsteuerung, ermöglicht ein adaptiver Dialog mit dem Kunden eine zielgerichtete Navigation und stellt dadurch für diesen eine Erleichterung und somit eine Verbesserung gegenüber den beiden erstgenannten Verfahren dar.

Im Umfeld des Beispiel-SystemsNatural Language Sales Assistant8 durchgeführte Studien belegen, dass ca. 80% der Anwender eine Dialog-basierte Navigation einer Menü-basierten vorziehen. Gründe für dieses Ergebnis sind z.T. praktischer Natur, wie z.B. die Reduzierung von notwendigen Mausklicks um knapp 63% und eine damit verbundene Zeitersparnis für den Suchvorgang auf Seiten des Kunden von ca. 33% im Durchschnitt. Neben diesen Vorteilen, existieren aber auch einige kritische Kernpunkte für den erfolgreichen praktischen Einsatz:

- die Fragenformulierung muss an die Erfahrungen und den Wissensstand des Benutzers angepasst sein; andernfalls besteht die Gefahr der Überforderung und Frustration5 .
- die Fehlerrate bei der Interpretation der Kundeneingabe sollte gering sein, ansonsten sind mehrmalige Umformulierung oder Wiederholungen durch den Benutzer nötig5 . schneller Interessensverlust.
- Tippfehler des Kunden sollte das System implizit und transparent korrigieren können75 .
- der Anwender muss verstehen, was das System tut bzw. was es gerade zu erreichen versucht; andernfalls kann der Kunde nur schwer Vertrauen zur Arbeit des Systems aufbauen41 .

Der angesprocheneNatural Language Sales Assistantkann in den Bereich der Agenten-basierten (agent-basierten) DS eingeordnet werden. Welche weiteren Kategorien zu-sätzlich existieren und worin sie sich unterscheiden wird im Folgenden beleuchtet.

2.2.1 Kategorisierung

Grundsätzlich bestehen mehrere Ansätze, um DS zu kategorisieren. Die Intelligenz des DS sieht44 dabei als eine Möglichkeit an. Die Definition des Begriffs ”Intelli- genz” im Kontext technischer Systeme ist bislang trotz oder evtl. gerade wegen Alan Turings Vorschlag desTuring Tests4 eine kontrovers diskutierte Thematik. Hier jedoch betrachte man den Aspekt des ”Verstehens” (semantisch entschlüsseln), d.h. reagiert das System lediglich auf die Repräsentation der Benutzereingabe oder ist es in der Lage die Information im gegebenen Kontext für die weitere Verarbeitung zu erfassen. Die resultierende Unterscheidung beläuft sich somit aufreaktive(patternmatching) undanalytischeSysteme44 .

Die Erfahrungen der Recherche haben gezeigt, dass sich eine allgemeinere und weiter verbreitete Klassifizierung an der Konversationsstrategie des DSs orientiert. Dieser Kategorisierungsaspekt betrifft mitunter die Flexibilität, wie Benutzereingaben entgegengenommen und verarbeitet werden können und den Bereich der Fehlerbehandlung41 . Diese drei Kategorien lauten:

a) Finite-state-basierte/Graph-basierte (endliche Zustands-basierte) Systeme,
b) Frame-basierte (Rahmen-basierte) Systeme,
c) Agent-basierte (Agenten-basierte) Systeme

Die nun in diesem Abschnitt folgende genauere Beschreibung der verschiedenen Kategorien basiert ausschließlich auf der Arbeit von41 und ist in Abbildung 2.1 tabellarisch skizziert. Von gerade benannter Arbeit abweichende oder ergänzende Quellen werden an gegebener Stelle angeführt.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2.1: Strategien zur Dialogsteuerung (Quelle:41 )

Finite-State-basierte Systeme

Finite-state-basierteSysteme werden in den meisten kommerziellen Anwendungen verwendet, weil sie leicht zu implementieren sind20 . Sie ähneln Transitionssyste-men, in denen die Dialogstruktur einem Zustands-Übergangs-Netz entspricht. Der Dialog folgt einem vordefinierten Ablauf, einer Sequenz vordefinierter Schritte. Der aktuelle Zustand wird durch die zu stellende Frage repräsentiert, die Antwort des Benutzers darauf bewirkt den Zustandsübergang. Die Systemfragen müssen im Vorfeld gewissenhaft und bereichsspezifisch entwickelt werden und erlauben generell nur eine oder wenige Phrasen als Kundeneingaben bzw -antworten.

Durch Verwendung eines beschränkten Vokabulars ist für das Parsen der Eingabe eine einfache Grammatik definierbar, wodurch diese Dialogstrategie sehr einfach und robust ist, aber relativ unflexibel in der möglichen Bandbreite der Benutzereingaben. Nur geringe technologische Anforderungen stellend, ist diese Strategie beschränkt auf gut strukturierte Aufgabenbereiche mit vorgefertigten Dialogschritten, wie z.B. Ticketverkauf (Verkehr, Unterhaltung), Hotelbuchung oder Online-Banking (Beispiel dazu in Abbildung 2.2). In Abbildung 2.2 ist außerdem ein weiteres Charakteristi-

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2.2: Dialogbeispiel für einFinite-state-basiertesSystem (Quelle:41 )

kum vonFinite-state-basiertenSystemen zu erkennen: Die Dialogsteuerung bzw. die Initiative geht stets vom System aus. Auf diese Weise ist der Benutzer gezwungen zu reagieren und ist nicht in der Lage eventuell undefinierte Anfragen an das System zu stellen. Man kann dies auch als System-orientierten Ansatz bezeichnen.

Frame-basierte Systeme

BeiFrame-basiertenSystemen handelt es sich grundlegend um eine Verfeinerung des vorherigen Graphen-basierten Ansatzes und ist ebenfalls in kommerziellen Anwendung vermehrt eingesetzt. Abhängig vom Einsatzgebiet, ist es oftmals das Ziel des Systems genügend Informationen vom Kommunikationspartner zu sammeln, um damit eine bestimmte Transaktion auszuführen, z.B. in Flugbuchungssysteme, Empfehlungssysteme, usw. Aus diesem Grund werden sie auch häufig alsinquiry-orientedoderinformation-seekingSysteme bezeichnet44 .

Die zugrundeliegende Dialogstruktur ist das Template (einer Frage) mit ”Slots”, die mit den jeweiligen Attributen bzw. Variablen gefüllt werden, um damit die für die Ausführung der Transaktion noch benötigten Informationen zu erhalten. Aus der Betrachtung der Templates als Rahmen, der die ”Slots” umgibt, ergibt sich auch die Bezeichnung derFrame-basierteSysteme. Die Reihenfolge der Fragestellung ist da-

bei beliebig, d.h. nicht vordefiniert und somit flexibler als im vorigen Ansatz40 . Dennoch ist die nächste Frage bestimmt durch aktuellen Zustand, der letzten Be-nutzereingabe und den Informationen aus einer externen Datenquelle. Man kann also sagen, dass sich die Dialogsteuerung primär am Dialogziel orientiert und den Weg nicht auf einen Pfad begrenzt. Aufgrund der Adaptivität auf Kundenantworten müssen nicht mehr Fragen als notwendig gestellt werden, um das verfolgte Ziel zu erreichen, wie etwa Informationssammlung bzw. Ausführen einer Transaktion (z.B. Produktempfehlung oder Auskunft, siehe dazu Abbildung 2.3). Auch dieser Ansatz

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2.3: Dialogbeispiel für einFrame-basiertesSystem (Quelle:41 )

ist nur begrenzt anwendbar, da keine allzu komplexen Transaktionen modelliert wer-den können. Es ist somit ebenfalls ein klar strukturierbares Anwendungsgebiet nötig, z.B. Verkauf von Büchern oder Ausgabe von Reiseinformationen, wie in Abbildung 2.3 auszugsweise dargestellt. Da die Kundenantworten in einem bestimmten Rahmen erwartet werden, kann es darüberhinaus auch keine Möglichkeit für freie Verhandlungen zwischen System und Kunden geben.

Während es sich wie bei denFinite-state-basierteSystemen auch hier hauptsäch-lich um einen System-gesteuerten Ansatz handelt, kann dennoch auch der Kunde vereinzelt die Dialogkontrolle bzw. -initiative übernehmen, wie es an Stelle ’User 5’ in Abbildung 2.3 der Fall ist. Somit tendieren dieFrame-basierteSysteme zumindest in Richtung gemischter Dialogkontrolle, d.h. Dialogkontrolle von Seiten des Systems und/oder des Benutzers.

Agent-basierte Systeme

Diese Systeme sind aktuell eher theoretischer Natur und verwenden größtenteils Tech-niken aus dem Bereich der KI. Der hauptsächliche Grund für die geringere praktische Verbreitung dieser Systemklasse gegenüber den beiden vorherigen Systemtypen, liegt in der höheren Komplexität freier, nicht vordefinierter Kommunikationswege innerhalb der Anwendungsbereiche. ’Freie Kommunikationswege’ soll an dieser Stelle den Umstand bezeichnen, dass die Kommunikation zwischen Mensch und Maschine ohne vordefinierte Dialogkonventionen oder -protokolle abläuft, d.h. Mensch und Maschine können jederzeit den Dialog initiieren, die Dialogkontrolle übernehmen, auf Fragen reagieren oder auch nicht, usw (der Autor). Falls der Dialog stets nur vom Benutzer bzw. von dessen Anfragen gesteuert wird, sei das zugrundeliegende DS als ’Benutzerorientiert’ bezeichnet. Die grundlegende Idee ist:

Modelliere Kommunikation als Interaktion zwischen intelligenten Agenten. Praktisch gesehen konnte jedoch dieses anvisierte Level freier Kommunikation bislang noch nicht durch intelligente Maschinen erreicht werden konnte. Es existieren verschiedene Architekturen für unterschiedliche Einsatzbereiche:

- Theorembeweiser:

Lösungen von Aufgaben (zur Erreichung des Dialogziels) werden dynamisch entwickelt basierend auf Aktionen, die durch einen ”domain processor” empfohlen werden. Basis für die nächste Aufgabe sind der Wissenszustand über den Benutzer als auch die aktuelle Kommunikationssituation. In jedem Schritt erhält die Dialogsteuerung die empfohlene Aktion vom ”domain processor” und entscheidet, ob der Benutzer nach fehlenden Axiomen gefragt oder ob dazu die Logik des Theorembeweisers verwendet werden soll. Dann entscheidet der Theorembeweiser, ob die aktuelle Aufgabe, gesteuert durch die Benutzerangaben, erfüllt ist.

- Plan-basierter Dialog:

Äußerungen des Kunden werden als Aktionen betrachtet, die ausgeführt werden, um ein spezifisches Ziel zu erreichen. Dieser Ansatz ist nur für eingeschränkte Anwendungsbereiche anwendbar, da die Computerberechnungen des Plans, der vom Startzustand zum Zielzustand führt schnell zu komplex werden.

- BDI (Belief-Desire-Intention) Modell:

Auf diesem Modell basiert ein Ereignis-gesteuertes Dialogmanagement, welches Glaubens- und Absichtszustände für das System kreiert, nicht aber für den Benutzer. Somit kann die Maschine nur raten, ob das berechnete Modell auch wirklich auf die Betrachtungsweise des Benutzers zutrifft.

Ein Ereignis-gesteuertes Dialogmanagement nähert sich der Reaktionsweise eines Rahmen-basierten Systems an; es verwendet aber komplexere Repräsentationen für das Wissen im Dialogkontext.

- Rationale Interaktion (RI):

Hier wird Kommunikation betrachtet als Bestandteil intelligenten Verhaltens. Es wird eine Balance zwischen geistiger Einstellung des Agenten und den auszuführen-den Plänen verlangt. Handelt es sich bei einem Plan z.B. ein illegales oder vertrau-liches Vorhaben, dann soll der Agent in der Lage sein, diesen Plan ggf. abzuweisen. Dabei ist die geistige Einstellung eines Agenten beschreibbar als die Beziehung zwi-schen dem Agenten und einem Plan bzw. einem Objekt. Ebenso wichtig ist die Idee eines Glaubenszustands, welcher allgemein die geistige Einstellung eines Agenten zu seiner Umwelt widerspiegelt, wobei Ungewissheit des Agenten den Glaubenszustand einernäherungsweisenWahrnehmung seiner Umgebung widerspiegelt. Der optimale nächste Schritt orientiert sich an der Motivation und den Wünschen des Agenten. Diese Konzepte können in modaler Logik 1.Ordnung formalisiert werden64 . Durch RI sind komplexe natürlich-sprachliche Dialoge möglich, aber diese sind dennoch mit einem großen Aufwand an Rechenleistung verbunden. Konsequenzen daraus sind die Notwendigkeit teurer Hardware, um ein vertretbares Level an Echt-Zeit-Interaktion erhalten zu können.

Die folgende Abbildung 2.4 vermittelt die Idee freier Kommunikationswege (Erklärung siehe oben) ohne vordefinierte Dialogstrukturen.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2.4: Dialogbeispiel für einAgent-basiertesSystem (Quelle:41 )

Der thematische Hintergrund des Beispiels in Abbildung 2.4 ist ein Hilfssystem für die korrekte Vernetzung und Anschlüsse von Kabelleitungen.

2.2.2 Typische Systemkomponenten

Gewöhnlich besteht ein DS aus Komponenten, die die in Abbildung 2.5 dargestellten Funktionen übernehmen80 .

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2.5: Typische Komponenten eines Dialogsystems (Quelle:41 )

- speech recognition (Spracherkennung): nimmt die Äußerungen des Anwenders entgegen und formt sie in ein internes Format um.
- language understanding (Sprachverstehen): analysiert die Ausgabe der Spra-cherkennungseinheit oder direkt die geschriebene Eingabe und interpretiert die-se.
- dialogue management (Dialogmanagement): zentrale Komponente der Anwendung, die den Dialogfluss steuert.
- communication with external systems (Kommunikation mit externen Systemen): übersetzt Systemanfrage in das nötige Format und stellt die Datenschnittstelle zu externen Quellen dar.
- response generation (Antworterzeugung): kreiert die Nachricht, die für den Benutzer gedacht ist.
- speech output (Sprachausgabe): übersetzt die Nachricht in eine akustische Aus-gabe.

In der aktuellen Version des Profilerhebungssystems im Rahmen des SFB582 ist keine akustische Sprachfunktionalität implementiert, wodurch die Komponenten ’speech recognition’ und ’speech output’ für die weitere Betrachtung vernachlässigt werden können. Auch die ’response generation’, obwohl implementiert und eine wichtige Komponente, soll im weiteren außer Acht gelassen werden, da es auf das Verfahren zur WSD, wie es in dieser Arbeit entwickelt wird, keinen Einfluß hat.

Language understanding

Zuerst muss die Eingabe des Kunden von einer Textdarstellung in eine Bedeutungs-repräsentation überführt werden. Wie auch aus dem Bereich des Compilerbaus be-kannt, resultieren aus der Notwendigkeit der sequentiellen Verarbeitung verschiedene Phasen der Analyse, wie lexikalische, syntaktische und semantische Analyse. Anders als beim Übersetzen von Programmiersprachen sind in natürlich-sprachlichen An-wendungen häufig nicht immer vollständige Verarbeitungsprozesse notwendig. Häu-fig genügen bereits semantische Annotierungen der Eingabe oder das Erkennen von Schlüsselwörtern21 . Für die semantische Analyse gilt häufig das Prinzip der Kom-positionalität: ”Die Bedeutung eines Satzes ist eine Funktion der Bedeutungen der Teile des Satzes” (41 , Übersetzung: T.E.). Dies führt zu Gruppierungen von seman-tisch zusammengehörigen Wörtern im spezifischen Kontext, eine Arbeit die nach der Analyse durch einen ’Tagger’ beispielsweise ein ’Chunker’ übernimmt (siehe unten).

Tagger Anwendung, die einzelne Wörter eines Satzes ihren syntaktischen Kategorien (”part-of-speech”) zuordnet. (Def. des Autors) Z.B. Artikel, Nomen, Objekt, Verb, usw.

Chunker partieller Parser, verwendet die Ausgabe des Taggers, um diese sinnhaft syntaktisch zu gruppieren. (Def. des Autors) Z.B. aus Nomen: ’Frau’ und bestimmter Artikel: ’die’ ’die Frau’

Die Frage nach der Komplexität der Eingabeverarbeitung (z.B. mittels Markov-Ketten (stochastischer Ansatz)83 oder Parsern basierend auf attributierten, kon-textfreien Grammatiken) und dem daraus resultierenden Ergebnisformat sollte sich als Hauptkriterium stets an den Anforderungen der Anwendung orientieren. In Abbil-dung 3.3 auf Seite 41 z.B. genügt für die weitere Verarbeitung bereits die annotierte Ausgabe eines ”part-of-speech”-Taggers. Die komplette Generierung eines hierarchi-schen Parse-Baums ist nicht notwendig. Die Funktion des ’language understanding’ wird im vorliegenden Profilerhebungssystem von der KomponenteLanguage Analysis(Abschnitt 3.2.1) übernommen.

Kommunikation mit externen Systemen

Für die Anwendung benötigtes Wissen wird in externen Datenquellen gehalten. Um ein großes Anwendungsspektrum des Dialogsystems zu ermöglichen, macht es Sinn die Schnittstelle zu den externen Ressourcen nicht in der zentralen Komponente des Dialogmanagers zu realisieren, sondern in einem separaten Modul41 . Zu diesem Zeitpunkt hat dieses Modul nicht nur die Aufgabe, Anfragen auszuführen, sondern auch Transformationen der Datenrepräsentation (Formate) zwischen Hauptsystem und externer Datenquelle durchzuführen. In Abhängigkeit von der spezifischen An-wendungsdomäne auf der einen Seite und der verwendeten Art externer Wissensquel-len (Datenbanken, Wissensbasen, Planungssystemen, usw.) auf der anderen Seite, können diese Formate stark variieren.

Die Kommunikation mit externen Systemen kann im aktuellen Fall größtenteils der KomponenteProfile Manager(5.1.1) zugeordnet werden, da diese die Schnittstelle zu den externen Informationsquellen, Datenbank und GermaNet herstellt (siehe auch Abbildung 3.2 auf Seite 40).

Dialog Manager

Das Dialogmanagement, hier realisiert alsDialog Manager(3.2.4), steuert als Zentra-le die Kommunikation zwischen allen anderen Komponenten des Systems. Neben der Dialogsteuerung, die sich nach den Ansätzen der o.g. Dialogstrategien (2.2.1) orien-tiert, erfolgen hier auch elementare Maßnahmen der Fehlerbehandlung, wie Korrektur oder Vervollständigung von Benutzereingaben. Zur Aufrechterhaltung von Korrekt-heit der Anwendung und von Kundenvertrauen, stellt sich der Bereich der Verifikation als ein zusätzlicher, wichtiger Aspekt dieser Komponente dar41 ,16 . Es werden dabei zwei Bestätigungsverfahren unterschieden: explizite und implizite Verfahren. Explizite Verfahren äußern sich meistens in der Verwendung von Entscheidungsfra-gen. Sie stellen sich als stabiler als der implizite Ansatz dar, verlängern aber oft in künstlicher Form den Dialog.

Abbildung in dieser Leseprobe nicht enthalten

Implizite Verfahren verarbeiten Ergebnisse vorhergehender Dialogschritte in die nächs- te Frage:

Abbildung in dieser Leseprobe nicht enthalten

Der letztere Ansatz baut sich flüssiger in den Dialogfluss ein, ist aber komplexer in der Verarbeitung der evtl. nachfolgenden Korrekturantwort durch den Benutzer.

2.2.3 Zusammenfassung und Diskussion

Die Auswahl einer Strategie zur Dialogsteuerung bestimmt die mögliche Flexibili-tät im Dialogablauf. Die Wahl der Kontrollstrategie orientiert sich dabei stark an der gewünschten Dialogflexibilität mit dem Benutzer. Weitere Hauptkriterien für die Wahl der Strategie bzw. des entsprechenden DSs sind die Projektgröße und das Einsatzgebiet41 : Für kleine, klar strukturierte Projekte, ist vermutlich dasfinite-stateDialogmanagement die beste Wahl, da es geringe Anforderungen an Hardware, Technology und Entwicklungszeit stellt. Mehr Flexibilität bietenFrame-basierteSys-teme dem Benutzer.Agenten-basierteSysteme sind sogar in der Lage Beziehung zum Kunden aufbauen und gewähren somit die Möglichkeit eines Online-Pendants zu ei-nem/r menschlichen ’offline’ Verkäufer(in). Die Kosten dieser Flexibilität, Fähigkeit zu Verhandlungen und Adaptivität bzgl. der Kundeneingaben sind jedoch eine enor-me Erhöhung der Komplexität und des nötigen Berechnungsaufwands. Auf Seiten des Benutzers bzw. Kunden werden DS mitunter anhand ihrer Fähigkeit bewertet, deren Äußerungen zu verstehen.

Oftmals ist es jedoch nicht leicht, ein existierendes DS eindeutig in eine der drei oben definierten Kategorien einzuordnen, da sich Dialogstrategien und -strukturen bzw. verwendete (externe) Ressourcen im praktischen Einsatz vermischen können44 . Schwerpunktmäßig kann deswegen das in dieser Arbeit verwendete Dialogma-nagement zum Bereich derFrame-basierteSysteme gezählt werden, wobei der Dia-log vom System gesteuert wird und nicht vom Kunden, wie dies in Abschnitt 3.2.4 ebenfalls angeführt wird. Da hier der Dialog für einen klar definierten Anwendungs-bereich, nämlich zur Sammlung von Profilinformationen, geführt wird, ist die dabei einhergehende Verlagerung der Dialogstrategie auf einen flexiblen, nicht-zeitlich vor-definierte Dialogablauf basierend auf Fragentemplates sowohl zweckmäßig als auch ausreichend. Durch Verwendung entsprechender Fragenrahmen werden in die ”Slots” die Attribute des Kundenprofils eingefügt, nach deren Werten dadurch gezielt gefragt werden kann.

Unabhängig von der gewählten Dialogstrategie gibt es für jedes System, welches flexibel natürlich sprachliche Eingaben verarbeiten möchte, eine der größten Hürden im Bereich des NLP 45 , nämlich die Mehrdeutigkeit von Wörtern und Begriffen und die damit verbundene Gefahr, diese semantisch falsch und nicht im Sinne der An-wendung oder des Anwenders (Kunden) zu deuten. Im nachfolgenden Kapitel wird der Fokus auf die Hauptthematik der Disambiguierung, der Auflösung von Mehrdeu-tigkeiten gelenkt und somit das zentrale Thema dieser Arbeit tiefergehend motiviert.

2.3 Disambiguierung

In Kapitel 1.1 wurde bereits die Notwendigkeit von Disambiguierungsverfahren an-gesprochen und auch erste Begriffe, wie ’Ambiguität’ und ’disambiguieren’ (S.2) eingeführt. Ebenfalls ist bekannt, dass Mehrdeutigkeit bzw. ’Ambiguität’ eines der Hauptprobleme im Bereich des NLP89 und den damit verbundenen Teilgebieten ist (siehe auch Abschnitt 2.3.3). Im Folgenden soll dieser Themenkomplex eingehender beleuchtet werden, beginnend mit einer umfassenden Betrachtung von Mehrdeutig-keit im allgemeinen über eine Darstellung betroffener Anwendungsbereiche bis zur Kategorisierung und Darstellung etablierter Disambiguierungsverfahren.

2.3.1 Ambiguität

Ambiguität ist ein mehrschichtiges Problem43 und zieht sich durch verschiedene Ebenen des Verarbeitungsprozesses von Text und (natürlicher) Sprache. Grob kann man dabei drei Bereiche von Ambiguität unterscheiden:

1. syntaktische Ambiguität
2. pragmatische Ambiguität
3. semantische Ambiguität ad 1.)

Die Unerwünschtheit von Mehrdeutigkeiten syntaktischer Beschreibungsmechanis-men, wie z.B. Grammatiken oder sogar inhärent mehrdeutiger Sprachen ist bereits aus den Informatikbereichen ’formale Sprachen’ und ’Compilerbau’ bekannt. Aber auch Sätze in natürlichen Sprachen lassen sich ggf. mehrfach analysieren (parsen) und damit deuten. Um die richtige Variante auszuwählen sind im Fall gesprochener Sprache der Sprechakt33 (d.h. die Sprechhandlung inkl. Mimik, Gestik, usw.) und die Absicht des Sprechers ausschlaggebend. Im Fall geschriebener Sprache ist weder für einen Computer noch für einen Menschen zwangsläufig klar, welche Deutung die richtige ist, selbst wenn Kontext vorhanden wäre (d.h. ein Satz eingebettet in einen Textabschnitt). Beispiel 2.1 vermittelt eine Vorstellung dieser Situation.

Beispiel 2.1:

Hans sah Anna mit der Brille.

a) Hans konnte Anna sehen mit Hilfe der Brille.b) Hans sah Anna, die eine Brille trug. ad 2.)

Selbst bei Abkürzungen ist man nicht vor Mehrdeutigkeiten gefeit. Die für den Be-reich der Verarbeitung natürlicher Sprache eingeführte Abkürzung ’NLP’, steht zu-mindest im deutschsprachigen Raum auch für das Verhaltensmodell ’neurolinguisti-sche Programmierung’5 . Ein etablierter Spruch im Feld dieser psychotherapeutischen

Methode beschreibt dabei in ironischer Weise das Problem der pragmatischen Ambiguität: ”Wie soll ich wissen, was Du meinst, wenn ich höre, was Du sagst?” Hierbei soll folgende simple Frage als zu betrachtendes Beispiel dienen:

Beispiel 2.2:

Haben Sie eine Uhr?

Eine naheliegende Möglichkeit für die Befragte wäre mit ’ja’ oder ’nein’ zu antworten. In den meisten Fällen soll diese Frage aber darauf abzielen, die aktuelle Uhrzeit zu erfahren und steht somit stellvertretend für die Aufforderung ”Sagen Sie mir bitte, wieviel Uhr es ist.” Geht man noch einen Schritt weiter, dann bietet das Beispiel 2.2 aber auch Interpretationsraum für die Frage nach dem Umstand, ob die befragte Person, eventuell mehr als eine Uhr besitzt.

ad 3.)

Die bereits angeführten Wörter ’Schloss’ und ’Dichtung’ sind einfache Beispiele dafür, dass bereits einzelne Wortformen je nach Kontext unterschiedliche Bedeutungen aufweisen können. Die passende Wortbedeutung muss dabei jedesmal von neuem in Abhängigkeit vom gegebenen Kontext bestimmt werden.

Durch schwierigere Formalisierungsgegebenheiten von natürlichen Sprachen weisen alle drei Formen von Ambiguität gegenüber formalen Sprachen einen weit höheren Grad an Komplexität auf. Diese Tatsache schlägt sich somit auch in der Verarbeitung der jeweiligen Sprache nieder (dazu siehe auch Abschnitt 2.3.3).

Während für die Disambiguierung der ersten beiden Typen von Ambiguität mit-unter soziologisches (Verhaltensnormen, -protokolle) und/oder kommunikationstheo-retisches (Sprechakte, Dialogführung) Wissen benötigt wird, besteht für den dritten Fall die Möglichkeit, die Mehrdeutigkeiten über den Kontext aufzulösen, was für Text bzw. geschriebene Sprache einen Vorteil darstellt. In der aktuellen Version des SFB582-Profilerhebungssystems nimmt das System die Benutzereingaben als Text entgegen und nicht als Sprache. Neben diesem Sachverhalt besteht darüberhinaus auch nicht die Notwendigkeit die Bedeutung ganzer Sätze, sondern ”lediglich” die richtige Bedeutung eines (Schlüssel-)Wortes in der Eingabe zu bestimmen. Aus die-sem Grund konzentriert sich in dieser Arbeit die Aufgabe auf die Entwicklung eines Verfahrens zur Wortbedeutungs-Disambiguierung im Sinne von 3.) (siehe oben). Die-se Form der Disambiguierung erfährt im nun folgenden Abschnitt eine eingehende Betrachtung.

2.3.2 Disambiguierung von Wortbedeutungen - ein Überblick

WSD als Abkürzung der engl. Übersetzung von ’Disambiguierung von Wortbedeu-tungen’: word sense disambiguation bezeichnet die Auflösung von Mehrdeutigkeiten eines Wortes in semantischer bzw. konzeptueller6 Hinsicht. Im Deutschen, wie in den meisten natürlichen Sprachen auch, sind viele Wörter mit mehreren Bedeutungen behaftet. Die Aufgabe besteht nun darin, dem Wort die passendste seiner Bedeu-tungen zuzuweisen in Abhängigkeit von der speziellen Verwendung im gegebenen Kontext51 . Der Kontext spielt dabei eine Schlüsselrolle, denn ein Wort, welches nicht in einen Kontext eingebettet ist, kann nicht eindeutig disambiguiert werden. Das folgende Zitat von Weaver77 geht dabei auf den Begriff des Kontexts näher ein:

If one examines the words in a book, one at a time a through an opaque mask with a hole in it one word wide, then it is obviously impossible to determine, one at a time, the meaning of the words But if one lengthens the slit in the opaque mask, until one can see not only the central word in question but also say it N words on either side, then ifNis large enough one can unambiguously decide the meaning of the central word The practical question is: ”What minimum value ofNwill, at least in a tolerable fraction of cases, lead to the correct choice of meaning of the central word?”

Dieses Zitat aus dem Jahre 1955 hat von seiner Aktualität nur wenig eingebüßt. In der Arbeit von14 wird darauf hingewiesen, dass die Weite des im Zitat erwähnten Kontextfensters mitunter stark vom Typ des angewandten WSD-Algorithmus (siehe auch Abschnitt 2.3.4) abhängt und selbst in einer Größenordnung von 50 bis so-gar mehreren tausend Wörtern auf beiden Seiten des Fensters noch WSD-relevante Informationen für das spezifische Wort vorhanden sein können.45 definiert den Begriff ’Kontext’ in einem weiteren Rahmen und versteht neben den Informationen, die sich im textuellen Umfeld des zu untersuchenden Wortes befinden, auch zusätz-liche Meta-Informationen, wie z.B. Motiv oder gesellschaftspolitische Situation der Abhandlung bzw. des Verfassers. Darüberhinaus betrachtet45 Kontext auf zweier-lei Weise. Zum einen dasBag-of-words approach-Modell als Menge von Wörtern ohne syntaktische oder grammatikalische Beziehung zueinander. Zum anderenRelationalinformation, so dass der Kontext zum zu disambiguierenden Wort eine Form von Be-ziehung bzw. Relation aufweist (orthographische Eigenschaft, stehender Ausdruck, Phrasensammlung, usw.).

[...]


1 engl., word sense disambiguation

1 uniform ressource locator, eindeutige Bezeichnung einer Ressource im Internet

2 natural language processing

3 KI, engl.: artificial intelligence, AI

4 Beschreibung siehe http://www.turing.org.uk/turing/scrapbook/test.html

5 http://www.nlp.de/

6 Im weiteren bezeichnet ein Konzept ein Bedeutungsmodell.

Ende der Leseprobe aus 110 Seiten

Details

Titel
Weiterentwicklung eines Dialog Managers für ein Profilerhebungssystem: Auflösung von Mehrdeutigkeiten im benutzeradaptiven, natürlich-sprachlichen Dialog mit dem Kunden
Hochschule
Technische Universität München  (Angewandte Informatik - Kooperative Systeme)
Note
1.3
Autor
Jahr
2005
Seiten
110
Katalognummer
V48491
ISBN (eBook)
9783638451888
Dateigröße
1751 KB
Sprache
Deutsch
Anmerkungen
[...]Effektive Methoden zur Profilgenerierung sind gefragt. Dabei sollen die gesammelten Daten nicht nur umfangreich und korrekt sein, sondern der Kunde soll während dieses Prozesses auch möglichst wenig zeitlich involviert bzw. belastet werden. Um beide Anforderungen zu erfüllen, kommen Dialogsysteme zum Einsatz, an die bzgl. Komplexität und Performanz abhängig vom Einsatzgebiet verschiedene Ansprüche gestellt werden. Von einfachen, zustandsbasierten Systemen bis zu Agenten, die für die Di[...]
Schlagworte
Weiterentwicklung, Dialog, Managers, Profilerhebungssystem, Auflösung, Mehrdeutigkeiten, Kunden
Arbeit zitieren
Thorsten Eiseler (Autor), 2005, Weiterentwicklung eines Dialog Managers für ein Profilerhebungssystem: Auflösung von Mehrdeutigkeiten im benutzeradaptiven, natürlich-sprachlichen Dialog mit dem Kunden, München, GRIN Verlag, https://www.grin.com/document/48491

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Weiterentwicklung eines Dialog Managers für ein Profilerhebungssystem: Auflösung von Mehrdeutigkeiten im benutzeradaptiven, natürlich-sprachlichen Dialog mit dem Kunden



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden