Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Communications - Multimedia, Internet, New Technologies

Chatbots – Tokenisierung der Eingabe

Title: Chatbots – Tokenisierung der Eingabe

Term Paper , 2009 , 9 Pages , Grade: 1,7

Autor:in: Astrid Seefeld (Author)

Communications - Multimedia, Internet, New Technologies
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

Das Internet ist ein Medium, welches sich aus dem Leben von hunderten Millionen Menschen nicht mehr wegdenken lässt. Für Unternehmen, die sich auf dem E-Commerce-Markt einen Anteil sichern wollen, ist es wichtig, den Benutzern eine Oberfläche bzw. eine Umgebung bereitzustellen, die es ihnen einfach macht, die gesuchten Informationen zu finden und ihren Bedürfnissen entspricht. Der steigende Umfang des Internets ist also auch ein Grund dafür, dass der Wunsch nach personifizierten Gesprächspartnern wächst.
Obwohl einer Website so viel Bedeutung angerechnet wird, sie also ein wichtiges Instrument für Unternehmen sein sollte, ist an der Benutzeroberfläche immer noch ein großes Defizit zu erkennen.
Das Internet ist zwar ein alltägliches Werkzeug für jedermann geworden und trotzdem ist es für die Mehrheit der Benutzer zu kompliziert und unübersichtlich. Zum Beispiel der Umgang mit Suchmaschinen, dort ergeben sich oft Probleme mit der umfangreichen Trefferliste von Ergebnissen. Weiter Probleme die immer wieder auftauchen können ergeben sich direkt auf den Webseiten. Sucht ein Nutzer Informationen auf einer dieser Websites, ist es ihm oft nicht möglich das gesuchte auch zu finden. Die Informationen sind oft nicht gut strukturiert bzw. dargestellt oder aus dem Kontext nicht in Erfahrung zu bringen. Dadurch ergibt sich die Gefahr, dass viele Kunden vom Angebot des Onlinekaufs wieder abspringen. Ein weiter Grund ist auch, dass es viele Kunden gibt, die es einfach vermissen beim Einkaufen Fragen stellen zu können.
Entgegen der Anfänge des Internets, wo die Anzahl der Nutzer noch gering und ihr Know-how über die Anwendung höher war, sind die Nutzerzahlen heute enorm gestiegen und oftmals nicht erfahren in den technischen Gegebenheiten. Aus diesem Grund ist die Bedeutung der Benutzerfreundlichkeit heute umso größer und die Unternehmen können es sich nicht leisten alle Nutzer zu schulen. Sie müssen ihre Mittel also nicht in Schulungen sondern in die möglichst einfache Handhabung der Oberfläche einfließen lassen. Mit diesen Erkenntnissen und natürlich auch im Rahmen der technischen Entwicklung finden die Chatbots, auch bekannt als Chatterbots, in die Welt der Computer und Benutzeroberflächen einlass. Diese sind auf der Basis der natürlichen Sprache entwickelte virtuelle Berater. In der folgenden Arbeit wird intensiv auf den Bereich der Chatbots eingegangen und erläutert, in wie fern die Tokenisierung der Eingabe im Bereich der Chatbots Anwendung findet.

Excerpt


Inhaltsverzeichnis

1 Einleitung

2 Chatbots

2.1 Begriffserklärung

2.2 Bekannte Chatbots

2.2.1 ELIZA

2.2.2 ALICE

2.2.3 Jabberwacky

2.3 weiterführende Entwicklungen

3 Tokenisierung

3.1 Begriffserklärung

3.2 Einzelaufgaben der Tokenisierung

3.2.1 Abkürzungen erkennen

3.2.2 Sonder- und Satzzeichen erkennen

3.2.3 Kontraktionen behandeln

3.2.4 komplexe Tokens erkennen

3.2.5 Normalisieren von Token

3.2.6 Klassifizieren von Token

4 Zusammenfassung und Fazit

Zielsetzung & Themen

Die Arbeit untersucht die Rolle von Chatbots als virtuelle Berater in modernen Benutzeroberflächen und analysiert dabei intensiv den technischen Prozess der Tokenisierung von Benutzereingaben als grundlegende Voraussetzung für die computerlinguistische Verarbeitung.

  • Grundlagen und Definition von Chatbots
  • Historische und aktuelle Entwicklung von Chatbots (ELIZA, ALICE, Jabberwacky)
  • Technische Herausforderungen bei der linguistischen Analyse
  • Prozessschritte und Einzelaufgaben der Tokenisierung
  • Optimierung der Mensch-Maschine-Interaktion durch Vorverarbeitung

Auszug aus dem Buch

3.2 Einzelaufgaben der Tokenisierung

Wie bereits erwähnt besteht die Hauptaufgabe darin, die Eingabeketten zu zerlegen. Um diese Zerlegung zu ermöglichen müssen die Trennungszeichen auch bekannte als „white-space-characters“ (Hess, 2006, S.5), wozu z.B. Leerzeichen, Tabulatoren, Zeilenvorschübe und Wagenrückläufe gehören, durch Token-Trenner ersetzt werden. Außerdem müssen Satz und Sonderzeichen abgetrennt bzw. isoliert werden.

Leider ist das in der Umsetzung nicht ganz einfach. Das Problem ist, dass es viele Spezialfälle gibt, wo das eben beschrieben nicht funktioniert. Um das zu lösen gibt es zwei Ansätze. Man kann einen solchen Fall entweder Isolieren, damit die Trennungsprinzipien der Tokenisierung im Innern solcher Ausdrücke nicht mehr wirken oder aber man Re-Gruppiert bereits getrennter Elemente.

In der Zerlegung des Gesamtprozesses müssen folglich einige Teilaufgaben bewältigt werden.

Zusammenfassung der Kapitel

1 Einleitung: Die Einleitung beleuchtet die Herausforderungen bei der Benutzerführung im Internet und die Notwendigkeit von intuitiven Schnittstellen, um das Kommunikationsproblem zwischen Mensch und Maschine zu überbrücken.

2 Chatbots: Dieses Kapitel definiert Chatbots, erläutert deren Funktionsweise und stellt verschiedene bekannte Systeme wie ELIZA, ALICE und Jabberwacky sowie zukünftige Entwicklungsansätze vor.

3 Tokenisierung: Hier wird der Kernbegriff der Tokenisierung als zentraler Vorverarbeitungsschritt erklärt und die verschiedenen technischen Teilaufgaben zur Zerlegung von Eingabetexten detailliert aufgeschlüsselt.

4 Zusammenfassung und Fazit: Das abschließende Kapitel fasst die gewonnenen Erkenntnisse über Chatbots und die Bedeutung der Tokenisierung als Grundlage für die Interpretation natürlicher Sprache zusammen.

Schlüsselwörter

Chatbots, Tokenisierung, Mensch-Computer-Interaktion, Linguistische Analyse, ELIZA, ALICE, Jabberwacky, Künstliche Intelligenz, Benutzerschnittstelle, Natural Language Processing, Vorverarbeitung, Parsing, POS-Tagging, Kommunikation, Softwareentwicklung

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Arbeit befasst sich mit der technischen Vorverarbeitung von Benutzereingaben in Chatbot-Systemen, speziell dem Prozess der Tokenisierung.

Was sind die zentralen Themenfelder?

Die zentralen Felder sind die Geschichte und Technik von Chatbots sowie die linguistischen Herausforderungen bei der Segmentierung von natürlicher Sprache für Computer.

Was ist das primäre Ziel der Untersuchung?

Ziel ist es, den Aufbau von Chatbots zu erklären und zu verdeutlichen, warum die Tokenisierung der Eingabe für deren Funktionsweise und Sprachverständnis unerlässlich ist.

Welche wissenschaftliche Methode wird verwendet?

Es handelt sich um eine theoretische Literaturanalyse, die auf wissenschaftlichen Grundlagen der Computerlinguistik und Informatik basiert.

Was wird im Hauptteil der Arbeit behandelt?

Im Hauptteil werden zunächst Chatbot-Klassiker vorgestellt und anschließend die technischen Details der Tokenisierung, wie das Erkennen von Abkürzungen, Kontraktionen und Sonderzeichen, diskutiert.

Welche Schlüsselwörter charakterisieren die Arbeit?

Wichtige Schlagworte sind Chatbots, Tokenisierung, Mensch-Computer-Interaktion, linguistische Analyse und Künstliche Intelligenz.

Welche Rolle spielt der Turing-Test in diesem Kontext?

Der Turing-Test dient als theoretischer Maßstab für die Entwicklung intelligenter Maschinen, wobei die Arbeit kritisch anmerkt, dass heutige Chatbots von diesem Ziel noch weit entfernt sind.

Warum ist die Normalisierung von Token für Chatbots so wichtig?

Die Normalisierung ist notwendig, um Variationen in der Eingabe (z.B. bei Zahlwörtern oder Schreibweisen) zu vereinheitlichen, was wiederum die Qualität der nachfolgenden Analyseschritte wie das POS-Tagging verbessert.

Excerpt out of 9 pages  - scroll top

Details

Title
Chatbots – Tokenisierung der Eingabe
College
Cologne University of Applied Sciences  (Fakultät für Informations- und Kommunikationswissenschaften)
Course
Mensch, Computer, Interaktion und Benutzeroberflächen
Grade
1,7
Author
Astrid Seefeld (Author)
Publication Year
2009
Pages
9
Catalog Number
V149984
ISBN (eBook)
9783640611997
ISBN (Book)
9783640612314
Language
German
Tags
Chat Chatbot Token Tokenisierung Interaktion Kommunikation Informationsaustausch Benutzeroberfläche
Product Safety
GRIN Publishing GmbH
Quote paper
Astrid Seefeld (Author), 2009, Chatbots – Tokenisierung der Eingabe, Munich, GRIN Verlag, https://www.grin.com/document/149984
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  9  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint