[...] Je öfter ein Agent Datensätze dieser Art gesammelt hat, desto häufiger sollte er
dann in zukünftigen Situationen entscheiden können, welche zuvor gelernte Verhaltensfolge
er jeweils anwenden kann, um seine Performance zu verbessern. Ausgehend
von der Erkenntnis, dass erfolgreiche Handlungsfolgen leichter und häufiger kopiert
werden als erfolglose, sollen die Agenten auf diese Weise versuchen, ihr Verhalten
mit der Zeit zu verbessern, ohne auf dedizierte Lernalgorithmen zurückzugreifen.
Der oben erwähnte innere Zustand eines Agenten besteht aus Bedürfnissen und
Emotionen, die der Agent stets in einem angenehmen Bereich zu halten versucht.
Die Performance eines Agenten wird daran gemessen, wie erfolgreich er dabei ist. Im
Laufe der Zeit sollte der Agent durch mehr und mehr gelernte Episoden es verstehen,
seine Bedürfnisse und Emotionen immer besser zu kontrollieren.
Bei erfolgter Imitation einer Handlungsfolge oder Episode, kann der imitierende
Agent auch als ein “Episodenvervielfältiger” aufgefasst werden, die imitierte Episode
demzufolge gemäß Blackmores Definition als “Mem”. Die Software-Agenten werden damit als sog. “Mem-Wirte” benutzt. Es ist zu untersuchen, in welchem Ausmaß
Episoden vervielfältigt werden und ob sich in gewisser Weise Episoden-“Schulen”
herausbilden, ob sich also die Agentengesellschaft in Gruppierungen oder Cluster
aufteilen lässt. Diese Cluster enthalten dann nur solche Agenten, die zu einem bestimmten
Grade die gleichen Episoden in gleichen Situationen anwenden, in ihren
Verhaltensweisen also ähnlich sind. Die Ergebnisse des hier entwickelten Lernverfahrens
und der darauf aufbauenden Architektur sollen mittels einer Simulationsumgebung
ermittelt werden.
Um dieses Ziel — das Lernen von Handlungsfolgen durch Imitation — zu erreichen,
müssen in dieser Arbeit drei Themenblöcke zusammengebracht werden. Zuerst
ist da die Fähigkeit der Imitation von Episoden und der dadurch erreichte Lerneffekt.
Diese erfolgreich gelernten und angewandten Episoden wirken sich dann mittelbar
auf die Bedürfnisse und Emotionen des Agenten aus. Daraufhin kontrolliert der
Agent auf diese Weise beeinflusst seine verhaltensbasierte Architektur, die indirekt
über die Umweltrückgekoppelt seinen emotionalen Zustand verändert.
Die detaillierten Zielsetzungen in diesen drei Themen Lernen durch Imitation,
Bedürfnisse und Emotionen und verhaltensbasierte Architekturen werden im Folgenden
eingehender vorgestellt.
Inhaltsverzeichnis
- 1 Einleitung
- 2 Zielsetzung
- 2.1 Lernen durch Imitation
- 2.2 Bedürfnisse und Emotionen
- 2.3 Verhaltensbasierte Architekturen
- 3 Lösungsansatz
- 4 Existierende Lösungsansätze
- 4.1 Handhabung von Wissen in der Imitation
- 4.1.1 Klassifizierung von Wissen allgemein
- 4.1.2 Speicherung von Episoden
- 4.1.3 Identifikation von vorteilhaften Episoden
- 4.2 Modellierung von Emotionen und Bedürfnissen
- 4.2.1 Emotionen und Bedürfnisse beim Menschen
- 4.2.2 MEXI
- 4.2.2.1 MEXIS Verhaltenssystem
- 4.2.2.2 MEXIs Emotionssystem
- 4.2.2.3 Beziehung zwischen Emotions- und Verhaltenssystem
- 4.2.3 Kismet
- 4.2.3.1 Kismets Motivationen
- 4.2.3.2 Kismets Emotionen
- 4.2.3.3 Von der Stimulation zur Emotion
- 4.3 Verhaltensbasierte Systeme
- 4.3.1 Motor Schema Architektur
- 4.3.2 Subsumption Architektur
- 4.3.3 Motor Schemes vs. Subsumption Architektur
- 4.4 Vorhandene Simulationsumgebungen und Toolkits
- 4.1 Handhabung von Wissen in der Imitation
- 5 Methodik
- 5.1 Imitation
- 5.1.1 Von der Beobachtung zur Anwendung
- 5.1.1.1 Erkennung erfolgreicher Episoden
- 5.1.1.2 Verhaltensinferenz und Transformation der Episode
- 5.1.1.3 Episodenspeicherung
- 5.1.1.4 Erzeugung der entsprechenden Handlung
- 5.1.2 Beobachtungsschnittstelle
- 5.1.1 Von der Beobachtung zur Anwendung
- 5.2 Steuerung der Agenten mittels Emotionen und Bedürfnissen
- 5.2.1 Bedürfnisse und Emotionen
- 5.2.2 Dynamik in Emotionen und Bedürfnissen
- 5.2.2.1 Anregungsfunktionen
- 5.2.2.2 Emotionale Reaktion auf äußere Ereignisse
- 5.2.2.3 Aktivierungsschwellwerte
- 5.2.3 Zustandsbewertung und vorteilhafte Episoden
- 5.3 Agenten und Kulturen
- 5.3.1 Diversität und Entropie
- 5.3.2 Verhaltensdifferenzen
- 5.3.3 Clusterbildung der Agenten
- 5.3.4 Messung der Diversität einer Gesellschaft
- 5.1 Imitation
- 6 Anwendungsbeispiel
- 6.1 Das Emotionssystem der simulierten Agenten
- 6.1.1 Bedürfnisse
- 6.1.2 Emotionen
- 6.1.3 Auswirkung der Stimuli auf die Emotionen
- 6.1.4 Schwellwerte der Bedürfnisse und Emotionen
- 6.1.5 Auswirkung der Verhalten auf die Emotionen
- 6.2 Das Verhaltenssystem der Agenten
- 6.2.1 Standardverhalten
- 6.2.2 Imitationsverhalten
- 6.2.2.1 OBSERVE
- 6.2.2.2 APPLY
- 6.3 Nichtdeterminismus in der Verhaltenssteuerung
- 6.4 Differenzen unter den Agenten
- 6.1 Das Emotionssystem der simulierten Agenten
- 7 Simulationsergebnisse
- 7.1 Wellness-Test
- 7.2 Diversität der Agentengesellschaft
- 7.2.1 Beispiel 1
- 7.2.2 Beispiel 2
- 7.3 Bewertung der Heterogenität
- 8 Zusammenfassung und Ausblick
Zielsetzung und Themenschwerpunkte
Diese Diplomarbeit untersucht das Lernen von Handlungsfolgen durch Imitation bei verhaltensbasierten Agenten, wobei Bedürfnisse und Emotionen die Steuerung beeinflussen. Ziel ist die Entwicklung und Implementierung eines Simulationsmodells, das dieses Lernen demonstriert.
- Lernen durch Imitation in verhaltensbasierten Architekturen
- Einfluss von Bedürfnissen und Emotionen auf das Lernverhalten
- Modellierung von Emotionen und Bedürfnissen
- Entwicklung eines Simulationsmodells
- Analyse der Diversität und Heterogenität in der Agentengesellschaft
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung führt in die Thematik des Lernens durch Imitation bei Agenten ein und beschreibt den Kontext der Arbeit. Sie skizziert die Bedeutung von Bedürfnissen und Emotionen für die Entscheidungsfindung und das Verhalten der Agenten und benennt die Forschungsfragen, die in der Arbeit behandelt werden.
2 Zielsetzung: Dieses Kapitel definiert die Ziele der Arbeit präzise. Es werden die Teilziele, die zur Erreichung des Hauptziels beitragen, detailliert erläutert. Das Kapitel skizziert den geplanten Lösungsansatz und legt den Fokus auf die Integration von Imitation, Bedürfnissen und Emotionen in ein verhaltensbasiertes Architekturmodell.
3 Lösungsansatz: Hier wird der gewählte Lösungsansatz zur Modellierung des Lernens durch Imitation unter dem Einfluss von Bedürfnissen und Emotionen präsentiert. Es werden die Kernkomponenten des Modells beschrieben und die Interaktionen zwischen diesen Komponenten detailliert dargestellt. Das Kapitel betont den methodischen Ansatz und die Wahl der verwendeten Werkzeuge und Technologien.
4 Existierende Lösungsansätze: Dieses Kapitel bietet einen umfassenden Überblick über den Stand der Forschung im Bereich des Lernens durch Imitation, der Modellierung von Emotionen und Bedürfnissen, sowie verhaltensbasierter Architekturen. Es werden verschiedene Ansätze kritisch bewertet und ihre Stärken und Schwächen im Hinblick auf die Zielsetzung der Arbeit diskutiert. Die Analyse beinhaltet eine detaillierte Darstellung relevanter Modelle wie MEXI und Kismet.
5 Methodik: Das Kapitel beschreibt detailliert die Methodik der Arbeit, einschließlich der Implementierung der Imitation, der Modellierung der emotionalen und Bedürfniss-gesteuerten Steuerung der Agenten sowie der Konzeption der Agentengesellschaft und deren Diversität. Die verschiedenen Aspekte der Methodik werden umfassend erklärt und die getroffenen Entscheidungen begründet.
6 Anwendungsbeispiel: Dieses Kapitel präsentiert ein konkretes Anwendungsbeispiel, um das entwickelte Modell zu illustrieren. Es beschreibt die Implementierung des Emotionssystems und des Verhaltenssystems der simulierten Agenten und erläutert die Interaktion zwischen beiden Systemen. Das Kapitel stellt die Funktionsweise des Modells im Detail dar und beleuchtet insbesondere den Aspekt des Nichtdeterminismus.
Schlüsselwörter
Lernen durch Imitation, Verhaltensbasierte Architekturen, Bedürfnisse, Emotionen, Agentenbasierte Simulation, Diversität, Heterogenität, MEXI, Kismet, Episoden, Verhaltensinferenz.
Häufig gestellte Fragen zur Diplomarbeit: Lernen durch Imitation bei verhaltensbasierten Agenten
Was ist das Hauptthema der Diplomarbeit?
Die Diplomarbeit untersucht das Lernen von Handlungsfolgen durch Imitation bei verhaltensbasierten Agenten, wobei Bedürfnisse und Emotionen die Steuerung beeinflussen. Das Hauptziel ist die Entwicklung und Implementierung eines Simulationsmodells, das dieses Lernen demonstriert und die daraus resultierende Diversität in einer Agentengesellschaft analysiert.
Welche Zielsetzungen werden in der Arbeit verfolgt?
Die Arbeit zielt darauf ab, ein Simulationsmodell zu entwickeln, das Lernen durch Imitation in verhaltensbasierten Architekturen unter dem Einfluss von Bedürfnissen und Emotionen darstellt. Es werden die Modellierung von Emotionen und Bedürfnissen, die Implementierung der Imitation und die Analyse der Diversität und Heterogenität in der simulierten Agentengesellschaft untersucht.
Welche Lösungsansätze werden betrachtet?
Die Arbeit betrachtet existierende Lösungsansätze im Bereich des Lernens durch Imitation, der Modellierung von Emotionen und Bedürfnissen (u.a. MEXI und Kismet) sowie verhaltensbasierter Architekturen (z.B. Motor Schema und Subsumption Architektur). Diese werden kritisch bewertet und in den eigenen Lösungsansatz integriert.
Wie ist die Methodik der Arbeit aufgebaut?
Die Methodik umfasst die Implementierung der Imitation (Beobachtung, Verhaltensinferenz, Episodenspeicherung, Handlungserzeugung), die Modellierung der emotionalen und bedürfnisgesteuerten Steuerung der Agenten, sowie die Konzeption der Agentengesellschaft und die Messung deren Diversität und Heterogenität.
Welche Simulationsumgebung und Toolkits wurden verwendet?
Die Arbeit beschreibt die verwendeten Simulationsumgebungen und Toolkits, jedoch werden die spezifischen Namen nicht im Inhaltsverzeichnis genannt. Weitere Details finden sich im Kapitel zur Methodik.
Wie ist das Anwendungsbeispiel aufgebaut?
Das Anwendungsbeispiel illustriert das entwickelte Modell durch die detaillierte Beschreibung des Emotions- und Verhaltenssystems der simulierten Agenten, inklusive der Interaktion zwischen beiden Systemen und der Berücksichtigung von Nichtdeterminismus.
Welche Simulationsergebnisse werden präsentiert?
Die Arbeit präsentiert Simulationsergebnisse zu einem Wellness-Test, zur Diversität der Agentengesellschaft (mit Beispielen) und zur Bewertung der Heterogenität. Die genauen Ergebnisse und deren Interpretation finden sich im entsprechenden Kapitel.
Welche Schlüsselwörter beschreiben die Arbeit am besten?
Die Arbeit wird durch folgende Schlüsselwörter charakterisiert: Lernen durch Imitation, Verhaltensbasierte Architekturen, Bedürfnisse, Emotionen, Agentenbasierte Simulation, Diversität, Heterogenität, MEXI, Kismet, Episoden, Verhaltensinferenz.
Welche Kapitel sind in der Arbeit enthalten?
Die Arbeit umfasst Kapitel zu Einleitung, Zielsetzung, Lösungsansatz, existierenden Lösungsansätzen, Methodik, Anwendungsbeispiel, Simulationsergebnissen und Zusammenfassung sowie Ausblick. Ein detailliertes Inhaltsverzeichnis mit Unterkapiteln ist im Dokument enthalten.
- Citar trabajo
- Willi Richert (Autor), 2004, Lernen von Handlungsfolgen durch Imitation, Múnich, GRIN Verlag, https://www.grin.com/document/30455