Das Forschungsgebiet Natural Language Processing ist eng mit der Erforschung der menschlichen Sprache an sich verknüpft. Dabei geben insbesondere Fehler, die während der menschlichen Sprachproduktion auftreten, Aufschluss über kognitive Prozesse der Sprachverarbeitung.
Am Max-Planck-Institut in Nijmegen beschäftigt man sich diesbezüglich interdisziplinär mit der Struktur und dem Gebrauch natürlicher Sprache in den vier Arbeitsbereichen Sprachproduktion, Sprachverstehen, Spracherwerb sowie Sprache und Kognition. Wie auch die anderen MPI, befindet es sich unter der Trägerschaft der Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Dieser gemeinnützige Verein wurde in Göttingen 1948 gegründet und ist nach Selbstdefinition eine Forschungsorganisation autonomer Grundlagenforschung von internationalem Rang.
Im Bereich Sprachproduktion wurde in Nijmegen auch der Wortplanungsprozess untersucht. Der Wortplanungsprozess umfasst den Vorgang der Wortauswahl aus verschiedenen miteinander konkurrierenden Konzepten bis zur Artikulation. Er lässt sich in die beiden nacheinander erfolgenden Hauptprozesse Wortauswahl und Wortenkodierung einteilen. Während der Wortauswahl wird das benötigte Lemma, das ist das Wort inklusive seiner syntaktischen Eigenschaften, selektiert. Im zweiten Schritt, dem Enkodierungsprozess, erhält das geplante Wort unter anderem Zugriff auf die zugehörigen Phoneme, Morpheme und Silben. Danach erhalten die Artikulationsorgane Zugriff auf allen relevanten Informationen, um das Wort produzieren zu können.
Der Niijmegener Forscher Ardi Roelofs hat sich im Rahmen seines Computermodells WEAVER (Word Encoding by Activation an VERification) dem zweiten Hauptprozess der Wortenkodierung gewidmet. Er hat WEAVER entwickelt um zu zeigen, welche Teilschritte der Wortenkodierung vorausgehen und schließlich zur Wortproduktion führen. Die untersuchten Sprachen hinsichtlich des Modells sind Englisch, Deutsch und Niederländisch. Dieses Modell soll im Laufe der vorliegenden Arbeit ausführlich vorgestellt werden.
Inhaltsverzeichnis
1. Einleitung
2. Zwei gegensätzliche Sprachproduktionsmodelle
2.1 Einordnung des Roelofs’schen Modells
2.1.1 Hybrider Ansatz
3. Motivation WEAVER zu entwickeln
4. Grundlegende Merkmale von WEAVER
4.1 Retrieval by spreading activation
4.2 Verification of activated information by a production rule
4.3 Incremental construction of phonological representations using a principle of active syllabification
4.4 Active competitive selection of syllabic motor programs
4.5 Association of phonological speech errors with the selection of syllabic motor programs due to the failure of verification
5. Funktionsweise von WEAVER
5.1 Prozesse der Wortenkodierung in WEAVER am Beispiel des Wortes Ende
5.2 Die drei Stufen der Enkodierung
6. “Picture-word interference paradigm” und “implicit priming”
6.1 „Implicit priming“
6.1.1 Beschleunigende Wirkung eines „prime“ in der Anfangssilbe
6.2 Picture-word interference paradigm
6.2.1 Generelle Arbeitsweise eines distractor
7. Computersimulation durch WEAVER
7.1. Picture-word interference paradigm
7.1.1 Generell hemmende Wirkung durch ein distractor word
7.1.2. Beschleunigende Wirkung durch ein related distractor word
7.1.3 Begin- versus end-related
7.1.4 Auswirkung „aligned“ versus „non-aligned“
7.2 “Implicit Priming paradigm” und “suspend/resume mechanism”
7.3 Versprecher (phonological speech errors)
8. Schlusswort
Zielsetzung & Themen
Die Arbeit befasst sich mit dem Computermodell WEAVER (Word Encoding by Activation and VERification), das von Ardi Roelofs entwickelt wurde, um die kognitiven Prozesse der menschlichen Wortenkodierung während der Sprachproduktion zu simulieren und zu erklären. Die zentrale Forschungsfrage untersucht, welche Teilschritte der Wortenkodierung der Artikulation vorausgehen und wie phonologische sowie semantische Faktoren in experimentellen Settings (wie "Picture-word interference" und "Implicit priming") die Geschwindigkeit der Wortproduktion beeinflussen.
- Grundprinzipien der Sprachproduktion und das "mentale Lexikon"
- Die drei Stufen der Wortenkodierung: morphologisch, phonologisch und phonetisch
- Analyse experimenteller Paradigmen zur Untersuchung von Reaktionszeiten
- Simulation von Versprechern als Ausdruck gescheiterter Verifikationsprozesse
- Anwendungsmöglichkeiten in Sprachsynthesemodulen
Auszug aus dem Buch
6.2.1 Generelle Arbeitsweise eines distractor
Ein „distractor“ aktiviert über die in ihm enthaltenden Phoneme das ihm zu Grunde liegende Morphem. Zeitgleich werden auch noch weitere Morpheme, die mit den Phonemen des „distractor“ verbunden sind, aktiviert. Durch die damit erzeugt Konkurrenzsituation wirkt ein „distractor“ normalerweise hemmend.
Beispiel: Zielmorphem
Ein „distractor“ kann aber auch beschleunigend auf die Wortproduktion wirken. Nämlich dann, wenn seine Phoneme ebenfalls das Zielmorphem aktivieren. Dann bewirkt ein „prime“ aus der Anfangssilbe des „distractor“ eine höhere Beschleunigungswirkung als aus einer Endsilbe, da der Effekt des „prime“ früher zu wirken beginnt, d.h. das Zielmorphem auch früher durch den „distractor“ aktiviert wird. Je dichter dabei das „prime“ zeitlich zur Sprachäußerung des Zielwortes liegt, desto höher ist seine Wirkung.
Beispiel: „distractor“ Hand [hant] und Zielwort Hast [hast]. Man geht davon aus, dass der „distractor“ Hand [hant] die zu ihm gehörenden Phoneme /h/, /a/, und /n/ und /t/ aktiviert. Jedes Phonem wiederum aktiviert Morpheme, die ihm zugeordnet sind. So aktivieren die Phoneme des „distractor“ Hand [hant] zusätzlich, wenn auch ein wenig schwächer, weitere Morpheme ihrer jeweiligen Kohorte.
Zusammenfassung der Kapitel
1. Einleitung: Diese Einführung erläutert das Forschungsfeld der Sprachproduktion und die wissenschaftliche Relevanz des Modells WEAVER bei der Untersuchung kognitiver Prozesse.
2. Zwei gegensätzliche Sprachproduktionsmodelle: Hier werden das diskrete Modell von Roelofs und das interaktive Modell von Dell in ihren grundlegenden Funktionsweisen und ihrem Informationsfluss gegenübergestellt.
3. Motivation WEAVER zu entwickeln: Dieses Kapitel nennt die Phänomene der Sprachproduktion, wie den Einfluss von "distractor words" und die flexible Silbenzugehörigkeit, die zur Konstruktion von WEAVER führten.
4. Grundlegende Merkmale von WEAVER: Es werden die technischen und theoretischen Eckpfeiler des Modells beschrieben, darunter "spreading activation", Produktionsregeln und "incremental production".
5. Funktionsweise von WEAVER: Dieses Kapitel detailliert die Stufen der Wortenkodierung (morphologisch, phonologisch, phonetisch) anhand des Wortbeispiels "Ende".
6. “Picture-word interference paradigm” und “implicit priming”: Diese Abschnitte führen in die zwei wichtigsten experimentellen Paradigmen ein, die zur Überprüfung von WEAVER herangezogen werden.
7. Computersimulation durch WEAVER: Hier wird dargelegt, wie WEAVER die Ergebnisse aus den Experimenten sowie das Auftreten von Versprechern durch mathematische Formalismen präzise simuliert.
8. Schlusswort: Das Fazit skizziert mögliche Anwendungen des Modells, insbesondere bei der Verbesserung der natürlichen Prosodie in Sprachsynthesemodulen.
Schlüsselwörter
Sprachproduktion, WEAVER, Wortenkodierung, Lemma, Phonem, Silbenbildung, Picture-word interference, Implicit priming, Versprecher, kognitive Prozesse, mentale Lexikon, Sprachsynthese, chronometrische Forschung, diskrete Modelle, Produktionsregeln
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit dem Computermodell WEAVER, das von Ardi Roelofs entwickelt wurde, um die kognitiven Abläufe hinter der menschlichen Sprachproduktion zu erforschen und zu modellieren.
Welche zentralen Themenfelder werden bearbeitet?
Die Schwerpunkte liegen auf der Wortplanung, der Wortenkodierung, der experimentellen Sprachforschung durch Wort-Bild-Interferenz-Studien und der Simulation von phonologischen Versprechern.
Was ist das primäre Ziel der Untersuchung?
Ziel ist es zu erläutern, wie das WEAVER-Modell die verschiedenen Teilschritte von der Konzeptselektion bis zur Artikulation abbildet und warum es trotz seines diskreten Informationsflusses auch Versprecher erklären kann.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit basiert auf einer theoretischen Literaturanalyse und der Auswertung von Computersimulationen, die auf empirischen chronometrischen Daten der Sprachproduktionsforschung beruhen.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in die Darstellung der theoretischen Modellarchitektur, die Beschreibung der Enkodierungsstufen und die Analyse der Ergebnisse von Computersimulationen im Vergleich zu realen psycholinguistischen Experimenten.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit wird primär durch Begriffe wie Sprachproduktion, Wortenkodierung, WEAVER-Modell, kognitive Simulation und phonologische Versprecher definiert.
Wie unterscheidet sich WEAVER von anderen Modellen?
Im Gegensatz zu rein interaktiven Modellen ist WEAVER primär ein diskretes Modell, das jedoch durch den Einbau von Produktionsregeln und Verifikationsprozessen hybride Eigenschaften annimmt, um Fehler in der Sprachproduktion zu simulieren.
Welche Rolle spielen „distractor words“ in der Untersuchung?
Distractor words werden in der Simulation genutzt, um den zeitlichen Verlauf und die Konkurrenzprozesse bei der Auswahl von Wortbestandteilen zu testen, was Aufschluss über die Geschwindigkeit der Wortproduktion gibt.
Was passiert bei einem Versprecher laut WEAVER?
Ein Versprecher entsteht im Modell, wenn der interne Verifikationsprozess scheitert: Das Modell wählt aufgrund konkurrierender Silbenknoten fälschlicherweise eine falsche Silbe aus, ohne dass dieser Fehler durch die Produktionsregeln korrigiert wird.
Welchen praktischen Nutzen haben die Erkenntnisse?
Die Ergebnisse bieten Ansätze, um moderne Sprachsynthese-Systeme natürlicher zu gestalten, indem sie besser auf prosodische Merkmale und die kontextabhängige Realisation von Phonemen eingehen.
- Quote paper
- Simone Kotarra (Author), 2006, Natural Language Processing (NLP) in wissenschaftlichen Instituten, Munich, GRIN Verlag, https://www.grin.com/document/50705