Der Gegenstandsbereich der vorliegenden Arbeit ist die Sprachsynthese, d.h. die maschinelle Generierung lautsprachlicher Äußerungen. Spätestens seit der Erfindung des Computers fasziniert den Menschen die Idee, einer Maschine das Sprechen lehren oder sogar mit ihr kommunizieren zu können. In der bisherigen Geschichte der Sprachsynthese konnte die generierte Sprachausgabe immer nur so gut sein wie der jeweils aktuelle Entwicklungsstand auf dem Gebiet der Informationselektronik es zuließ.
Die neusten Verfahren und Methoden zur Sprachsynthese arbeiten auf der Basis umfangreichen Datenmaterials, das einerseits eine hervorragende Synthesequalität gewährleistet, andererseits aber an die Grenzen des bei der Aufbereitung der Daten tolerablen Arbeitsaufwandes geht. Die jüngsten Entwicklungen auf dem Gebiet der Sprachsynthese verlangen also nach ausgefeilten Strategien, den immens gewachsenen Arbeitsaufwand unter Aufrechterhaltung der hohen Synthesequalität zu reduzieren. Vorliegende Arbeit leistet einen solchen Beitrag zur Verbesserung der Ökonomie von Sprachsynthese auf der Basis großer Korpora.
Inhaltsverzeichnis
- Einleitung
- Sprachsyntheseverfahren
- Systemarchitektur
- Sprachsynthese nach Regeln
- Datengesteuerte Sprachsynthese
- Einheiten der konkatenativen Sprachsynthese
- Anwendungen mit begrenztem Bausteininventar
- Selektive konkatenative Synthese
- Qualitätsanforderungen an die Sprachsynthese
- Die Qualitätsmerkmale
- Methoden zur Qualitätsmessung
- Sprachliche Einheiten in langue und parole
- Die abstrakten Einheiten des Sprachsystems
- Der Satz
- Das Wort
- Das Morphem
- Das Phonem
- Lautsprachliche Korrelate abstrakter Spracheinheiten
- Die Intonationsphrase
- Die Wortform
- Das Morph
- Das Phon
- Eine spezielle Einheitendefinition zur Generierung flektierter Wortformen
- Erhebung von Daten
- Erstellungskriterien für das Datenmaterial
- Aufnahme der Daten
- Aufbereitung des Korpus
- Vorexperimente
- Die Position der Schnittgrenze
- Der phonetische Kontext der Schnittgrenze
- Hypothese für einen Perzeptionstest
- Evaluation durch einen Perzeptionstest
- Auswahl der Testmethode
- Auswahl der Stimuli
- Auswahl der Testpersonen
- Testergebnisse
- Zusammenfassung
- Diskussion
Zielsetzung und Themenschwerpunkte
Diese Arbeit befasst sich mit dem Thema der Sprachsynthese, genauer gesagt mit der maschinellen Generierung lautsprachlicher Äußerungen. Die Hauptziele dieser Arbeit sind die Verbesserung der Ökonomie von Sprachsynthese auf der Basis großer Korpora und die Erforschung neuer Strategien zur Reduktion des Arbeitsaufwandes bei der Aufbereitung von Daten.
- Die Verwendung spezieller Einheiten in der konkatenativen Sprachsynthese
- Die Optimierung der Generierung flektierter Wortformen
- Die Erhebung und Aufbereitung von Daten zur Sprachsynthese
- Die Evaluation der Synthesequalität durch Perzeptionstests
- Die Diskussion der morphologischen Struktur des Wortes und seiner Beziehung zu anderen linguistischen Einheiten
Zusammenfassung der Kapitel
Kapitel 1 bietet eine Einleitung in die Thematik der Sprachsynthese und beleuchtet den Hintergrund sowie die Motivation für die Arbeit. Kapitel 2 stellt verschiedene Verfahren der Sprachsynthese vor, inklusive einer Analyse der Systemarchitektur, der Sprachsynthese nach Regeln und der datengesteuerten Sprachsynthese. Kapitel 3 befasst sich mit der Erörterung des Wortes als linguistische Einheit und untersucht seine morphologische Struktur sowie die lautsprachlichen Korrelate abstrakter Spracheinheiten. Kapitel 4 präsentiert die Erhebung und Aufbereitung von Daten für die Generierung flektierter Wortformen, inklusive Vorexperimente und einer Evaluation durch einen Perzeptionstest.
Schlüsselwörter
Konkatenative Sprachsynthese, Wortform, Morphologie, Sprachsynthesequalität, Perzeptionstest, Korpora, Datenaufbereitung, linguistische Einheiten, Phonem, Morph, Intonationsphrase.
Häufig gestellte Fragen
Was ist konkatenative Sprachsynthese?
Es handelt sich um ein Verfahren der maschinellen Sprachgenerierung, bei dem vorab aufgenommene Spracheinheiten (Bausteine) aus einem großen Korpus aneinandergereiht werden, um flüssige Sprache zu erzeugen.
Warum ist die Generierung flektierter Wortformen eine Herausforderung?
Flektierte Formen (z.B. Endungen bei Verben oder Nomen) erfordern präzise Schnittstellen zwischen den Morphemen, damit die synthetisierte Sprache natürlich klingt und keine hörbaren Brüche entstehen.
Welche Rolle spielen Morpheme und Phoneme in der Sprachsynthese?
Morpheme sind die kleinsten bedeutungstragenden Einheiten und Phoneme die kleinsten lautlichen Einheiten. In der datengesteuerten Synthese dienen sie als Basis für die Auswahl und Kombination der Sprachbausteine.
Wie wird die Qualität der Sprachsynthese gemessen?
Die Qualität wird primär durch Perzeptionstests evaluiert, bei denen Testpersonen die Natürlichkeit und Verständlichkeit der generierten Äußerungen bewerten.
Wie kann der Arbeitsaufwand bei der Datenaufbereitung reduziert werden?
Durch die Definition spezieller Einheiten und ausgefeilte Strategien zur Korpus-Optimierung kann der manuelle Aufwand bei der Segmentierung und Etikettierung der Sprachdaten gesenkt werden, ohne die Qualität zu mindern.
- Quote paper
- Dr. Jörg Bröggelwirth (Author), 2000, Die Verwendung spezieller Einheiten zur Generierung flektierter Wortformen in der konkatenativen Sprachsynthese, Munich, GRIN Verlag, https://www.grin.com/document/161324