Einfluss des Übertragungskanals auf die Sprechererkennung bei genetisch verwandten Sprechern


Hausarbeit (Hauptseminar), 2005
38 Seiten, Note: 1,0

Leseprobe

1. Einleitung

Bei Gewaltverbrechen (Überfällen, Vergewaltigungen, Entführungen u.ä.) ist die Stimme eines Täters oft eines der einzigen Beweis­mittel

„Die einfachste Form des klassischen Stimmenvergleichs besteht in der Un­tersuchung der Frage, ob der unbekannte Sprecher einer frag­lichen Sprach­aufzeichnung X (Tataufnahme) mit dem bekannten Spre­cher einer Ver­gleichsaufnahme Y identisch ist“[1]. Nicht immer lie­gen aber Tat- und/oder Vergleichsaufnahmen vor, die eine au­tomati­sche oder semiautomatische Sprecherkennung durch den Spezia­listen er­möglichen. In solchen Fällen kann die akustische Gegenüber­stel­lung und Sprechererkennung durch Opfer und Zeugen -phonetisch naive Ohrenzeugen - der einzige Weg zur Findung und Verurteilung eines Täters sein. „Während die forensische Sprecherer­kennung durch den auf moderner, instrumentell unter­stützter audi­tiv phone­tischer Basis arbeitenden Wissenschaftler heute unstrit­tig und von Gerichten im In- und Ausland akzeptiert ist, wird Sprecheridenti­fizierung durch Laien stark unterschied­lich beur­teilt“[2]

huntley und pass bemerken, dass es in der Vergangenheit eine Viel­zahl von Versuchen gab, die sich mit der Frage nach der Güte von Sprecher­identifizierungen durch naive Hörer beschäftigt haben, kritisieren aber „while this information is extremely useful, it tends to stress limiting the use of this procedure [Anm.: auditi­ves line-up] instead of providing a means to properly direct its implemen­ta­tion“[3]

Die indivi­duelle Erkennungsleistung naiver Hörer ist sehr unter­schied­lich und hängt von einer Vielzahl von Parame­tern ab, die sich kaum vollständig kontrollieren lassen. Zudem lassen sich in­dividuelle und damit subjek­tive Erkennungs­leistungen schlecht ob­jektivieren

Auch broders und rietveld schreiben, dass die Frage nach der Über­prüfbarkeit der Sprecheridentifizierung durch naive Hörer unbeant­wortet bleiben muss[4]. Dennoch gäbe es eine Reihe von Faktoren, die das Entscheidungsverhalten der Ohrenzeugen beinflussen. Sie unter­scheiden dabei zwischen systembedingten (system variables) und hörerabhängigen Faktoren (estimator variab­les)

Als „estimator variables“ werden Faktoren z.B. wie Alter des nai­ven Hörers, individuelle Fähigkeit der Sprechererkennung, Grad der Stresssituation, Vertrautheit mit einer „ähnlichen“ Stimme (sound-alikes), Zeit zwischen „Familiarisierung“ und Identifizierung u.s.w. bezeichnet, die nicht durch den Explorator kontrollierbar sind. „Examples of system or perhaps better procedure variables are the instructions given to the witness before the line-up is conducted, the number and choice of speakers in the line-up and the nature and duration of the speech samples used in the line-up material“[5]. Diese Sys­temvariablen können durch den Explorator kontrolliert werden und beeinflussen maßgeblich die Erfolgsaussichten korrekter Identifi­zierungen durch so genannte „earwitnesses“

Dieser Versuch beschäftigt sich mit der Frage, welchen Ein­fluss Parameter wie Übertragungskanal und Äußerungstpyus auf die Identi­fizierbarkeit genetisch verwandter Sprecher haben

Untersucht werden folgende Variablen:

1. Hitrate (percent correct) in Abhängigkeit des Übertragungska­nals (Bedingung Hifimaterial vs. Telefonmaterial).
2. Hitrate in Abhängigkeit der Sprecher.
3. Hitrate in Abhängigkeit des Äußerungstypus (Satz vs. Zahl)

Im ersten Teil der Arbeit wird kurz auf die genannten Faktoren und deren Relevanz für die forensische Sprechererkennung eingegangen

Der zweite Teil der Arbeit befasst sich mit der Beschreibung des Versuchsdesigns. Der dritte Teil der Arbeit umfasst sowohl die automatische und manuelle phonetische Analyse der ausgewählten Sprecher als auch die daraus resultierenden Hypothesen

Im vierten Teil der Arbeit werden die Versuchsergebnisse präsen­tiert und abschließend im fünften Teil diskutiert

Auf Schwierigkeiten und Mängel des Experimentes wird in der Ver­suchsbeschreibung als auch in der Versuchsauswertung eingegangen

I Theoretische Grundlagen

2.1 Einfluss der genetischen Verwandtschaft auf die Sprecherer­kennung

„Es ist eine Erfahrungssache, dass sich Stimmen genetisch verwand­ter Sprecher (desselben Geschlechts) in vielerlei Hinsicht ähnli­cher sein können als Stimmen nicht verwandter Sprecher. Auf der Produktionsseite sind Merkmale wie Stimmhöhe, Stimmklang, Dialekt, Gebrauch von Floskeln, etc. zu nennen. Hinsichtlich der auditiven Erkennbarkeit bieten solche ähnlichen Stimmen mehr Schwierigkeiten bei der Identifizierung“[6]

Bekannt ist auch die Tatsache, dass genetisch verwandte Sprecher gerade am Telefon sehr häufig miteinander verwechselt werden – die Tochter beispielsweise wird häufig mit ihrer Mutter oder ihren Schwestern verwechselt

Bei einem normalen Telefongespräch kann man durch einfache Nach­frage nach dem Namen des Gesprächspartners die Verwechselung klä­ren. Hinsichtlich der forensischen Sprecher­erkennung ist die Frage nach der Identifizierbarkeit von Sprechern jedoch von größerer Bedeutung, denn kaum ein Verbrecher wird am Telefon seinen Namen nennen – geschweige denn auf Nachfrage

Wichtig für die forensische Sprechererkennung sind Sprache, Stimme und Sprechweise, also sowohl organische als auch erworbene Charak­teristika eines Sprechers. Organische Charakteristika sind die Physiologie des Kehlkopfes und der sub- und supraglottalen Reso­nanzkavitäten[7]

Neben den organischen Charakteristika sind im Rahmen der Sprecher­erkennung auch erworbene spre­chertypische Merkmale wie Dialekt oder Soziolekt, Into­nation, Sprechtempo und nichtsprachliche Merk­male wie z.B. Schmatzen oder Vokalisierungen von großer Bedeutung

Die sog. erworbenen sprecherspezifischen Merkmale entstehen im weitesten Sinn aus den für jeden Menschen charakteristischen äuße­ren Lebensumständen, unter denen zunächst der Spracherwerb, danach der Gebrauch der laut- und schriftsprachlichen Kommunikation stattfindet. Von besonderer Bedeutung ist hierbei der in der Umge­bung des Menschen gesprochene Dialekt []. [] Hinzu kommen ge­sellschaftliche Bedingungen, die den sog. Soziolekt bestim­men[8]

Im Falle einer genetischen Verwandtschaft von Sprechern stimmen häufig sowohl die organischen Charakteristika als – aufgrund des identischen Umfelds des Spracherwerbs und der Sozialisation – auch die erworbenen Charakteristika der Sprecher stärker überein als dies zufällig bei nicht­verwandten Sprechern der Fall ist

- Exkurs: Fallbeispiel -

„In einer süddeutschen Kleinstadt wird anlässlich einer Serie von telefo­nischen Beleidigungen zum Nachteil einer jungen Frau eine Fangschaltung beim Fernmeldeamt installiert und dadurch mehrmals derselbe Hauptan­schluss als Ursprungsort festgestellt. Aufgrund weiterer Ermittlungen, insbesondere bezüglich eines Tatmotivs, wird ein erwachsener Sohn des Anschlussinhabers angeklagt, der jedoch noch in der Hauptverhandlung die Taten bestreitet und statt dessen pauschal seine vier Brüder beschuldigt, von denen drei ebenfalls bereits das Erwachsenenalter erreicht haben. Die durch den Sachverständigen auditiv festgestellt große Ähnlichkeit der Stimmen und der Sprache der betroffenen Sprecher lässt die Durch­führung eines Stimmenvergleichsgutachten auf der Basis, des – zudem in schlechter akustischer Qualität aufgezeichneten – Tatma­terials als nicht aussichts­reich erscheinen. Der Angeklagte wird daraufhin von der Kammer freige­sprochen.“[9]

Die automatische Sprechererkennung (siehe 4.1) basiert auf der Analyse organischer Charakteristika einer Stimme. Für die Gutach­tenerstellung durch den geschulten Phonetiker sind sowohl organi­sche (genetische) als auch erworbene Aspekte rele­vant

Für linguistische naive Personen sind bei einer Sprecheridentifi­zierung vor allem organische Charakteristika wie die mittlere Grundfrequenz der Sprecher ausschlaggebend. Untersuchungen von Foulkes und barron (2000) weisen darauf hin, dass naive Hörer sich bei der Sprecher­identifizierung vor allem an der durchschnittli­chen Grund­frequenz als auch an der Modulation orientieren:

„Our analysis of F0 measures shows that both mean F0 and standard deviation of F0 have a statistically significant correlation with recognition rate in the SR test. It appears easier for listeners to identify those speakers who exhibit more extreme F0 levels or ranges“[10].

Erworbene Charakteris­tika wie regionalsprachliche Färbungen werden nach Foulkes und barron meist nicht als Un­terscheidungskriterium wahrgenommen

2.2 Einfluss des Übertragungskanals

Bei der Beurteilung der Erfolgsaussichten einer auditiven, d.h. mit Hilfe des Ohres vorgenommenen Identifizierung, ist der Grad der Vertrautheit der erkennenden Person mit der Stimme eines oder mehrerer in Frage kommender Sprecher von Bedeutung. [] Die Erken­nung wird jedoch schon schwieriger, wenn das Gespräch nur wenige Sekunden dauert und der zur Verfügung stehende Übertragungskanal Eigen­schaften besitzt, die den zum Ohr der beurteilenden Person gelangenden Sprachschall beeinträchtigen, zum Beispiel durch Be­grenzung des Frequenzbe­reiches und Verzerrungen[11]

Neben den sprecherspezifischen Charakteristika hat also auch die Art und Qualität des Übertragungskanals großen Einfluss auf die Spre­chererkennung. Im Rahmen der forensischen Sprecheridentifizie­rung liegen, so byrne, in über 90% der Fälle Telefon- oder Mobil­funk­aufnahmen vor

An important implication of this for forensic linguistics is that familiarity with a voice in face-to-face interaction, and successful SR (Anm.: SR = Speaker Recognition) of that voice in a direct setting, do not reliably demonstrate that the same voice will be equally well recognized if the context is changed to Telefone interaction[12]

Untersuchungen von künzel haben gezeigt, dass familiare Hörer ge­genüber nichtfamiliaren Hörern bei der Sprechererkennung bei, über den Telefonkanal aufgezeichnetem Material keine wesentlich besse­ren Erkennungsraten aufweisen

Der Übertragungskanal Telefon verursacht sowohl aktive als auch passive Effekte, die sowohl Sprache und Sprechweise als auch die Qualität des Sprachsignals zum Teil erheblich beeinflussen

Als aktive Effekte des Übertragungskanals sind Beeinflussungen der Sprache und Sprechweise zu bezeichnen. künzel weist darauf hin, dass zu beachten ist, dass „unter „normalen“ Umständen [] bei der Identifizierung von Verwandten bzw. Bekannten am Telefon be­stimmte, für die zu erkennende Person typische Floskeln eine er­hebliche Rolle []“[13] spielen

Zum einen werden am Telefon häufig bestimmte sprecherspezifische Floskeln benutzt, zum anderen kann die Sprechsituation über das Telefon zu Effekten wie Verände­rungen der Artikulationsrate oder veränderter Stimmqualität führen („telephone voice“)[14]. Hintergrund­geräusche - be­dingt durch die lautliche Umgebung des Gespräches oder Störgeräu­sche, die durch den Übertragungskanal selbst verursacht werden – können sowohl zu einer erhöhten mittle­ren Grundfrequenz führen als auch zu einer höheren Amplitude (Lom­bard-Effekt)[15]

Als passive Effekte des Übertragungskanals werden technische Ver­änderungen des Sprachsignals bezeichnet, die im Falle der Telefon­übertragung vor allem durch ein Bandpassfilter verursacht werden. Liegt bei der Sprachübertragung, wie im Falle der Telefonübertra­gung ein Bandpassfilter mit dem Frequenzgang 300Hz-3400Hz vor, so ist dies zwangsläufig mit Qualitätsverlusten des Sprachmaterials verbunden. Liegen Frequenzen im Sperrbereich / Toleranzbereich des Filters, so werden die betroffenen Frequenzen unterdrückt bzw. deren Amplitude stark abgeschwächt (hier -40dB). Liegt der untere Sperrbereich bei 300Hz, so wird die Grundfrequenz entweder voll­ständig gefiltert oder der Schwerpunkt des Frequenzbandes nach „oben“ verschoben. Im oberen Sperrbereich des Bandpassfilters von 3400Hz sind die dritten und vierten Formanten vom Sperrbereich des Filters betroffen. Auch hier werden Frequenzbänder entweder voll­ständig unterdrückt oder es findet eine Verschiebung der For­mantschwerpunkte in tiefere Frequenzbereiche statt. Verschiebungen der Formantschwerpunkte haben immer eine Veränderung der „Stimm­qualität“ zur Folge, insbesondere der Vokalqualitäten

2.3 Einfluss der Länge des Sprachmaterials

Die Länge des präsentierten Sprachmaterials korreliert nicht unbe­dingt mit der Erkennungsleistung der Hörer. Von größerer Bedeutung ist die Ergiebigkeit des phonologischen Gehaltes der Äußerungen. Je größer die phonologische Ergiebigkeit des Materials ist, desto größer ist der Freiraum für sprecherspezifische oder regional­sprachlich bedingte Realisierungen bestimmter Variablen

Bricker and Pruzansky reported 98% correct identification of familiar speakers by listeners when sentences were provided as stimuli; however, identification accuracy fell to only 56% when the samples were short []. As early as 1954, data became available which suggested that identification accuracy improved with increasing speech sample duration up to about 1200ms; for longer periods, accuracy did not appear to be related to duration, but rather to phonemic repertoire[16]

künzels Daten (1990) bestätigen diese Annahme

[...]


[1] künzel 1987, S.

[2] künzel 1990, S.1 f

[3] huntley / pass, S.

[4] Vgl.: broders / rietveld, S. 38

[5] broders / rietveld, S.

[6] Übernommen aus dem Thesenpapier von Prof. Dr. künzel zum Aufbau dieses Versuchs

[7] Ausführlicher beschrieben in der Arbeit zum Einfluss des GSM-Übertragungs­kanals auf Vokalformanten

[8] künzel 1987, S.

[9] künzel 1990, S. 3f

[10] foulkes / barron, S. 194

[11] künzel 1987, S.

[12] foulkes 2000, S. 182

[13] künzel 1987, S.

[14] Vgl.: foulkes 2000, S. 181

[15] Vgl.: byrne 2002

[16] hollien 1990, S.

Ende der Leseprobe aus 38 Seiten

Details

Titel
Einfluss des Übertragungskanals auf die Sprechererkennung bei genetisch verwandten Sprechern
Hochschule
Philipps-Universität Marburg  (Phonetik)
Note
1,0
Autor
Jahr
2005
Seiten
38
Katalognummer
V210464
ISBN (eBook)
9783656386018
ISBN (Buch)
9783656386773
Dateigröße
975 KB
Sprache
Deutsch
Schlagworte
einfluss, übertragungskanals, sprechererkennung, sprechern
Arbeit zitieren
Kerstin Schramm (Autor), 2005, Einfluss des Übertragungskanals auf die Sprechererkennung bei genetisch verwandten Sprechern, München, GRIN Verlag, https://www.grin.com/document/210464

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Einfluss des Übertragungskanals auf die Sprechererkennung bei genetisch verwandten Sprechern


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden