Captions im Fremdsprachenunterricht


Examensarbeit, 2014

52 Seiten, Note: 2,0


Leseprobe


Inhalt

Zusammenfassung

1. Einführung

2. Cognitive Load Theory
2.1. Optimale Nutzung des Arbeitsgedächtnisses
2.2. Split-Attention Effect und Redundancy Effect
2.3. Cognitive Load Theory und Captions

3. Das Arbeitsgedächtnis nach Baddeley
3.1. Das Dreikomponentenmodell
3.1.1. Die phonologische Schleife und Sprachenlernen
3.1.2. Artikulatorische Unterdrückung
3.2. Verarbeitung von geschriebenem Text

4. Dual Coding Theory nach Paivio

5. Zusammenfassung der Theorien und Schlussfolgerung

6. Kognitive Theorie des multimedialen Lernens
6.1. Dual-Channel Assumption
6.2. Captions unter dem Aspekt der Kognitiven Theorie des multimedialen Lernens

7. Fremdsprachenlernen mit Multimedia

8. Studien zum Einsatz von Captions
8.1. Stellung der Captions in der Studie von Winke, Gass, & Sydorenko

9. Schlussfolgerungen und Fragestellungen

10. Methode
10.1. Überblick
10.2. Versuchspersonen
10.3. Material und Durchführung

11. Ergebnisse

12. Diskussion
12.1. Wertung der Ergebnisse
12.2. Lehrerumfrage zum Thema Captions
12.3. Implikationen und Aussichten

Literaturverzeichnis

Zusammenfassung

Multimedialer Unterricht hat sich in den letzten Jahrzehnten in den Schulen stets weiterentwickelt. Besonders für den Fremdsprachenunterricht eignen sich authentische Videos, um den Schülern genuine Sprache nahezubringen. Für einen leichteren und verständlicheren Zugang zu diesem Material eignen sich Untertitel in der jeweiligen Zielsprache, die nicht nur den Inhalt, sondern auch Sprache an sich verständlicher werden lassen. Die vorliegende Studie befasst sich im Kontext multimedialen Unterrichts in der Schule mit folgenden Fragestellungen:

(1) Hat die Reihenfolge im Einsatz von Captions bei einer zweimaligen Präsentation eines Videos Einfluss auf das Hörverständnis?
(2) Konstituiert ein besseres Vokabelverständnis mit Unterstützung durch Captions ein größeres Hörverständnis?
(3) Lassen sich die aus (1) resultierenden angenommenen Vorteile auch auf ein dekontextualisiertes Hörverstehen übertragen, wenn dort die Captions ganz wegfallen?

Theorien zur Kognition von Sweller, Baddely und Paivio sowie das darauf aufbauende Model Mayers zu seiner Kognitiven Theorie des multimedialen Lernens bilden die Basis für die Fragestellungen dieser Studie. Sie beschäftigen sich mit simultanen Verarbeitungsprozessen verschieden kodierter Informa-tionen, wie zum Beispiel gesprochene Sprache, Bilder und geschriebene Sprache und geben zum Teil Empfehlungen für die Gestaltung von (multimedialem) Lehrmaterial.

Studien, die sich mit den Einsatzmöglichkeiten von Captions beschäftigt haben, überprüfen die Anwendbarkeit in der Praxis. Es wird angeknüpft an der Forschungsarbeit von Winke, Gass & Sydorenko (2010), die besonders den Aspekt beleuchtet, der in der ersten Fragestellung dieser Arbeit fokussiert wird.

Insgesamt 80 Schülerinnen und Schüler zweier beruflichen Schulen nahmen an der vorliegenden Studie Teil und wurden klassenweise zwei Gruppen zuge-ordnet. Eine der eigentlichen Studie vorangegangene Vokabellerneinheit diente zum einen der Leistungsüberprüfung und zugleich einer Leistungsangleichung zwischen und innerhalb der beiden Gruppen. Allen wurde zweimal eine Videosequenz gezeigt, Gruppe 1 zuerst ohne Captions und dann mit, Gruppe 2 erst mit und dann ohne Captions. Anschließend wurde beiden Gruppen ein Audiotext mit ähnlichem Wortschatz wie im Video vorgespielt, jedoch mit verändertem Thema. Sowohl nach dem Video als auch nach dem Hörtext wurde das Hörverstehen mittels Multiple-Choice-Fragen getestet. Es konnte nicht festgestellt werden, dass die Art der Instruktion einen Einfluss auf das Leistungsergebnis hat. Jedoch wurde ein signifikanter Zusammenhang zwischen Vokabelwissen und Hörverstehen registriert, wenn auch nicht in Verbindung mit Captions als Hilfsmittel. Ein Transfer des Hörverständnisses vom Video mit Captions auf eine Höreinheit ohne Captions konnte ebenfalls nicht verzeichnet werden.

Im Zusammenhang mit multimedialen Instruktionen, die für den Schulalltag konzipiert werden, lassen sich keine praktischen Implikationen aus den Stu-dienergebnissen ableiten. Dennoch ist auf Basis angeführter Theorien, Studien und einer (nichtrepräsentativen) Lehrerumfrage der Gebrauch von Captions als Hilfsmittel bei einer einmaligen Präsentation angeraten. Weiterführende Forschungen zum Einsatz von Captions in verschiedenen Kompetenzlevels sind nötig, um Aussagen über sinnvoll gestaltetes multimediales Lehrmaterial für alle Schulzweige machen zu können.

1. Einführung

Multimedialer Unterricht ist in den letzten Jahren zu einem immer wichtigeren Thema in den Schulen geworden. Durch den Einsatz von Medien bieten sich vielfache Möglichkeiten der Unterrichtsgestaltung und der Lehr- und Lernmethoden an. Oft genutzte Arbeitsmittel sind dabei authentische Videos und Videosequenzen (Garza, 1991, S. 241), d. h. Videos, die nicht für einen Lernkontext geschaffen wurden und daher authentische Zielsprache vermitteln. Sie fordern die Schüler[1] beim Hörverstehen und vermitteln dabei gleichzeitig auch inhaltlich-fachliche Kompetenzen. Kanäle wie YouTube, myvideo und Google Video bieten den Lehrkräften eine breite Auswahl sowohl authentischer als auch Lern-Videos in verschiedenen Sprachkompetenzstufen zu unterschiedlichen Themen. Besonders bei authentischen Filmsequenzen sind Schüler im Hörverstehen derart gefordert und mit dem schnellen Sprechtakt eines Muttersprachlers auch oft über fordert, dass Hilfestellungen zu einem verbesserten Hörverständnis notwendig sein können.

Es gibt Studien, die einen Vorteil für das Hör-, Lese- und Sprachverstehen, das Vokabellernen und das Auffassungsvermögen belegen, wenn eine Hör- oder Videoeinheit mit Captions [2] versehen ist, wie z. B. die von Borras & Lafayette (1994), Garza (1991) und Markham (1999). Es gibt aber auch Studien mit kon- trären Ergebnissen, wie z. B. Mayer, Heider, & Lonn (2001), Craig, Gholson, & Driscoll (2002) und Kalyuga, Chandler, & Sweller (2004). Diese Studien erklären ihre Ergebnisse anhand der Cognitive Load Theory von Sweller (1991), die besagt, dass durch eine Erhöhung der extrinsischen kognitiven Belastung, beispielsweise durch simultanen Einsatz von Bild und Text, der Lerneffekt negativ beeinflusst wird.

Eine Übersicht der Theorien zu kognitiven Prozessen, die die Forschung im Hinblick auf den Einsatz von Captions im Fremdsprachenlernen am meisten beeinflusst haben, wird deduktiv zu Schlussfolgerungen im Hinblick auf die Fragestellung führen, auf welche Art und Weise Captions im Fremdsprachenunterricht eingesetzt werden sollten.

Ein anschließender Überblick über die aktuelle Forschungslage zum generellen Einsatz von Captions im Fremdsprachenunterricht stellt die Ergebnisse verschiedener Studien dar. Die Studie von Winke, Gass, & Sydorenko (2010) ist derzeit die einzige Untersuchung, die sich bereits mit der Frage beschäftigt hat, ob der wechselnde Einsatz von Captions bei mehrmaligem Vorspielen einer Videosequenz einen Effekt auf den Lernerfolg hat, und ob die Reihenfolge (zuerst mit Captions versus zuerst ohne Captions) dabei eine Rolle spielt. Sie wird im Anschluss an die verschiedenen Theorien näher vorgestellt.

Meine Studie über den Einsatz von Captions im Schulkontext greift einige Aspekte dieser Studie auf, wie z. B. den Effekt der Reihenfolge von Captions, und untersucht weiterhin Fragestellungen, die sich u. a. aus den Ergebnissen von Winke et al. (2010) ergeben haben. Zudem überprüft sie Hypothesen, die sich aus den im Folgenden dargestellten Theorien über das Arbeitsgedächtnis und kognitive Prozesse ableiten lassen.

2. Cognitive Load Theory

Um die Wirkung von Lerninstruktionen und -inhalten auf das generelle Lernvermögen zu verdeutlichen und zu erklären, unterscheidet John Sweller in seiner Theorie über die kognitive Belastung im Arbeitsgedächtnis drei funktionale Kategorien (Sweller, 2011, S. 57): die inhaltliche kognitive Belastung (intrinsic cognitive load), die strukturelle kognitive Belastung (extraneous cognitive load) und die Ressourcen, die zur Verarbeitung von Struktur und Inhalt genutzt werden (germane resources und extraneous resources)[3]. Vereinfachend gesagt: Das Arbeitsgedächtnis setzt sich im Lernprozess auseinander mit dem Inhalt (was wird präsentiert / muss gelernt werden), mit der Struktur (wie wird das zu Lernende präsentiert / muss gelernt werden) und verknüpft beides mit bereits vorhandenem Wissen. Wird vom cognitive load gesprochen, so ist damit die Gesamtheit der inhaltlichen und strukturellen kognitiven Belastung sowie der Prozess der Verknüpfung mit bereits verfügbarem Wissen und vorhandenen Lernstrategien gemeint, die im Lernprozess stets simultan zueinander und im selben Pool des Arbeitsgedächtnisses verlaufen.

2.1. Optimale Nutzung des Arbeitsgedächtnisses

Um diesen Pool optimal nutzen zu können, sollte die Belastung des Arbeitsgedächtnisses weitestgehend auf diejenigen Ressourcen beschränkt werden, die zur Schematisierung und Inkorporierung von Wissensinhalten zuständig sind, die germane resources. Die Beanspruchung der extraneous resources – Sweller nach für den Lernerfolg irrelevant – sollte demnach möglichst gering gehalten werden. Ist die strukturelle kognitive Belastung zu hoch, fehlen dem Arbeitsgedächtnis Kapazitäten, um seine Ressourcen für den Lerninhalt zu nutzen, was eine erhebliche Minderung des Lernprozesses und -erfolgs bedeutet (siehe Abb. 1). Ein optimaler Lernerfolg ist laut Sweller also nur möglich, wenn u. a. die strukturelle kognitive Belastung möglichst gering gehalten wird, also die Art und Weise der Präsentation des zu lernenden Inhaltes und die Arbeitsinstruktionen übersichtlich und einfach gestaltet sind.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1: Auswirkungen der strukturellen kognitiven Belastung auf die Verarbeitung von Wissensinhalten

Auch die Geringhaltung der inhaltlichen kognitiven Belastung zugunsten der optimalen Beanspruchung der relevanten Ressourcen zur Verarbeitung von Wissensinhalten ist von entscheidender Bedeutung, soll ein Lernstoff mit Erfolg vermittelt werden:

Sweller geht von einer Interaktivität einzelner Lernelemente aus, die vor allem die inhaltliche kognitive Belastung beeinflusst. Als interagierende Elemente bezeichnet er Einheiten, die aufgrund ihres logischen Bezugs zueinander simultan gelernt werden müssen. Eine niedrige Interaktivität liegt z. B. beim Lernen von Vokabeln vor: Jede Vokabel kann unabhängig von den anderen gelernt werden, da sie in keinem logischen Bezug zu den anderen steht. Es ist daher auch möglich, eine Hälfte der Vokabeln nicht zu lernen, ohne einen Verlust beim Lernerfolg der bereits gelernten Vokabeln riskieren zu müssen. Eine hohe Interaktivität, wenn man im Bereich des Spracherwerbs bleibt, liegt z. B. beim Erlernen der Syntax einer jeweiligen Sprache vor: Es müssen nicht nur die Regeln des Satzbaus gelernt werden, sondern auch die Art und Weise, wie Verben konjugiert und Substantive dekliniert werden müssen, wie die Wortstellung bei der Veränderung von Satzarten neu gestaltet werden muss und so weiter. Die grammatisch regelgerechte Produktion von Sätzen kann nach Sweller also nur durch das Erlernen stark interagierender Elemente erfolgen.

Je höher die Interaktivität der zu erlernenden Elemente, desto größer die inhaltliche kognitive Belastung. Wird die Kapazität des Arbeitsgedächtnisses mit der intrinsic cognitive load überansprucht, so falliert das System und ein Lernerfolg lässt sich nicht mehr verzeichnen, da keine ausreichenden Kapazitäten vorhanden sind, um die einzelnen Elemente, den Wissensinhalt, mittels der germane resources zu schematisieren und in den vorhandenen Wissensbestand einzugliedern und mit ihm zu verknüpfen.

Nach Sweller lässt sich zusammenfassend sagen, dass eine optimale Verarbeitung von Wissensinhalten und deren Integration in bestehende Wissensschemata am besten erreicht werden kann, wenn das didaktische Design einfach und leicht verständlich gehalten wird und der Lernstoff eine geringe Komplexität aufweist.

2.2. Split-Attention Effect und Redundancy Effect

Swellers Theorie nach muss jede Informationsquelle in einem didaktischen Design relevant für den allgemeinen Lernerfolg sein. Jede Information eines solchen Designs, die für sich genommen nicht erklärbar oder lernbar ist, d. h. keinen direkten Bezug zu den anderen vorhandenen Informationsquellen hat, verursacht nach Sweller eine unzweckmäßig erhöhte kognitive Belastung des Arbeitsgedächtnisses und vermindert dadurch den Lernerfolg, wenn sie zeitlich und/oder räumlich getrennt präsentiert werden (split attention). Die Informa- tionseinheiten müssen länger im Arbeitsgedächtnis präsent gehalten werden, damit sie nach Überbrückung der zeitlichen und/oder räumlichen Trennung im Arbeitsgedächtnis zu einem mentalen Konzept zusammengebracht werden können, und anschließend dann die gesamte Information gelernt werden kann.

Eine Dopplung der Information in verschiedenen Präsentationsarten, wie z. B. geschriebener Text, der simultan zu einem Video mit gesprochenem Text erscheint, erhöht laut Sweller ebenso die strukturelle kognitive Belastung. Sie ist redundant. Jegliche Form der Information, die den Gehalt einer anderen Informationsquelle wiederholt, muss unnötigerweise aufgenommen und verarbeitet werden und ist daher zu eliminieren (Sweller, 2011, S. 142).

Der Split-Attention Effect ergibt sich also, wenn zwei oder mehr Informationsquellen herangezogen werden müssen, um den jeweiligen Informationsgehalt verstehen zu können. Dies ist z. B. oft bei Videos oder animierten Präsentationen der Fall, wenn geschriebener Text die gezeigten Bilder erklärt oder ergänzt.

Der Redundancy Effect tritt ein, wenn zwei oder mehr Informationsquellen eben nicht zusammen verarbeitet werden müssen, um den Informationsgehalt verstehen zu können, sondern der eine Bezugsort den anderen lediglich inhaltlich in einer anderen Form oder durch ein anderes Medium wiederholt. Auch dies ist bei Multimedia-Präsentationen besonders im Fremdsprachenunterricht der Fall, wenn gesprochener Text simultan mit geschriebenem Text, wie z. B. Captions, präsentiert wird.

2.3. Cognitive Load Theory und Captions

Im Hinblick auf die Fragestellung, in welcher Hinsicht Captions im Fremdsprachenunterricht hilfreich sein können, und auf welche Art und Weise sie eingesetzt werden sollten, ließe sich mit dem hier dargestellten theoretischen Hintergrund sagen: Gar nicht. Sweller sagt eindeutig, dass Informationsquellen mit dem gleichen Inhalt auch bei Präsentationen mittels verschiedener Medien überflüssig sind, somit das Arbeitsgedächtnis sogar übermäßig strapazieren und damit gleichzeitig einen Lernerfolg mindern. Um dieses Ergebnis zu verifizieren, führt er Studien an, die zu den gleichen Resultaten kommen (Mayer, Heider, & Lonn, 2001; Craig, Gholson, & Driscoll, 2002 und Kalyuga, Chandler, & Sweller, 2004).

Er geht aber auch auf Studien ein, die zu einem entgegengesetzten Ergebnis kommen, nämlich, dass simultan präsentierter geschriebener und gesprochener Text sehr wohl zu einem größeren Lernerfolg führt (Borras & Lafayette, 1994; Garza, 1991 und Markham, 1999). Die Resultate dieser drei Studien (und wei-terer) werden in Kapitel 8 für einen Überblick über die aktuelle Forschungslage zu Captions im Fremdsprachenbereich zusammengefasst dargestellt.

Nach Swellers Ansicht seien diese Studien jedoch unzureichend konzipiert. Die Studienteilnehmer hätten sich in der dualen Lernversion, in der geschriebener und gesprochener Text simultan präsentiert wird, auf jeweils dasjenige Medium konzentrieren können, von dem sie sich den größten Lernerfolg erwarteten und somit lediglich ein Medium jeweils ausgeblendet. Daher erklärt er die Ergebnisse für ungültig. Inwieweit das nun jedoch stichhaltig für seine Argumenta-tionskette ist, macht er nicht klar, zielt seine Theorie doch letztendlich auf das Erreichen des größtmöglichen Lernerfolgs durch Vermeidung kognitiver Überlastung ab. In diesen Studien konnten Lernerfolge durch das duale System vergrößert werden. Es ist daher anzunehmen, dass es nicht zu einer Überlastung des Arbeitsgedächtnisses gekommen war, wie es Sweller postuliert hatte. Das bedeutet jedoch nicht, dass der Aufbau dieser Studien nicht stimmt, sondern wohl eher, dass seine Theorie nicht verallgemeinerbar auf alle Lerninhalte anwendbar zu sein scheint (vgl. Kapitel 7, S. 26).

In der Tat hatte Sweller für seine Argumentation unglücklicherweise eine einschlägige Auswahl an Studien getroffen, die seine Theorie bestätigen sollten: Während Erhebungen, die seine Annahmen stützen, anhand Tests in der Erstsprache, meist also Muttersprache (L1), zu prozeduralen Vorgängen gemacht wurden, fokussierten die Auswertungen, die seinen Thesen widersprechen, eine Fremdsprache (L2) als Lerninhalt mit L2 als Mittel der Instruktion.

In den seiner Aussage nach falsch konzipierten Studien sei das Verstehen im Fokus gewesen und nicht das Lernen. An dieser Stelle wäre eine Definition der beiden Begriffe hilfreich gewesen, zumal er das „Verstehen“ weniger wichtig als das „Lernen“ erachtet und ein gesteigerter Erfolg im Verständnis nicht gleichbedeutend mit einem erhöhten Lernerfolg sei (Sweller, 2011, S. 147)[4]. Zudem sei ein Lern- als auch ein Verstehenszuwachs nur in einem neuen Kontext erfassbar, d. h. das Material, mit dem gelernt wurde, muss für eine anschließende Prüfung durch neues ersetzt werden, um einen tatsächlichen Lernprozess überhaupt überprüfen zu können. Diese Argumente, so Sweller, würden seiner Theorie entsprechend belegen, dass die Ergebnisse der Studien von o. g. Kollegen keine tatsächlichen Aussagen über den Lerneffekt bei einem Einsatz von Captions machen können.

Sweller vergleicht dabei jedoch völlig unterschiedliche Rahmenbedingungen. Ein Beispiel aus dem (Schul-) Alltag zur Verdeutlichung: Nur weil Bilder wohl wenig bis keinen Erfolg erzielen, wenn jemand lernen (oder verstehen) soll, wie ein Satz aus einzelnen Satzelementen konstruiert wird, so können diese doch durchaus hilfreich sein, wenn es darum geht, ein IKEA-Regal aus seinen verschiedenen Einzelteilen aufzubauen. Es lässt sich daher keine pauschalisierte Aussage machen, die besagt, dass Bilder ungeeignet zum Lernen seien und nichts zum Kompetenzerwerb beitragen könnten. Aber genau das macht Sweller: Die von ihm sämtlich als ungeeignet erachteten Studien befassen sich alle mit Aspekten des Fremdsprachenlernens; die Studien, die Sweller zur Unterstützung seiner Theorien heranzieht, beinhalten alle Instruktionen in der Erstsprache (L1) zum Erlangen von Fachkompetenzen im praktischen oder theoretischen Bereich.

Lernen in einer Fremdsprache ist nicht gleichzusetzen mit Wissenserwerb in der Muttersprache, die man von Grund auf beherrscht. Es ist offensichtlich, dass eine Instruktion in einer Fremdsprache anders aufgebaut sein muss und weiterer Hilfestelllungen bedarf als Instruktionen in L1, wie z. B. das Einführen oder Erläutern von unbekannten Vokabeln. Sweller weist in seinen Ausführungen über den Redundancy Effect ausdrücklich darauf hin, dass dieser nur eintritt, wenn zwei oder mehr Informationsquellen, z. B. also gesprochener und geschriebener Text, für sich genommen verständlich sind. Im Kontext des Fremdsprachenlernens darf aber davon ausgegangen werden, dass der in L2 gesprochene Text bei den Schülern Verständnisprobleme hervorrufen kann und somit nicht mehr für sich allein zu erschließen ist. In diesem Fall greift das Prinzip der Redundanz nicht mehr, geht man von dem Lernziel des erfolgreichen Hör verstehens aus.

Es wird also deutlich, dass die Fragestellung, ob Captions im Lernkontext hilfreich oder hinderlich sind, differenziert betrachtet werden muss und nicht pauschal mit ja oder nein beantwortet werden kann. Die Studien von Borras & Lafayette (1994), Garza (1991) und Markham (1999) lassen darauf schließen, dass Captions im Bereich des Fremdsprachenlernens durchaus ihre Berechtigung haben. Dies begründet sich schon allein darin, dass die Instruktionen im Fremdsprachenunterricht bereits selbst oft Teil des Wissensinhaltes sind, da der Fokus des Lernens auf der Sprache liegt und Sprache zudem das Medium der Instruktion ist – gleich ob geschrieben oder gesprochen. Captions können dabei genauso als Hilfe dienen, Sprache an sich verständlich zu machen – und damit den Wissensinhalt, der mit der Sprache transportiert wird –, wie es Bilder vermögen, prozedurale Vorgänge zu verdeutlichen.

3. Das Arbeitsgedächtnis nach Baddeley

3.1. Das Dreikomponentenmodell

Ein weiteres Arbeitsgedächtnismodell ist das von Baddeley 1974 entwickelte Dreikomponentenmodell. Ähnlich wie bei Swellers Einteilung in funktionale Kategorien setzt sich hier das Arbeitsgedächtnis aus drei Komponenten (später vier, mehr dazu in Kapitel 3.2.) mit jeweils eigenen Aufgaben, eigenen Kodierungen der Informationseinheiten und ebenfalls limitierter Kapazität zusammen. Seiner Theorie nach besteht das menschliche Arbeitsgedächtnis aus einer zen- tralen Exekutive (ZE), einer phonologischen Schleife (PS) und einem visuell-räumlichen Notizblock (VRN) (Baddeley, 1999).

Die zentrale Exekutive ist ein den anderen Komponenten übergeordnetes System, das zum einen den Informationsfluss von und zu einzelnen Gedächtnissystemen lenkt sowie auf Informationen aus dem Langzeitgedächtnis zugreifen kann, um diese mit neuen Informationen zu verknüpfen und ins Wissensschema zu integrieren. Die Aufnahmekapazität der ZE ist begrenzt und wird durch das Delegieren von Informationsverarbeitungsprozessen an seine Subsysteme reguliert.

Die phonologische Schleife, eines der Subsysteme der ZE, behält und verarbeitet verbal kodierte Informationen. Die Verarbeitung findet im phonologischen Speicher statt, eine Einheit mit solch begrenzter Kapazität, dass die Informa-tionssegmente im artikulatorischen Rehearsal immer wieder aufgefrischt werden müssen, um sie für die Verarbeitung im Speicher aufrechtzuerhalten. An dieser Stelle findet auch ein wichtiger Aspekt des Spracherwerbs statt, da auf die gleiche Weise Repräsentationen von neuen Wörtern während des Lernprozesses aufrechterhalten werden müssen, bis sie in der PS ausreichend verarbeitet wurden. Baddeley geht davon aus, dass auch geschriebene Sprache in der PS verarbeitet und gespeichert wird. Damit dies erfolgen kann, muss die verschriftete Information jedoch vorher erst umkodiert werden, während Lautsprache sofort in der phonologischen Schleife aufgenommen werden kann.

Ein weiteres Subsystem der ZE ist der visuell-räumliche Notizblock, der visuelle und räumliche Informationen behält und verarbeitet. Auch die Kapazität dieser Einheit ist limitiert. Da dieser Einheit für den Spracherwerb von ihm keine größere Rolle zugesprochen wird, wird auf die Erklärung ihrer Funktion verzichtet.

3.1.1. Die phonologische Schleife und Sprachenlernen

Wie bereits erwähnt, findet ein wichtiger Teil des Erlernens von Sprache in der Phonologischen Schleife statt. Tatsächlich hat Baddeley durch verschiedene Studien belegen können, dass dem phonologischen Kurzzeitgedächtnis eine zentrale Funktion im Fremdsprachenlernen zukommt (Baddeley, 1999, S. 55ff.). Ähnlich wie in der Cognitive Load Theory nimmt Baddeley an, dass der Lernprozess gemindert wird, wenn das phonologische Subsystem durch zu viel Information überlastet oder durch irrelevante Einflüsse gestört wird. Er führt dabei besonders die artikulatorische Unterdrückung (articulatory suppression), phonologische Ähnlichkeiten und begleitendes Reden von außen (unattended speech) an (Gathercole, Baddeley, 1993, S.205 und Baddeley, 1999, S. 50), wobei im Kontext meiner Studie nur die artikulatorische Unterdrückung von Relevanz ist und daher als einzige Komponente näher erläutert wird.

3.1.2. Artikulatorische Unterdrückung

Baddeley hat durch Studien herausgefunden, dass eine simultane Doppelbelegung der phonologischen Schleife mit zwei verschiedenen Prozessen zu einer verminderten Aufnahmefähigkeit und weniger erfolgreichen Verarbeitung von neuen Informationen führt. Um diese Annahme zu überprüfen, evozierte er eine künstliche Doppelbelegung durch die artikulatorische Unterdrückung, ein Prozess, in dem etwas verbalisiert wird, während gleichzeitig etwas anderes rezipiert wird. So zeigte sich in einer seiner Studien, dass das Zählen von Buchstaben eines Satzes langsamer und mit einer höheren Fehlerquote von den Stu- dienteilnehmern durchgeführt wurde, wenn sie dabei irrelevante Äußerungen von sich geben mussten (z. B. „das, das, das,…“, siehe Baddeley, 1999, S. 52.). Durch diese wiederholte Artikulation irrelevanten Materials ist der Prozess des artikulatorischen Rehearsal gestört, der die neuen Informationen zur Verarbeitung in der phonologischen Schleife präsent hält. In diesem Verfahren wird die geschriebene Sprache durch mentales Aussprechen in gesprochene Sprache umkodiert, ein notwendiger Prozess, um die Informationen im auditiven System bearbeiten zu können. Ist aber diese kognitive Fähigkeit bereits durch das Aussprechen irrelevanter Äußerungen belegt, folgt daraus eine Störung in der Verarbeitung der relevanten Informationen.

3.2. Verarbeitung von geschriebenem Text

Was passiert also in der phonologischen Schleife, wenn der Lernende mit gesprochenem und geschriebenem Text gleichzeitig konfrontiert wird?

Auf den ersten Blick ist diese Lernbedingung vergleichbar mit der artikulatorischen Unterdrückung: Während verbale Sprache bereits in der phonologischen Schleife verarbeitet werden könnte, was eine Belegung des Rehearsal Prozesses bedeutet, muss der geschriebene Text durch genau diesen Prozess in lautliche Sprache umkodiert werden, um ebenfalls im auditiven System gespeichert werden zu können. Es konkurrieren also zwei verschiedene Prozesse miteinander und überlasten so das phonologische System. Das Arbeitsgedächtnis ist folglich nicht in der Lage, beide simultan präsentierten Informationen ausreichend zu verarbeiten, was einen Lernerfolg mindert.

Integration von Informationen. Die Theorie des episodischen Puffers legt nahe, dass das Arbeitsgedächtnis durchaus in der Lage sein könnte, gesprochenen Text und geschriebenen Text zu einem mentalen Konzept bzw. einer mentalen Realisierung von Wörtern und Sätzen zusammenzufügen, da es die Fähigkeit be- Weiterführende Studien deckten jedoch Lücken in diesem Modell auf, die von Baddeley im Jahr 2000 durch den episodischen Puffer ausgefüllt wurden (Baddeley, 2000). Es entstand das Mehrkomponentenmodell (siehe Abb. 3). Diese neue Komponente ist ebenfalls ein Subsystem der ZE mit begrenzter Kapazität und dient dazu, Informationen aus dem Langzeitgedächtnis und den beiden anderen Subsystemen miteinander zu einem ganzheitlichen Schema zu verknüpfen. Der episodische Puffer ist also in der Lage, unterschiedlich kodierte Informationen zu speichern, zusammenzufügen und zu repräsentieren. Das neue Modell Baddeleys fokussiert nun nicht mehr die Isolation von verschiedenen Informationen, wie es im Dreikomponentenmodell der Fall war, sondern die

Abbildung in dieser Leseprobe nicht enthalten

Abb. 3: Das Mehrkomponentenmodell des Arbeitsgedächtnisses nach Baddeley

sitzt, verschiedene Kodes miteinander zu verbinden. Bedenkt man jedoch den Standpunkt Baddeleys, dass auch visuell wahrgenommener Text generell (nach entsprechender Umkodierung) in der phonologischen Schleife verarbeitet wird, so reicht der episodische Puffer nicht aus, um die Doppelbelastung der PS auszugleichen.

Baddeley hat sich intensiv mit dem auditiven System im Zusammenhang mit dem Erlernen von Sprache befasst (Gathercole & Baddeley, 1993), jedoch konzentrierte er sich hierbei auf den Spracherwerb einer Muttersprache von Geburt an und studierte nur marginal die Funktion des Arbeitsgedächtnisses beim Fremdsprachenlernen. In einer Studie von 1991 (Papagno, Valentine, & Baddeley) fand er jedoch heraus, dass beim Erlernen von fremdsprachlichen Wörtern im Falle einer visuellen Realisation von Sprache, also von geschriebenem Text, die phonologische Schleife umgangen werden kann, wenn die Informationen semantisch kodiert werden. Wie und wann genau dieser Vorgang eintritt, konnte in dieser Studie leider nicht erfasst werden. Eine Studie, die darauf aufbaut, ist mir nicht bekannt. Das Ergebnis und die daraus resultierende Schlussfol-gerung, dass geschriebene Sprache nicht zwangsläufig von der phonologischen Schleife verarbeitet wird, lassen aber schon genug Spielraum, um eine Überlastung des auditiven Systems durch Captions in Frage stellen zu können.

4. Dual Coding Theory nach Paivio

Ähnlich wie Baddeley hat auch Paivio ein Arbeitsgedächtnismodell entwickelt, das für die Aufnahme und Verarbeitung von Informationen zwei verschiedene Kanäle besitzt. Er unterscheidet aber nicht auf einer sensorischen Basis, wie es Baddeley unternommen hat, nämlich auditiv und visuell, sondern auf symbolischer, d. h. in der Art der Präsentation, verbal oder nonverbal. Der Unterschied scheint im ersten Moment nicht ganz klar, ist doch das Verbale auditiv wahrnehmbar und das Nonverbale visuell. Paivio versteht aber unter verbal alles, was mit Sprache zu tun hat, also auch geschriebenen Text, der bei Baddeley durch den visuellen Kanal aufgenommen wird und nicht durch den auditiven (Paivio, 1986, S. 53f.). Zudem rechnet er zu den nonverbalen Informationen auch auditive Einheiten, wie z. B. Blätterrauschen, sowie haptische und olfaktorische Eindrücke, die Baddeley in seinem Modell außen vor gelassen hat.

Diese Informationen werden genauso wie die auditiven und visuellen Einheiten durch das sensomotorische System aufgenommen und entsprechend ihrer Kodierung an die beiden symbolischen Subsysteme weitergeleitet und dort verarbeitet (siehe Abb. 4). Die Subsysteme arbeiten unabhängig voneinander, können aber interaktiv auf das jeweils andere System einwirken und sogar eine Information auf das andere System übertragen und so eine Einheit aus integrierter verbaler und nonverbaler Information bilden (Bsp. Hund: Beide Sub-systeme liefern ihre entsprechende Kodierung an das andere System und bilden somit ein mentales Schema von Hund mit der dazugehörigen visuellen und sprachlichen Verwirklichung).

Paivio nennt diese Art der Verbindung referentielle Verknüpfung. Es werden aber auch innerhalb eines Systems – sowohl des verbalen als auch des non-verbalen – mentale Konzepte erstellt, die durch die Verbindung einzelner Elemente entstehen. Diese assoziativen Verknüpfungen ordnen bildliche oder lautliche Einheiten semantisch. So wird z. B. im verbalen System das Wort Metall mit anderen Wörtern wie Gold, Silber und Eisen verknüpft und im non-verbalen System wird z. B. das Bild eines Bunsenbrenners mit dem Geruch von Gas und dem Geräusch des Gasaustritts und der Verbrennung verbunden. Ebenso ist eine mentale Verknüpfung zu anderen Darstellungen von technischen Geräten im Kontext eines Chemielabors möglich (Paivio, 1986, S.156).

Abb. 4: Relationen zwischen Symbolischen Systemen und Sensomotorischem System mit Beispielen von modalspezifischen Informationen, die im jeweiligen Subsystem repräsentiert werden (Paivio, 1991, S.57).

Abbildung in dieser Leseprobe nicht enthalten

Basierend auf dieser Theorie müsste die Frage nach dem richtigen Einsatz von Captions beim Fremdsprachenlernen (denn dass sie in diesem Kontext durchaus Sinn machen können, wurde dargelegt) wie folgt beantwortet werden:

Werden Schüler mit einem bis dahin ihnen unbekannten auditiven Text konfrontiert, wird es lautliche Einheiten geben, die ihnen unbekannt sind und die sie dementsprechend nicht als verbale Elemente rezipieren können. Nach Paivios Theorie würden diese Elemente also durch den nonverbalen Kanal aufgenommen werden und gingen dort unter als ein Geräusch, dem keine Bedeutung zugemessen werden kann, und das dementsprechend keine mentalen assoziativen Verknüpfungen hervorrufen wird. Erst durch eine referentielle Verknüpfung mit dem verbalen System, das Dank der Captions eine verbale Entsprechung für die bis dato unverständlichen Laute bereithält, können die vormals non-verbalen Einheiten durch Übertragung auf das verbale System dort verarbeitet und erfolgreich ins mentale Konzept von Wörtern integriert werden. Garza gibt hierfür ein schönes Beispiel, auch wenn er sich dabei nicht auf Paivios Theorie beruft (Garza, 1986, S. 246):

Ein Schüler sieht in einem Video zwei Studenten, die sich miteinander unterhalten. Der eine sagt zum anderen: „Djeetjet?“, woraufhin der andere antwortet: „No, dju?“. Der Schüler ist unfähig, den Äußerungen Bedeutung beizumessen. Wenn aber Captions den auditiven Text ergänzen: „Did you eat yet?“, „No, did you?”, versteht der Schüler die gesprochenen Worte und stellt eine Verknüpfung zwischen den geschriebenen und den nun verständlichen gesprochenen Worten her. Bei einer erneuten Konfrontation mit demselben gesprochenen Text kann er, wie beim Lernen von Vokabeln, auf eine mentale sprachliche Repräsentation zurückgreifen und wird die Äußerungen auch ohne Captions verstehen.

Bei einer wiederholten Präsentation des Textes können im theoretisch angenommenen Idealfall die lautlichen Einheiten also ganz ohne Zuhilfenahme von Captions als Sprache wahrgenommen und rezipiert werden.

5. Zusammenfassung der Theorien und Schlussfolgerung

Es wurden drei Theorien vorgestellt, die jeweils verschiedene Aussagen über den Einsatz von Captions machen oder implizieren: Obwohl Sweller sich eindeutig gegen den Einsatz von Captions ausspricht, konnte gezeigt werden, dass seine Aussage im Kontext des Fremdsprachenlernens mit Berechtigung angezweifelt werden darf. Baddeley selbst befasst sich zwar nicht mit der Thematik der Untertitel im Zusammenhang mit Lernen, jedoch mit Fremdsprachenlernen an sich. Die Prozesse, die er in diesem Kontext schilderte, lassen die Annahme zu, dass Captions, wenn schon nicht aktiv hilfreich, so zumindest nicht hinderlich sein müssen, wenn es darum geht, simultan mit gesprochenem und geschriebenem Text konfrontiert zu werden.

Die Theorie Paivios verbalisiert ebenfalls keine Empfehlung bezüglich des Einsatzes von Untertiteln. Sein Modell von einem Arbeitsgedächtnis impliziert meiner Meinung jedoch eindeutig, dass Captions unter bestimmten Lernbedin- gungen nicht nur hilfreich, sondern durchaus notwendig sein können, wenn es um Fremdsprachenlernen geht. Darüber hinaus lässt sich sogar eine Schlussfolgerung über einen sinnvollen Einsatz von Untertiteln ableiten, nämlich dass die Anwendung von Captions bei der ersten Präsentation von auditivem Text einer zweiten ohne Captions vorausgehen sollte, will man einen maximalen Lernerfolg erzielen.

Jede Theorie für sich trifft also andere Aussagen oder enthält zumindest unterschiedliche Implikationen. Es gibt dennoch eine Theorie, die einzelne Elemente oben genannter Modelle in ein einheitliches Konstrukt integriert. Richard Mayers Kognitive Theorie des multimedialen Lernens (2001) bedient sich unter anderem der Redundanztheorie von Sweller, der Vorstellung einer begrenzten Kapazität des Arbeitsgedächtnisses von Sweller und Baddeley und der Theorie von zwei verschiedenen Rezeptionskanälen, wie bei Baddeley und Paivio. Mayers Theorie wird im folgenden Kapitel vorgestellt.

6. Kognitive Theorie des multimedialen Lernens

Wirft man den Begriff Multimedia in den virtuellen Raum von Google, so werden einem mehrere hundert Millionen Ergebnisse präsentiert, viele davon implizite Aufforderungen, sich die neueste digitale Technik wie Smartphones, internetfähige Fernseher oder Notebooks ins Haus zu holen, um sich der multimedialen Welt anzupassen.

Richard Mayer (2001) beschäftigte sich eingehend mit der Nutzung multimedialer Komponenten im Lernkontext. Seine Definition einer multimedialen lehrreichen Präsentation erscheint im ersten Blick aber weitaus weniger technisch: Es ist erst einmal lediglich eine Darbietung von Materialien, die in Form von Bild in Kombination mit gesprochenem oder geschriebenem Text erfolgt. Das kann also z. B. ein Lehrbucheintrag sein, bei dem der erklärende Text mit Illustrationen erweitert wird, eine Powerpointpräsentation, bei der Diagramme in einem verbalen Vortrag erläutert werden, oder ein Film, der mit Untertiteln unterlegt ist. Mayer nennt diese Art des Lernens auch dual-code learning oder dual-channel learning, da sowohl akustische als auch visuelle Informationen verarbeitet werden müssen.

6.1. Dual-Channel Assumption

Diese Theorie der dualen Kodierung lehnt zum einen an Baddeleys Arbeitsgedächtnismodell an, zum anderen aber auch an Paivios dualer Kodierungstheorie. Beide Theorien werden von Mayer in sein Modell integriert (siehe Abb. 5).

Bei solch einer Kombination der zwei Theorien besteht die Schwierigkeit, die Unterschiede zwischen den sensorischen Wahrnehmungen (etwas sehen oder hören) und den Arten der Darbietung (etwas verbal oder non-verbal vermitteln) miteinander zu vereinbaren. Mayer umgeht das Problem, indem er beide Möglichkeiten vereint, was im Falle von Text bedeutet, dass er sowohl auditiv aufgenommen wird (da er verbal ist), als auch visuell (da er als geschriebener Text gesehen werden kann). Mayer kreiert also einen auditiven / verbalen Kanal und einen visuellen / bildhaften Kanal. Diese Art der Einteilung scheint besonders im Hinblick auf die begrenzte Aufnahmefähigkeit des Arbeitsgedächtnisses nicht ganz unproblematisch, da einige Informationseinheiten, wie z. B. geschriebener Text oder Musik als nonverbales Hintergrundgeräusch, nach dieser Theorie die Kanäle im Arbeitsgedächtnis wechseln müssten, was durch die daraus resultierende (Um-)Kodierungsarbeit zusätzliche kognitive Ressourcen erfordert (siehe Abb. 6). Mayer löst dieses Problem hinreichend durch seine Anlehnung an Paivios (1986) cross-channel representations, indem er sagt, dass die aufgenommenen Informationen sowieso für eine (Weiter-)Verarbeitung im anderen Kanal umkodiert werden müssen, um am Ende der kognitiven Verarbeitung von Informationen einheitliche Realisationen von Bild und (Sprach-)Laut erhalten zu können. Paivio nannte diesen Prozess auch eine referentielle Verknüpfung. Er ist in Mayers Modell durch Pfeile zwischen den einzelnen Kanälen im Arbeitsgedächtnis markiert (Abb. 5).

Abb. 5: Darstellung des auditiven / verbalen Kanals und des visuellen / piktographischen Kanals in der Kognitiven Theorie des multimedialen Lernens. Die oberen Elemente ergeben den auditiven / verbalen Kanal, die unteren Elemente den visuellen / bildhaften Kanal (Mayer, 2001).

Abbildung in dieser Leseprobe nicht enthalten

Bevor jedoch die einzelnen Informationen im Arbeitsgedächtnis als mentales Konzept mit dem Langzeitgedächtnis verknüpft werden, findet eine Selektierung der relevanten Elemente statt (1). Dies ist aufgrund der geringen Speicherkapazität ein notwendiger Prozess. Die ausgewählten Einheiten werden dann im jeweiligen Kanal des Arbeitsspeichers zu einem Gesamtkonzept zusammengeführt und zu jeweils verbalen oder bildlichen Konzepten verbunden (2). Als Beispiel kann eine vorgegebene Route auf einer Landkarte dienen, die auswendig gelernt werden soll: Der Leser der Landkarte sieht eingezeichnete Pfeile, die in die jeweiligen Richtungen zeigen, in die er gehen muss. Der Rezipient blendet die für ihn irrelevante Informationen aus, wie z. B. umliegende Parks, Straßenverläufe abseits der Route etc., und selektiert die für ihn wichtigen Informationen (1). Er hat nun eine sequentielle Abfolge von richtungsweisenden Pfeilen, die er im nächsten Schritt organisiert und zu einer Route verbindet (2). Dieser Prozess findet im visuellen Kanal des Arbeitsgedächtnisses statt, während im auditiven / verbalen Kanal – der beim Lesen einer Landkarte nach Mayer / Paivio lediglich die Straßennamen als verbale Informationen verarbeiten könnte – durch Verknüpfung mit dem anderen Subsystem ein Pendant erstellt wird (z. B. „erst rechts, dann links…“ usw. oder auch eine Abfolge von Straßennamen). Als letzten Schritt integriert sich sein bildliches Modell von seiner Route mit dem verbalen Modell (3), und verbindet sich mit relevanten Informationen aus dem Langzeitgedächtnis (beispielsweise die Fähigkeit des Transfers von einem 2D- Routenplan zu einer 3D-Umgebung).

Mayer benennt damit drei kognitive Hauptprozesse, die für multimediales Lernen erforderlich sind: Das Selektieren, Organisieren und Integrieren von Bildern und Lauten.

6.2. Captions unter dem Aspekt der Kognitiven Theorie des multimedialen Lernens

Obwohl für den Unterricht der soziokognitive Ansatz, der den Fokus auf die Interaktion und Kommunikation legt (Plass & Jones, 2005, S. 468), immer mehr Einzug in die Bildungspläne der Schulen hält, wird das Leseverständnis im schulischen Lernkontext immer noch stärker gefördert als das Hörverständnis (Lund, 1991). Dies verdeutlicht auch ein Überblick über die bestehende Forschungsliteratur, die sich kaum mit dem Hörverständnis beschäftigt, zum Leseverständnis aber eine Vielzahl an Theorien und Studien anbietet.

Dass das Leseverständnis der im Lernkontext fokussierte Kompetenzbereich ist und somit bei Fremdsprachenlernern stärker ausgeprägt ist als das Hörverstehen, führt nach Lunds Einschätzung dazu, dass geschriebener Text für Schüler zugänglicher ist als gesprochener Text und daher besonders im Verbessern des Hörverstehens eine Hilfe sein kann:

„[…] reading helps learners recognize acoustically what they can already comprehend in print and instills satisfaction and confidence in listening.” (Lund, 1991, S. 202) Im selben Absatz weist er aber auch auf die Gefahr hin, dass Lernende sich auf ihr Leseverständnis verlassen und deshalb das Hören dabei vernachlässigen. Dem kann man entgegenwirken, indem eine direkt anschließende wiederholte Präsentation des Inhalts ohne Captions erfolgt. Dies vermeidet nicht nur die Vernachlässigung des Hörverstehens, sondern festigt es überdies durch einen Abgleich mit zuvor Gelesenem.

Mayer spricht sich in seiner Theorie jedoch gegen den Einsatz von Captions im allgemeinen Lernkontext aus (Mayer 2001, S. 48f.). Da er sich in seiner Argumentation auf das Redundanz-Prinzip und dem Modell vom limitierten Arbeitsgedächtnis von Sweller stützt, lassen sich hier indes die gleichen Gegenargumente bringen, wie in Kapitel 2.3.[5] Besonders im Hinblick auf die kognitiven Prozesse, die für ein erfolgreiches Lernen durchlaufen werden müssen, lässt sich einwenden, dass bereits das Selektieren und Organisieren von (gesprochenem) Text nicht möglich ist, wenn er vom Lernenden nicht verstanden wird. Eine vorangehende Präsentation des Materials mit Captions erscheint daher nur logisch und sinnvoll, um – ganz nach Garza – sich die gesprochene Sprache im ersten Schritt erschließen zu können, um dann im zweiten Schritt, d. h. bei einer wiederholten Präsentation, mit den kognitiven Prozessen der Selektion und Organisation des Inhalts beginnen zu können.

Interessant ist dagegen seine Methode, zwei unterschiedliche Theorien zum dualen Kodieren und Verarbeiten von Informationen in ein Modell zu integrieren. Captions als Kernpunkt dieser Studie bekommen durch diesen Kompromiss in seinem Modell eine Sonderstellung zugewiesen, was eine nähere Betrachtung wert ist.

Geschriebener Text wird im sensorischen Gedächtnis zwar nicht im selben Kanal aufgenommen wie gesprochener Text, die Verarbeitung im Arbeitsgedächtnis erfolgt dann aber dennoch im auditiven Kanal, der entsprechend für die Kodierung auditiver Elemente zuständig ist. Es erfolgt also ein Wechsel der Kodierung während des Verarbeitens der Informationen (siehe Abb. 6).

Abbildung in dieser Leseprobe nicht enthalten

Abb. 6: Aufnehmen und Verarbeiten von geschriebenem Text nach Mayer (2001, S. 59).

Der verbale Gehalt der visuellen Informationseinheit macht somit eine geradlinige Verarbeitung im visuellen / piktographischen oder auditiven / verbalen System des Arbeitsgedächtnisses nicht möglich. In einem multimedialen Lernkontext würde das eine Doppelbelastung des visuellen / nonverbalen Subsystems bedeuten: Die simultane Verarbeitung von Text und Bild bedeutet eine Überlastung des begrenzt aufnahmefähigen Kanals, in dem beide Informationen um die bestehenden Ressourcen „kämpfen“ müssten.

Mayer sagt jedoch auch, dass im Arbeitsgedächtnis in beiden Kanälen jeweilige Realisierungen eines mentalen Konzeptes oder eines Modells vorliegen (Mayer 2001, S.45). Hört man beispielsweise das Wort Katze, folgt das bildliche Konzept; sieht man eine Katze, wird mental eine lautliche Entsprechung abgerufen. Zudem sei es dem Arbeitsgedächtnis möglich, zwischen verbalen / auditiven und nonverbalen / piktographischen Konzepten im Arbeitsgedächtnis zu „switchen“ (Mayer 2001, S.48.)

Im Hinblick darauf und auf Paivios Theorie der assoziativen Verknüpfung (siehe Kap. 4) ließe sich daher argumentieren, dass eine solche assoziative Verknüpfung von Bild und schriftlich realisierter Sprache beim Fremdsprachenlernen innerhalb eines Subsystems eine referentielle Verknüpfung zur lautlich realisierten Sprache im anderen Kanal erleichtern kann. Der Lernende wäre bei einem Einsatz von Captions folglich daher eher nicht nur in der Lage, sprachliche und nichtsprachliche Informationseinheiten semantisch miteinander zu verbinden und zu einem mentalen Konzept zu organisieren, sondern auch bei einem sprachlich-bildlichen Input das lautliche Pendant abzurufen und als Konzept weiterzuverarbeiten. Diese Hypothese würde Baddeleys Theorie bestätigen und erklären, dass phonetische Laute durch semantische Kodierung das zu verarbeitende Subsystem ändern können (siehe Kap. 3.4).

Mayer geht davon aus, dass Text und Bild separat voneinander verarbeitet werden müssen und es dadurch zu einer Konkurrenzsituation im System und folglich zu einer angenommenen Überlastung kommt. Genauso wäre aber eine simultane Rezeption denkbar, mit Text und Bild als einer Einheit. Dies ließe sich auf der Basis von Mayers dargestelltem Selektierungsprozess wichtiger Informationseinheiten erklären: Der Lernende wählt nicht nur Informationseinheiten aus Bild oder Text, die er für wichtig erachtet, sondern nimmt Bild und Text als Realisierung einer semantischen Einheit wahr und verarbeitet es als zusammengehörendes Konzept weiter. Der von Sweller postulierte split-attention effect wird dabei umgangen, indem bei der Präsentation von geschriebenem Text und Bild darauf geachtet wird, dass beide Elemente räumlich integriert sind.

Im Hinblick auf das Fremdsprachenlernen würde das bedeuten, dass der Lernende nicht nur ein mentales Konzept von Bild und lautlicher Sprache aufzubauen vermag, sondern zudem die schriftliche Realisierung in sein Konzept zu integrieren weiß.

Mayers Kognitive Theorie des multimedialen Lernens (CTML) lässt eher Vermutungen zu, als dass sie konkrete Antworten auf die Fragestellung der vorliegenden Studie gibt. Das mag auch daran liegen, dass diese Theorie, ebenso wie die vorangegangenen, die vorgestellt wurden, das allgemeine Lernen als Hintergrund nimmt und nicht das Fremdsprachenlernen fokussiert, bei dem, wie bereits gezeigt werden konnte, andere Lernbedingungen vorherrschen: Dabei muss nicht nur der Lerninhalt einer multimedialen Darbietung verarbeitet werden, sondern auch ein Teil des Präsentations mediums, die Sprache, muss als eine zusätzliche Komponente erschlossen werden. Dafür müssen ganz offensichtlich andere Lehrmethoden eingesetzt werden.

Plass & Jones (2005) haben ein von der Forschung allgemein anerkanntes Modell entworfen, das die Erkenntnisse der Wissenschaft zum Fremdsprachenlernen mit denen zu kognitiven Prozessen beim Lernen mit Multimedia verbindet. Ihr Modell wird im Folgenden vorgestellt.

7. Fremdsprachenlernen mit Multimedia

Plass & Jones (2005) haben mit ihrer Theorie vom Fremdsprachenlernen mit Multimedia ein Konstrukt entworfen, dass verschiedene Modelle integriert, u. a. auch das von Mayers CTML. Sie verstehen Fremdsprachenlernen[6] als einen zum Teil interaktiven Prozess, beginnend mit einem verständlichen Input und resultierend in ein nachvollziehbares Leistungsergebnis.

Ihr Modell sieht für das Lernen von Fremdsprache vier kognitive Prozesse vor, durch die aufgenommene verbale Information in das linguistische System des Lernenden integriert wird: Die Apperzeption und das Selektieren neuer Informationen, das Verstehen und Organisieren dieser in verbale und piktographische Modelle, das Integrieren der beiden Modelle in bereits bestehendes Wissen und ein abschließendes Anwenden des neu Erlernten (siehe Abb. 7).

Die Prozesse werden im Folgenden näher betrachtet.Abbildung in dieser Leseprobe nicht enthaltenAbb. 7: Modell des Fremdsprachenlernens mit Multimedia von Plass & Jones (2005)

1. Selektieren und Apperzipieren

In Anlehnung an Mayers Modell der CTML (2001), muss der Lernende Wörter und Bilder aus dem präsentierten Material auswählen, die ihm relevant erscheinen. Der Prozess der Selektierung bedarf einer fokussierten und bewussten Aufmerksamkeit des Lernenden (Apperzeption). In diesem Zusammenhang weisen Plass & Jones explizit darauf hin, dass Captions das Verständnis von gesprochenem Text verbessern können, da sie die Aufmerksamkeit des Lernenden erhöhen und auf die Sprache als solche lenken (2005, S. 472).

2. Verstehen und Organisieren

Dieser Prozess ist angelehnt an Mayers Modell von 2001 und unterscheidet sich in Plass & Jones‘ Theorie lediglich dadurch, dass dieser kognitive Vorgang beim Fremdsprachenlernen nicht nur auf das Verstehen des semantischen Inhalts fokussiert ist, sondern die durch Verknüpfung verbaler respektive nonverbaler Elemente entstandenen mentalen Konstrukte jeweils auch linguistische, z. B. syntaktische, Informationen beinhaltet. Der wahrgenommene Inhaltsgehalt und die Art der Verarbeitung variieren je nach Kompetenzlevel des Lernenden: Während Lernanfänger sich beim Lesen eines fremdsprachlichen Textes auf Wortidentifikation, Wortlaut und Wortstruktur konzentrieren, um ein linguistisches Konzept von der zu erlernenden Sprache zu entwickeln, wenden fachsprachlich kompetentere Lernende interreferentielle Strategien an, mit denen sie Informationen in und über den Text in Bezug zu Wissensstrukturen im Langzeitgedächtnis bringen und integrieren können.

Bereits für diesen Prozess merken Plass und Jones an, dass sowohl für ein erfolgreicheres Vokabellernen als auch für ein besseres Textverständnis Erläuterungen mittels schriftlicher und bildlicher Kommentare hilfreich sind. Der signifikante Unterschied zu simultan zum lautlichen Text erscheinenden Captions liegt jedoch in der von ihnen vorgestellten Möglichkeit, diese Kommentare individuell abrufen zu können. Dennoch lässt sich das als erster Hinweis deuten, dass Schrift, Bild und (lautliche) Sprache in Kombination durchaus eine Hilfestellung beim Fremdsprachenlernen sein können.

3. Integrieren

Dieser kognitive Prozess des Integrierens der verbalen und piktographischen Modelle mit Informationen aus dem Langzeitgedächtnis ist wieder stark an Mayers CTML angelehnt. Er wird im Hinblick auf die linguistischen Elemente hier auch als Intake (Plass & Jones, 2005, S. 475) bezeichnet. Damit sind die Erfassung und das Begreifen semantischer und syntaktischer Elemente als Einheiten in einem linguistischen System gemeint. Dieser Intake wird mit dem linguistischen Repertoire aus dem Langzeitgedächtnis verknüpft und erweitert so das sprachliche Repertoire des Lernenden.

4. Anwenden

Ein optimales Lernergebnis wird erzielt, wenn die zuvor rezipierten und verarbeiteten Informationen durch Interaktion mit Mitschülern oder durch multimediale interaktive Designs in einem Prozess der (Re-)Produktion gefestigt und eventuelle Fehler korrigiert werden können.

Plass & Jones versuchen in ihrer Theorie nicht, die kognitiven Prozesse der Rezeption und der Verarbeitung im Arbeitsgedächtnis zu lokalisieren. Obwohl sie die äußere Struktur des CTML-Modells für ihre Theorie übernehmen, fokussieren sie nicht, wo Information verarbeitet wird, sondern wie sie verarbeitet wird. Dafür vergleichen sie bestehende Theorien aus der Forschung zu kognitiven Prozessen in multimedialer Lernumgebung mit Theorien zum Fremdsprachenlernen. Die Erkenntnisse, die sie daraus gewinnen, und die sie selbst als bescheiden bezeichnen, geben zumindest Hilfestellungen für multimediale Designs im Kontext des Fremdsprachenlernens und bieten zudem Anregungen für weitere Überlegungen und Forschungen in diesem Bereich. Plass & Jones erkennen auch, dass allgemein anerkannte Theorien, wie das Redundanz-Prinzip von Sweller (identische Informationen werden in zwei verschiedenen Modi präsentiert) und das Kohärenz-Prinzip von Mayer (irrelevante Informationen wie Bilder oder Erklärungen werden präsentiert), die von vielen Studien bestätigt wurden, im Kontext des Fremdsprachenlernens nicht ohne weiteres angewandt werden können. Dies liegt ihrer Meinung nach u. a. daran, dass

„any meaningful linguistic input has potential value for the acquisition of the language, and […] the relevancy of words cannot be as clearly established as for texts that describe scientific systems and their casual relations. […] Reading and listening are two competencies that both need to be developed, and in many cases one is used as input enhancement for the other.” (Plass & Jones, 2005, S. 480).

Anders als bei Sweller (2011) und Mayer (2001) wird hier der signifikante Unterschied zwischen Sprache als Lernobjekt und anderen nichtlinguistischen Themen im Hinblick auf die Anforderungen an multimediales Design erkannt. Was genau das für den Einsatz von Captions bedeutet, wurde an dieser Stelle nicht erläutert.

Im Folgenden wird die Theorie von Plass und Jones durch einen Überblick über die Forschungslage zum allgemeinen Einsatz von Captions im Fremdsprachenlernen um empirische Werte ergänzt.

Die Studie von Winke et al. (2010) gibt danach spezifische Einblicke darin, in welcher Reihenfolge Captions beim Fremdsprachenlernen am sinnvollsten in Bezug auf einen optimalen Lernerfolg eingesetzt werden können.

8. Studien zum Einsatz von Captions

Markham & Peter (2003) untersuchten im Kontext des Fremdsprachenlernens, in wie weit Captions beim Lese- und Hörverstehen einen Effekt auf das Lernergebnis ausüben. Dazu zeigten sie in drei Gruppen aufgeteilten spanischen Studenten eine Videosequenz auf Englisch, die je nach Gruppe entweder mit Captions, mit Untertitel in L1 oder ohne Captions / Untertitel bearbeitet wurde. Ein Multiple-Choice-Test zum Hörverstehen für alle drei Bedingungen zeigte bei dem Einsatz von Captions einen signifikanten Leistungsvorsprung gegenüber der Gruppe, die Untertitel in L1 oder keine Intervention erhielt. Der Einsatz von Untertiteln erzielte immer noch eine signifikant höhere Leistungssteigerung gegenüber der Gruppe, die weder Untertitel noch Captions zu ihrer Videosequenz hatte.

Borras & Lafayette (1994) analysierten, ob der Einsatz von Captions im Video bei verschiedenen Schwierigkeitsstufen im anschließenden mündlichen Test zum präsentierten Material unterschiedliche Auswirkungen auf die Testergebnisse hat. Ihrer Untersuchung lag ein 2 x 2 Versuchsplan zugrunde: Die vier Gruppen englischsprachiger Studenten unterschieden sich zum einen in der Art der Videopräsentation in französischer Sprache (mit Captions oder ohne Captions) und zum anderen in der Komplexität des anschließenden Tests (viele Details rekapitulieren versus wenig Details rekapitulieren). Ihre Auswertungen ergaben, dass die Gruppen mit Captions nicht nur mehr Details wiedergeben konnten als die Gruppen ohne Captions, sondern dass die Teilnehmer dieser Gruppen auch insgesamt flüssiger auf die Fragen antworten konnten. Captions erleichtern dementsprechend nicht nur die Rezeption fremdsprachlicher Informationen sondern auch die (Re-)Produktion der rezipierten Details.

Garza (1991) fand in seiner Studie heraus, dass auch Captions einer grammatisch und graphisch sich stark von L1 unterscheidenden Fremdsprache zu Lernsteigerungen im globalen Verständnis führen. Englischsprachigen Studenten der russischen Sprache im vierten und fünften Jahr wurden kurze Videosegmente gezeigt, je nach Gruppe mit Captions oder ohne. Die Auswertungen der anschließenden Leistungstests zum globalen Hörverständnis belegten einen deutlichen Unterschied der Leistungen zugunsten der Gruppe, die die Videos mit Captions sahen. Garza kam zu dem Schluss, dass Captions den Lernenden helfen, auditiven und visuellen Input miteinander zu verknüpfen und so die Bildung von verbal-visuellen Konzepten unterstützen.

Markham (1999) untersuchte den Effekt von Captions in Bezug auf die Worterkennung im Hörverständnis. Seine Teilnehmer waren ESL-Studenten (English as Second Language) mit unterschiedlichem muttersprachlichen Hintergrund; über 70% waren jedoch asiatischen Ursprungs, was die Ergebnisse aufgrund der Unterschiede im Sprach- und Schriftsystem möglicherweise beeinflusst haben mag. Es wurden zwei Videosequenzen gezeigt und nach jedem Video die Worterkennung mittels eines auditiven Multiple-Choice-Tests abgefragt. Die Videosequenzen unterschieden sich zum einen thematisch und zum anderen durch eine hohe und eine niedrige Video-Audio-Korrelation[7] (siehe Garza 1991). Die Testergebnisse zeigten bei beiden Videos im Bezug auf Worterkennung ein gesteigertes Hörverständnis bei den Sequenzen, die mit Captions unterlegt waren, gegenüber den textlosen Videos. Die Teilnehmer, die Captions bekamen, konnten signifikant mehr Vokabeln erkennen, als die, die keine Captions hatten.

Neuman & Koskinen (1992) wählten für ihre Studie gut hundert Teilnehmer eines bilingualen Übergangprogramms aus. Der sprachliche Hintergrund war auch hier überwiegend asiatisch, die Kompetenzlevels rangierten von sehr niedrig (keine/kaum englische Sprachkenntnisse) bis sehr hoch (flüssiges bis muttersprachliches Niveau). Sie wurden willkürlich in vier Gruppen eingeteilt, die je nach Gruppe Lerneinheiten über wissenschaftliche Themen mittels (1) Video mit Captions, (2) Video ohne Captions, (3) simultanem Hör- und Lesetext und (4) Lehrbuch vermittelt bekommen haben. Bei Bedingung 1 erzielten die Teilnehmer die besten Ergebnisse im Vokabelverständnis und im globalen Verständnis, wobei Probanden mit einem höheren Sprachkompetenzlevel in Relationen zu weniger guten Sprechern mehr Vokabeln lernten. In Anlehnung an Krashen (1989) schlussfolgerten sie daher, „that comprehensible input may be a key ingredient in language acquisition and reading development.” (Nieman & Koskinen, 1992, S. 94). In anderen Worten: Je verständlicher Input, desto größer der Lernzuwachs.

Guillary (1998) kam in ihrer Studie zu einem ähnlichen Ergebnis. Bei ihrer Untersuchung zum Einsatz von Captions in Videosequenzen bestätigten die Testergebnisse einen Vorteil für die Gruppe, die ihre Instruktionen mit Captions bekam, gegenüber der Gruppe, die keine Captions hatte. In Bezug auf das Leistungsniveau der Teilnehmer konnte sie zudem feststellen, dass Captions ein zu schweres Sprachkompetenzlevel in der Lehreinheit (hohe Sprachgeschwindigkeit und schwierige unbekannte Vokabeln) nicht ausgleichen konnten. Wie schon Nieman & Koskinen (1992) stützt sie Krashens input hypothesis, die besagt, dass der Input nur geringfügig über dem Sprachniveau der Fremdsprachenlernenden liegen darf, um noch verständlich zu sein und zu einem optimalen Lernerfolg führen zu können (Krashen 1989).

Die vorgestellten Studien haben bereits verschiedene Aspekte benannt und bewertet, die den optimalen Einsatz von Captions betreffen: der Effekt auf das Lese- und Hörverständnis (Markham & Peter, 2003), der Effekt graphemischer Unterschiede zwischen Erst- und Zielsprache (Garza, 1991), in Bezug zum Schwierigkeitsgrad des anschließenden Tests (Borras & Lafayette, 1994), die Auswirkung auf die Worterkennung im Hörverstehen (Markham, 1999) und der Bezug zum Sprachniveau der Lernenden (Guillary, 1998 und Nieman & Kroskinen, 1992).

Das ist lediglich eine kleine Auswahl aus einer Vielzahl an Studien, die sich mit Captions beschäftigen. Dennoch gibt es viele weitere offene Fragen, die sich zum einen aus den unterschiedlichen Aussagen einzelner Studien ergeben und zum anderen aus einer fehlenden Forschungsgrundlage. Ein Aspekt, der bislang nur von Winke et al. (2010) untersucht wurde, ist die Frage nach dem optimalen Einsatz von Captions bei einer zweimaligen Präsentation einer Lerneinheit (z. B. eines Videos). Ihre Studie wird aufgrund ihrer Nähe zu meiner Fragestellung im Folgenden eingehender vorgestellt.

8.1. Stellung der Captions in der Studie von Winke, Gass, & Sydorenko

Winke et al. befassten sich in ihrer Studie gleich mit mehreren Fragen, denen zum Teil bereits in o. g. Studien nachgegangen wurde: (1) Es wurde untersucht, ob bei einer zweimaligen Präsentation eines authentischen Videos ein Unterschied im Lernergebnis festzustellen ist, wenn das Video zuerst mit Captions und dann ohne Captions gezeigt wurde oder umgekehrt. (2) Zusätzlich wurde dieser Effekt im Hinblick auf die jeweilige Zielsprache untersucht (Arabisch, Chinesisch, Spanisch, Russisch). (3) Ebenso wurde analysiert, ob Studienteilnehmer (Russisch und Spanisch) mit einem niedrigen Kompetenzlevel in Bezug auf den Einsatz von Captions andere Testergebnisse erzielten als Teilnehmer mit fortgeschrittenem Kompetenzlevel. Außerdem wurde der Effekt von Cap-tions auf das globale Hörverständnis und Vokabellernen untersucht. Da diese Auswirkungen bereits hinreichend in anderen Studien belegt wurden (und auch in dieser bestätigt werden konnten) und für meine Fragestellung nicht primär von Belang sind, wird dieser letzte Aspekt in den weiteren Erläuterungen nicht berücksichtigt.

Im Studienverlauf wurden kurze Videos mit Dokumentarcharakter gezeigt. Jedes Video wurde zweimal hintereinander vorgespielt, je nach Gruppe zuerst mit Captions und dann ohne Captions bzw. umgekehrt. Anschließend bearbeiteten die Teilnehmer zwei Vokabeltests, in denen Schlüsselbegriffe aus den Videos sowohl schriftlich als auch auditiv abgefragt wurden und in L1 (englisch) übersetzt werden sollten. Zudem wurde nach jedem Video mittels eines Multiple-Choice-Tests das globale Hörverständnis abgefragt.

Die Vokabel- und Hörverstehenstests haben zu den Fragestellungen (1) bis (3) folgendes ergeben:

(1) Die Gruppen aller Zielsprachen, die die Videos zuerst mit Captions sahen, haben im auditiven Vokabeltest signifikant besser abgeschnitten als die Gruppen, die das Video zuerst ohne Captions sahen: t (124.89) = 2.12, p =.03, d = .36. Im Hörverstehenstest schnitten diese Gruppen jedoch nur marginal besser ab und im schriftlichen Vokabeltest waren die Testergebnisse ähnlich wie die der anderen Gruppe. Beide Resultate waren jedoch nicht signifikant.
(2) Ein Effekt der Reihenfolge von Captions auf die Zielsprache war laut der Ergebnisse dieser Tests nicht signifikant; es ließ sich jedoch eine Tendenz erkennen, dass Teilnehmer mit Russisch und Spanisch als L2 ein leicht besseres Ergebnis erzielten, wenn sie die Videos zuerst mit Captions sahen, und dass Teilnehmer mit Arabisch und Chinesisch als L2 bei Captions im zweiten Durchgang eine höhere Leistung erlangten.
(3) Es konnten keine signifikanten Interaktionen zwischen Sprache, Kompetenzlevel und Anordnung der Captions festgestellt werden.

Winke et al. (2010) kamen zu der Schlussfolgerung, dass Captions beim ersten Schauen eines Videos ein besseres Vokabelhörverständnis ermöglichen, da sie die Aufmerksamkeit des Lernenden auf die Sprache lenken. Dadurch würde der Prozess der Selektion vereinfacht, da Wortgrenzen in schnell gesprochener Sprache so leichter erkannt werden können. Ein zweites Sehen des Videos ohne Captions ermöglicht die Bestätigung des vorangegangen Lernzuwachses. Es wurde festgestellt, dass Captions als ein Werkzeug für Sprachenlernen fungieren können und übergreifend für alle Kompetenzstufen die kognitiven Prozesse unterstützen.

9. Schlussfolgerungen und Fragestellungen

Anhand der angeführten Theorien und Studienergebnisse ergaben sich mehrere Fragestellungen, die hier noch einmal kurz zusammengefasst werden. Sie bilden die Basis für die nachfolgende Erhebung.

(1) Hat die Reihenfolge im Einsatz von Captions bei einer zweimaligen Präsentation eines Videos Einfluss auf das Hörverständnis? Aufgrund der bereits erläuterten Schlussfolgerungen, die sich aus Paivios (1986) Theorie und Winkes et al. (2010) Studie ableiten lassen, wird angenommen, dass Lernende einen Vorteil im Hörverstehen haben, wenn sie Videosequenzen zuerst mit Captions sehen und dann ohne.
(2) Konstituiert ein besseres Vokabelverständnis mit Hilfe von Captions ein größeres Hörverständnis? Neuman & Koskinen (1992) erklären, dass ein Zuwachs an verständlichem Input einen größeren Lernzuwachs bedeute. Dementsprechend müsste eine höhere Vokabelkenntnis, die einen Input verständlicher werden lässt, zu einem besseren globalen Hörverständnis führen.
(3) Lassen sich die in (1) angenommenen Vorteile auch auf ein de-kontextualisiertes Hörverstehen übertragen, wenn dort die Captions ganz wegfallen? Nach Garza (1991) bildet sich durch die Hilfestellung von Captions ein mentales Konzept von Sprache, dass durch eine erneute Präsentation des Materials ohne Captions gefestigt und evtl. korrigiert werden kann. Ein weiterer Hörtext neuen thematischen Inhalts aber mit gleichen Schlüsselbegriffen, der ohne Captions präsentiert wird, sollte daher besser rezipiert werden können.

10. Methode

10.1. Überblick

Der Untersuchung lag ein 2-Gruppenvergleich zugrunde. In Gruppe 1 befanden sich 42 Teilnehmer, Gruppe 2 bestand aus 38 Teilnehmern. Die jeweilige Gruppenstärke und -zugehörigkeit ergab sich aus den bereits bestehenden Klassenstrukturen. Die Instruktion der zwei Gruppen dieses experimentellen Designs unterschied sich in der Intervention bei der Videosequenz: Die unabhängige Variable war das Format der Instruktionen: Gruppe 1 sah das Video zuerst ohne Captions, dann mit, Gruppe 2 sah das Video zuerst mit, dann ohne Cap-tions. Abhängige Variablen waren die Leistungen im ersten Wissenstest zur Videosequenz sowie im zweiten Test zur Hörverstehensaufgabe und die abschließende Einschätzung zum subjektiven cognitive load.

10.2. Versuchspersonen

Die Teilnehmer meiner Studie waren 54 Schüler und 26 Schülerinnen zweier beruflicher Schulen in Baden-Württemberg im Alter von 16 bis 30 Jahren, der Altersdurchschnitt lag bei 20 Jahren. Je Schule nahmen zwei Schulklassen der BKFH-Stufe (Berufskolleg Fachhochschulreife) teil. Für die Durchführung der Studie wurden zwei Gruppen gebildet, die sich jeweils aus der Klassenstruktur ergaben. So bildete jeweils eine Klasse einer Schule zusammen mit einer Klasse der anderen Schule eine Gruppe. Hierbei wurden aus organisatorischen Gründen die Klassenstrukturen beibehalten.

Die Schüler haben einen mittleren Bildungsabschluss und können über das einjährige Berufskolleg die Fachhochschulreife erwerben. Alle Teilnehmer hatten bereits mindestens fünf Jahre Englischunterricht. Unter den Schülern befanden sich keine Muttersprachler der englischen Sprache. Die Studie wurde im Rahmen einer planmäßigen Schulstunde durchgeführt. Die Teilnahme war freiwillig und ohne leistungsbewertende Konsequenzen für die Schüler.

10.3. Material und Durchführung

Der Kernpunkt der Materialien ist eine Videosequenz in L2 von 3:11 Minuten vom Discovery Channel über die Entstehung und das existentielle Ende von Sternen (siehe beigefügte CD im Anhang). Diese Sequenz wurde gewählt, weil die Schüler mit großer Wahrscheinlichkeit noch kein Vorwissen zu dem Thema des Videos hatten, ein durchschnittliches Interesse angenommen werden konnte, und weil die kurze Spieldauer im Rahmen dieser Studie zudem besonders geeignet war. Außerdem wurde darauf geachtet, dass eine hohe Video-Audio-Korrelation bestand (siehe Garza 1991), d. h. dass die Sprache durch das Video kontextualisiert und unterstützt wurde. Die Lehrkräfte haben das Filmmaterial sowohl vom Thema als auch vom Sprachniveau und Sprachgeschwindigkeit her als dem Leistungsniveau der Schüler angemessen beurteilt. Die Videosequenz beinhaltete insgesamt 396 Wörter, die Sprachgeschwindigkeit betrug ca. 100 Wörter pro Minute, mit einigen längeren Sprachpausen. Die Sequenz wurde für die Studie sowohl mit als auch ohne Captions vorbereitet. Diese wurden professionell wortgetreu mit Hilfe des Subtitle Creators erstellt und erschienen am unteren Teil des Bildschirms. Bei der Untertitelung wurde darauf geachtet, dass die Captions möglichst synchron zur Tonspur erschienen.

Aus organisatorischen Gründen erhielten die Schüler bereits zu Beginn der Studie jeweils ein Set, das sämtliche zu bearbeitende Arbeitsblätter enthielt (siehe Anhang). Sie wurden instruiert, nach der jeweiligen Bearbeitung eines Arbeitsblattes zur nächsten Seite umzublättern und keine nachträglichen Änderungen oder Ergänzungen vorzunehmen. Um keinen Einblick in die nächste Aufgabe zu geben, wurde nach jedem Arbeitsblatt ein Trennblatt eingefügt, das erst nach Aufforderung des Studienleiters umgeblättert werden durfte. Jedes Set enthielt ein Deckblatt, auf dem die Gruppenzugehörigkeit festgelegt war und der Name des Teilnehmers eingetragen wurde. Zur Wahrung der Anonymität der Schüler war es ihnen freigestellt, ein Substitut einzutragen, wie z. B. eine Zahlenfolge oder ein Pseudonym.

Im Set enthalten waren die Arbeitsblätter zum Vokabelwissen (Blatt 2 und 4), ein Arbeitsblatt zum Vorwissen Astrophysik (Blatt 3), ein Verstehenstest zur Videosequenz (Blatt 5 und 6) und einer zum Hörtext (Blatt 7 und 8) sowie abschließende Fragen zum subjektiven cognitive load (Blatt 9, 10 und 11).

Die Instruktionen und Fragen sowie die vorgegebenen Antworten auf allen Arbeitsblättern waren auf Deutsch. Dies sollte einen möglichst verständlichen und somit reibungslosen Ablauf ermöglichen und Fehler bei der Beantwortung der Fragen aufgrund fehlenden oder falschen Verständnisses des Arbeitsauftrages ausschließen. Zudem wurde so verhindert, dass eine richtige Antwort lediglich aufgrund einer Wiedererkennung des Schriftbildes von Schlüsselvokabeln gegeben wurde und nicht auf einer Verstehenskompetenz beruht.

Aus dem Transkript der Videosequenz wurden in Absprache mit den jeweiligen Fachlehrern der teilnehmenden Klassen Vokabeln bestimmt (siehe Arbeitsblatt 2 im Anhang), die nach Einschätzung der Lehrer noch nicht im allgemeinen Sprachschatz der Schüler vorhanden waren. Diese Vokabeln sollten für ein späteres Verständnisses der Videosequenz eingeführt werden, wie es in der Vorbereitung von Schülern auf neues Material üblich ist. Da Klassen stets heterogen sind, muss jedoch auch trotz einer Vokabeleinführungsphase ein individuell unterschiedliches Vokabelwissen angenommen werden. Dennoch sollte so ermöglicht werden, auch Schüler mit niedrigerem Kompetenzlevel für die folgende Videosequenz zu aktivieren. Dafür wurden für beide Gruppen Vokabellernphasen als Vorbereitung für die Hörverstehensaufgaben konzipiert.

Als erstes wurden diese zehn Vokabeln mittels einer Höreinheit abgefragt (siehe beigefügte CD). Die Vokabeln wurden von einem Muttersprachler des British English ohne dialektale Färbung eingesprochen, um eine authentische und reine Aussprache zu gewährleisten. Die Schüler beider Gruppen bekamen jede Vokabel mit einer Pause von jeweils sechs Sekunden aus dieser Audiodatei zweimal hintereinander vorgespielt. Zwischen zwei Vokabeln hatten sie ca. 10 Sekunden Zeit, die Vokabeln auf einem Arbeitsblatt in L1 zu übersetzen. Eine anschließende Nachbearbeitung des Arbeitsblattes war nicht erlaubt.

Anschließend wurden dieselben Begriffe via Microsoft Power Point nochmals präsentiert. Sie wurden für beide Gruppen mit erklärenden Bildern ergänzt und zusätzlich zum gesprochenen Text gab es nun auch geschriebenen Text in Form von Captions (siehe Beispiel Abb. 8). Wurde eine Aktion oder ein Vorgang beschrieben, wie z. B. bei ignite, wurden auch animierte Bilder verwendet. Die Vokabeln wurden vom selben Sprecher aus der ersten Vokabellerneinheit gesprochen. Die Begriffe wurden in einem Abstand von ca. 8 Sekunden hintereinander gezeigt, wobei jede Vokabel innerhalb dieser Zeit zweimal hintereinander gesprochen wurde. Mit diesen beiden Lernphasen sollte eine allen Schülern gemeinsame Wissensbasis geschaffen werden, d. h. ein ausgeglichenes Vokabelverständnis sollte so erzielt werden.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 8: Beispiel einer Vokabelpräsentation

Bevor die Vokabeln erneut abgefragt wurden, sollten die Teilnehmer zur Überprüfung des Vorwissens vier Fragen eines späteren Fragebogens zum Thema Astrophysik beantworten. So konnte, wenn auch auf schmaler Basis, erfasst werden, ob zukünftige Ergebnisse dadurch beeinflusst wurden. Für die Antworten hatten die Schüler insgesamt eine Minute Zeit.

Nun wurden noch einmal die zehn Vokabeln aus der vorangegangenen Präsentation schriftlich abgefragt. Die Schüler sollten die Begriffe wieder von L2 in L1 übersetzen. Dabei war die Reihenfolge der Vokabeln auf dem Arbeitsblatt eine andere als in der Präsentation, um ein Auswendiglernen nach Anordnung der Vokabeln auszuschließen. Für die Übersetzungen hatten die Schüler zwei Minuten Zeit, wobei nur sehr wenige Schüler die gesamte Zeit in Anspruch genommen hatten.

Die Vokabellernphase war nun abgeschlossen und eine gemeinsame Basis im Vokabular theoretisch geschaffen, die für das Verständnis der folgenden Videosequenz wichtig war.

Das Video wurde beiden Gruppen zweimal hintereinander vorgespielt. Bei Gruppe 1 wurde der Film zuerst ohne Captions gezeigt und dann mit, bei Gruppe 2 andersherum. Während des Videos durften keine Notizen gemacht werden. Anschließend wurde ein Verstehenstest bearbeitet, der das globale Verständnis über die Videosequenz abfragte (Beispiel: „Die Staub- und Gaswolken werden durch den Einfluss der Schwerkraft a) gleichmäßiger, b) mehr vermischt, c) dichter“, siehe Anhang, Blatt 5).

Die Überprüfung des Hörverstehens erfolgte mittels zehn Multiple-Choice-Fragen zum Inhalt. Sämtliche Fragen bezogen sich auf Kernaussagen der Videosequenz. Da sowohl das Hörverständnis als auch die für den Text wichtigen Vokabeln abgefragt wurden, ist es möglich zu überprüfen, ob Vokabelwissen und Hörverständnis zusammenhängen (siehe Fragestellung 2, Kapitel 9). Für die Beantwortung der Fragen hatten die Schüler 4 Minuten Zeit. Auch hier beanspruchten nur vereinzelte Schüler die gesamte Zeitspanne.

Anschließend wurde beiden Gruppen ein Hörtext vorgespielt. Die Audiodatei (auf CD im Anhang) wurde wieder vom selben Sprecher der anderen Sprachdateien aus der Vokabellernphase eingesprochen. Es wurde eine kurze Erzählung mit einer neuen Thematik wiedergegeben, bei der dieselben Vokabeln aus der Vokabellernphase für das Hörverständnis ausschlaggebend waren. Dieser Erzähltext beinhaltete 209 Wörter und wurde mit einer Sprachgeschwindigkeit von ca. 160 Wörtern pro Minute eingesprochen. Die Gesamtlänge des Hörtextes betrug 1:18 Minuten und wurde zweimal hintereinander vorgespielt.

Es folgte ein weiterer Hörverstehenstest mit Multiple-Choice-Fragen zum Hörtext. Auch hier hatten die zehn Schlüsselvokabeln aus den vorangegangenen Lern- und Testphasen eine zentrale Bedeutung in den vorgegebenen Antworten (Beispiel: „Zu Hause ging Mary den Flur entlang. Dieser a) war stockdunkel, b) lag im Halbdunkeln, c) war sehr schmal“. Der eingeführte Schlüsselbegriff ist hier dim). Hierfür hatten die Schüler 4 Minuten Zeit.

Abschließend beantworteten die Schüler Fragen zum Cognitive-Load-Empfinden und zu ihren Interessen in den Gebieten Englisch und (Astro-) Physik. Die Antworten konnten in einer Likert-Scala von 1= überhaupt nicht bis 7= sehr stark gegeben werden (Beispiel: „Wie sehr haben Sie die Untertitel beim Verstehen des Videos gestört?“, siehe Blatt 9-11).

Bei den Tests zum Vokabellernen und zum Hörverstehen gab es je richtige Antwort einen Punkt. Punktabzüge für falsche Antworten oder Übersetzungen gab es nicht. Somit konnten je Test mindestens null und maximal zehn Punkte erreicht werden, wobei bei willkürlichem Ankreuzen der Antworten zum Vorwissenstest Astrophysik und der Hörverstehensaufgaben statistisch eine Punktzahl zwischen zwei und drei Punkten zu erwarten war.

Die Studienteilnehmer wirkten insgesamt motiviert und konzentriert. Die gesamte Studiendurchführung verlief ohne Störungen. Viele Schüler fühlten sich anfangs durch ihre mangelnde Vokabelkenntnis irritiert, was manche veranlasste, auf benachbarte Arbeitsblätter zu schauen. Einige wenige Schüler mussten immer wieder gebeten werden, ihre Arbeitsblätter allein zu bearbeiten. Ein Abschreiben von Mitschülern konnte jedoch verhindert werden.

11. Ergebnisse

Die abhängigen Variablen waren die Testergebnisse in den Verstehenstests nach der Videosequenz und nach der Hörsequenz, die unabhängige Variable war die Reihenfolge der Captions in der Videosequenz.

Um zu sehen, ob die Schüler bereits ein für das Video spezifisches Vokabelvorwissen mitbrachten, wurde vorab eine Vokabelabfrage durchgeführt. Bereits hier zeigte sich im t -Test bei unabhängigen Stichproben ein signifikanter Unterschied zwischen den Gruppen (t (78) = 3,72, p < .01), der sich auch nach der Präsentation der Begriffe mittels Power Point nicht ausgeglichen hatte (t (78) = 4,572, p <.01). Der Mittelwert bei Gruppe 1 im ersten Vokabeltest lag unter 2 von 10 Punkten (M = 1.24), bei Gruppe 2 unter 1 von 10 Punkten (M = .29); im zweiten Vokabeltest lag der Mittelwert der ersten Gruppe unter 5 von 10 Punkten (M = 4.71) und in der zweiten Gruppe unter 3 von 10 Punkten (M = 2.97) (siehe Tabelle 1).

Tabelle 1: Mittelwerte (und Standardabweichungen) der Vokabel- und Hörver-stehenstests der unabhängigen Variablen

Abbildung in dieser Leseprobe nicht enthalten

Beiden Gruppen fehlte vor der Studie dementsprechend das spezifische Vokabelverständnis, das auch durch die Vokabellerneinheit nur wenig verbessert werden konnte. Gruppe 1 erzielte insgesamt einen leicht größeren Lernzuwachs als Gruppe 2.

Ein signifikanter Effekt der Reihenfolge von Captions auf das Hörverständnis der Videosequenz zeigte sich bei der Auswertung des Hörverstehenstests nicht (t = 1,04)[8]. Die Mittelwerte lagen bei Gruppe 1 bei M = 6.74, bei Gruppe 2 bei M = 6.11 von 10 möglichen Punkten.

Ebenso ließ die Art der Instruktion keinen signifikanten Effekt auf die Leistung beim zweiten Hörverstehenstest erkennen (t = 1,50).9

Beide Gruppen verzeichnen unabhängig von der Art der Instruktionen einen Leistungszuwachs bis zum ersten Hörverstehenstest und im zweiten Hörverstehenstest einen leichten Leistungsabfall. Die Testergebnisse beider Gruppen verhalten sich parallel zueinander, wobei Gruppe 1 bereits zu Beginn der Studie signifikant bessere Leistungsergebnisse verzeichnete (siehe Abb. 9). Die Hypothese meiner ersten Fragestellung (s. Kapitel 9) konnte somit nicht bestätigt werden.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 9: Leistungskurven der Gruppen 1 und 2

Mittels Berechnungen der Pearson-Korrelationskoeffizienten wurden Relationen vom Vokabelvorwissen bzw. Vokabeltest zu den beiden Hörverstehenstests errechnet. Es ließen sich statistisch signifikante Zusammenhänge zwischen den abhängigen Variablen und den Vokabelkenntnissen erkennen (siehe Tabelle 2).

Obwohl die Korrelationen keine Aussagen über kausale Zusammenhänge geben, kann aufgrund der vorliegenden Ergebnisse der einzelnen Tests dennoch von Vokabelwissen als mit-ursächlicher Faktor von Hörverstehensleistungen ausgegangen werden. Meine Hypothese aus der zweiten Fragestellung wäre somit zumindest teilweise bestätigt (siehe Kapitel 9): Ein besseres Vokabelverständnis konstituiert ein größeres Hörverständnis, jedoch steht dies nicht im Zusammenhang mit einem möglichen Einfluss von Captions auf das Hörverstehen.

Tabelle 2: Pearson-Korrelationen der abhängigen Variablen zu den Vokabeltests.

Abbildung in dieser Leseprobe nicht enthalten

Ebenfalls mittels Errechnung des Pearson-Korrelationskoeffizienten wurde das Verhältnis vom ersten Hörverstehenstest zum zweiten Test untersucht. Hierbei ergab sich ein signifikanter Zusammenhang (r = .30, p <.01). Ein kausaler Zusammenhang, wie er in der dritten Hypothese angenommen wird (Transferleistung des Hörverstehens aus dem ersten Wissenstest, siehe Kapitel 9), kann an dieser Stelle jedoch nicht bestätigt werden.

Die Einschätzungen der Schüler zur subjektiven kognitiven Belastung (siehe Anhang Blatt 9 bis 11) unterschieden sich bedeutend zwischen den Gruppen 1 (zuerst ohne Captions) und 2 (zuerst mit Captions) bei den Fragen zum Verständnis des Hörtextes sowie zum Einsatz der Captions beim Vokabellernen und beim Video (siehe Abb. 10).

Abbildung in dieser Leseprobe nicht enthalten

Abb. 10: signifikante Ergebnisse zur subjektiven kognitiven Belastung

Ein t -Test bei unabhängigen Stichproben ergab signifikante Unterschiede bei der Mittelwertgleichheit in Bezug auf die Wertung des Einsatzes von Captions: Die Frage „Wie sehr haben Ihnen die Untertitel beim Lernen geholfen?“ ergab einen Wert t (78) = 2,18, p <.04, die Frage „Wie sehr haben Ihnen die Untertitel beim Verstehen des Videos geholfen?“ ergab den Wert t (78) = 2,94, p <.01.

Teilnehmer der Gruppe 1 fanden den Einsatz von Captions signifikant hilfreicher als die Schüler der Gruppe 2.

Im Gegensatz zu Gruppe 2 empfanden die Studienteilnehmer der ersten Gruppe den Text der Höreinheit als signifikant weniger anstrengend („Wie sehr mussten Sie sich anstrengen, um zu verstehen was gesagt wurde?“: t (78) = -3.43, p <.01) und weniger schwierig („Wie schwer ist es Ihnen gefallen, zu verstehen was gesagt wurde?“: t (78) = -2,65, p <.01) (mögliche Wertungen werden in der Diskussion erläutert, siehe 12.1.).

Für die restlichen Fragen zur subjektiven kognitiven Belastung wurden t -Tests bei unabhängigen Stichproben gerechnet, die allesamt nicht signifikante Effekte der abhängigen Variablen ergaben (Frage 2: „Wie schwer ist es Ihnen gefallen, mit der Präsentation die Vokabeln zu lernen?: t < 2,2; Frage 4: „Wie sehr haben Sie die Untertitel beim Lernen gestört?“: t = -1,46 ; Frage 5: „Zum Video: Wie sehr mussten Sie sich anstrengen, um zu verstehen was gesagt wurde?“: t > -1,73; Frage 6: „Wie schwer ist es Ihnen gefallen, zu verstehen was gesagt wurde?“: t > -1,06; Frage 8: „Wie sehr haben Sie die Untertitel beim Verstehen des Videos gestört?“: t > -1,93; Frage 11: „Wie sehr hätte Ihnen ein begleitender geschriebener Text zum Verständnis geholfen?“: t > -0,84; Frage 12:“ Wie sehr hätte Sie ein begleitender geschriebener Text beim Verstehen gestört?“: t = 0,82).

Der lineare Überblick der Auswertungen zeigt, dass die Teilnehmer der Gruppe 2 im Mittelwert ihre kognitive Belastung jeweils subjektiv höher eingeschätzt haben als die Teilnehmer der Gruppe1 (siehe Abb. 11).

Abbildung in dieser Leseprobe nicht enthalten

Abb. 11: nicht signifikante Ergebnisse zur subjektiven kognitiven Belastung

Abbildung in dieser Leseprobe nicht enthalten

12. Diskussion

12.1. Wertung der Ergebnisse

In dieser Studie wurde untersucht, ob der Einsatz von Captions in einer spezifischen Reihenfolge einen Einfluss auf das Lernergebnis der Fremdsprachenlernenden hat (Fragestellung 1). Die Annahme, dass Lernende einen Vorteil im Hörverstehen haben, wenn sie Videosequenzen zuerst mit Captions sehen und dann ohne, konnte hier nicht bestätigt werden, da die Auswertung der Testergebnisse in der Lernleistung keinen signifikanten Unterschied zwischen den Gruppen erkennen ließ.

Auch ein signifikanter Zusammenhang zwischen einem quantitativ höherem Vokabelverständnis und besserem globalen Hörverständnis in Verbindung mit Captions (Fragestellung 2) konnte nicht ermittelt werden. Das mag daran gelegen haben, dass die Vokabelkenntnisse und -lernleistungen in beiden Gruppen eher schwach waren und ein quantitativer Wissenszuwachs von fremdsprachlichen Begriffen kaum erreicht werden konnte. Dennoch waren signifikante Zusammenhänge zwischen Vokabelwissen und Leistung erkennbar. Da diese sich nicht durch die Art der Instruktion erklären lassen, wäre es denkbar, dass sowohl der vorhandene Sprachschatz in einer Fremdsprache als auch das Vermögen, diesen zu erweitern, einen Rückschluss auf generelle Erschließungsmöglichkeiten eines Textes in L2 zulässt. Inwieweit dies zusammenhängt, konnte auf Basis der vorliegenden Ergebnisse jedoch nicht ermittelt werden.

Da die Annahme der ersten Fragestellung nicht bestätigt werden konnte, lässt sich keine Aussage über einen Transfer von möglichen Vorteilen im Hörverstehen durch Captions auf einen Hörtext ohne Captions machen (siehe Fragestellung 3, Kapitel 9). Die abfallenden Leistungen im zweiten Test gegenüber denen im ersten Test scheinen eher Lunds (1991) These zu bestätigen, dass die allgemeine Lesekompetenz die Leistungen in der Hörkompetenz übersteigt (siehe 6.2.). So ließe sich zumindest erklären, warum die Schüler beim zweiten Test trotz derselben Schlüsselvokabeln wie im Hörverstehenstest zum Video gruppenübergreifend insgesamt schlechter abschnitten.

Die Auswertung der Fragebögen zur subjektiven kognitiven Belastung ergab, dass die Gruppe mit den besseren Leistungen (Gruppe 1, diese sah das Video zuerst ohne Captions) in beiden abhängigen Bedingungen ihren cognitive load als weniger groß einschätzte als die Gruppe, die etwas schlechtere Leistungen erzielte. Zudem beurteilte sie die Captions als etwas hilfreicher für das Hörverstehen als Gruppe 2. Ob das nun mit der Reihenfolge der Captions zusammenhing, was in diesem Fall die Hypothese der Fragestellung 1 widersprechen würde, oder mit dem allgemeinen Leistungsniveau der Schüler, ist nicht statistisch belegbar. Letzteres würde jedoch die input hypothesis von Krashen (1989) bestätigen (siehe Kapitel 8, S.29).

Die Tatsache, dass Gruppe 2 im selben Test die kognitive Belastung als höher empfand als Gruppe 1, könnte aus den gleichen Gründen eine Bestätigung Krashens input hypothesis sein: Das fehlende Wissen, das durch die signifikanten Leistungsunterschiede zu Gruppe1 deutlich wurde, würde in diesem Fall nach Krashens These das Verständnis des präsentierten Materials verschlechtern. Der Unterschied in der Sprachkompetenz konnte auch durch den Einsatz von Captions nicht ausgeglichen werden. Ob die subjektive kognitive Belastung möglicherweise stattdessen im Zusammenhang mit der Reihenfolge der Captions steht, konnte anhand der erhobenen Daten nicht ermittelt werden.

Meine Hypothesen, die im Hinblick auf den optimalen Einsatz von Captions mit Rückgriff auf die Theorien und Erkenntnisse von Paivio (1986), Neuman & Koskinen (1992) und Garza(1991) aufgestellt wurden, konnten in dieser Studie nicht bestätigt werden. Das bedeutet jedoch nicht zwangsläufig eine Inkonsistenz dieser Theorien und Erkenntnisse, wenn man die Rahmbedingungen dieser Studie berücksichtigt, die im Folgenden weiter erörtert werden.

Da diese Studie den Einsatz von Captions im Schulkontext untersuchte, bildeten jeweils zwei geschlossene Schulklassen eine Vergleichsgruppe. So konnten praktische Implikationen für die Gestaltung schulischen Lehrmaterials geboten werden. Obwohl Bildungspläne für jeden Jahrgang eines jeden Schulzweiges Lernziele formulieren, sind Schulklassen in Bezug auf den Leistungsstand nicht zuletzt aufgrund der individuellen kognitiven Fähigkeiten der Schüler stets heterogen. Eine optimale Grundlage für eine Vergleichsstudie, wie sie hier vorgenommen wurde, sind homogene Gruppen. Sinnvoller wäre daher eine Vorabüberprüfung der Schüler zur Einschätzung des individuellen Leistungsstandes für eine entsprechende Gruppenzuweisung gewesen, um möglichst homogene Gruppen bilden zu können. Da das aus logistischen Gründen nicht möglich war und zudem die authentischen Schulbedingungen aufgelöst hätte, musste darauf verzichtet werden.

Die festgestellten Defizite im Vokabelwissen könnten möglicherweise eine Ursache für die mittelmäßigen Ergebnisse in den beiden Hörverstehenstests gewesen sein. Dem sollte durch die vorangegangene Vokabellerneinheit vorgebeugt werden. Die Auswertungen der Vokabeltests ergaben jedoch nur einen geringen Zuwachs an Vokabelkenntnis. Bei der Analyse der Vokabelabfrage war zu erkennen, dass ca. ein Viertel der Teilnehmer weniger die Bedeutung der einzelnen Vokabeln lernten, sondern vielmehr die Reihenfolge der Begriffe in der Präsentation rekapitulierten. Da die Vokabeln auf dem Arbeitsblatt eine andere Abfolge als in der Präsentation hatten, kann ein entsprechender Teil der falschen Übersetzungen darauf zurückgeführt werden. Eine Information in der Instruktion über eine willkürliche Anordnung der Begriffe in der Vokabelabfrage hätte dem möglicherweise vorbeugen können.

Sicherlich interessant wäre eine erneute Vokabelabfrage nach dem Video und / oder nach dem Hörtext gewesen, um festzustellen, ob eine Einbindung der Begriffe in einen Kontext das Lernen von Vokabeln fördert (z. B. im Sinne Baddeleys Theorie der semantischen Verknüpfung, siehe Seite 12).

Nach Plass & Jones ist bei der Einführung der Vokabeln eine Übersetzung in L1 für einen größeren Lernzuwachs hilfreich (Plass & Jones, 2005, S. 474). Jedoch wäre es bei der vorliegenden Studie bei einer Präsentation der deutschen Pendants bei den Hörverstehenstest als mögliche Folge dazu gekommen, dass Antworten lediglich anhand der Wiedererkennung der Begriffe in L1 richtig gegeben worden wären.

Eine mögliche Variante zum Erreichen eines höheren Vokabelwissens wäre gewesen, die Vokabeln bereits einige Tage im Voraus durch die Lehrkraft einführen zu lassen, um den Schülern genug Zeit zu geben, die neuen Wörter in ihren Sprachschatz zu integrieren. Dann hätte man nach einer Vokabelabfrage am Vortag zur Überprüfung des Lernstandes bei gegebenem Lernerfolg das Vokabelwissen durch entsprechende Maßnahmen nur noch aktivieren müssen. Dann jedoch wäre eine Untersuchung hinsichtlich Fragestellung 2 (siehe Kapitel 9, S. 32) nicht mehr möglich gewesen.

Da die Ergebnisse bei den Hörverstehenstests in Abhängigkeit zum Vokabelwissen zu stehen scheinen, wären Gruppen mit und ohne entsprechende Vokabelkenntnisse hilfreich gewesen, die die gleichen Instruktionen plus entweder komplett mit oder komplett ohne Captions bekommen, um deren Ergebnisse bei den abhängigen Variablen mit dem eigenen Vokabelvorwissen und dem Vorwissen der anderen Gruppen vergleichen zu können. So könnte der tatsächliche Zusammenhang von Vokabelwissen und Hörverstehen und von Vokabelwissen, Hörverstehen und Captions untersucht werden.

Die Durchführung solch einer Studie in einer authentischen Schulumgebung bietet zwar zum einen die Möglichkeit, einen direkten Transfer der Ergebnisse auf die Gestaltung des Unterrichts leisten zu können, andererseits hat sich hier gezeigt, dass durch die Heterogenität der Klassen in Bezug auf Leistung die erhobenen Daten oft nicht eindeutig gewertet werden können. Praktische Implikationen können daher nur in Form von Empfehlungen gegeben werden (s. 12.3).

12.2. Lehrerumfrage zum Thema Captions

Um einen Einblick in die Gestaltung multimedialer Instruktionen im Fremdsprachenunterricht zu erhalten, wurde in zwei Bundesländern an insgesamt sieben verschiedenen Schulen eine Umfrage zum Thema Captions durchgeführt (siehe Fragebögen im Anhang). Von 100 ausgeteilten Fragebögen kamen 43 zurück, wovon 12 aufgrund unzureichender oder sich widersprechender Antworten nicht auswertbar waren.

Die Umfrage bei den verbleibenden 31 Fremdsprachen-Lehrkräften höherer Schulen aus Baden-Württemberg und Hamburg zum Thema Captions ergab, dass im Durchschnitt ca. vier Filmsequenzen pro Klasse pro Schulhalbjahr gezeigt werden, d. h. knapp einmal pro Monat pro Klasse. Interessant an dieser Stelle wäre noch gewesen, mit welchen anderen Mitteln das Hörverständnis der Schüler gefördert wird und wie oft diese Mittel zum Einsatz kommen.

Zwei Drittel der befragten Lehrer gaben an, dass sie aus Zeitgründen eingesetzte Filme und Videosequenzen nur einmal zeigen. Bis auf vereinzelte Ausnahmen, die leider nicht begründet wurden, werden die Filme in L2 gezeigt.

In durchschnittlich ca. 30% der gezeigten Filme werden Untertitel eingesetzt, wobei acht der befragten Lehrer angaben, niemals Untertitel einzusetzen. Von den Untertiteln, die eingesetzt werden, sind knapp 80% in der Zielsprache.

Von den gut 30%, die das Videomaterial zweimal zeigen, nutzt die Hälfte die Untertitel nur im zweiten Durchgang, die anderen in beiden Durchgängen. Lediglich einer der 31 Befragten gab an, die Untertitel nur beim ersten Zeigen zu nutzen und das auch nur im Kompetenzbereich C.

Begründungen für das Verwenden von keinen oder deutschen Untertiteln wurden kaum angegeben. Ein Lehrer verwies lediglich auf die Förderung des Hörverstehens, ein weiterer auf Schüleranmerkungen, nach denen sie Untertitel irritieren würden. Ein weiterer verwies auf die schlechte Verfügbarkeit von fertig untertitelten Videos.

Interessanterweise – und möglicherweise aus dem letztgenannten Grund – bewerteten jedoch auch diejenigen Lehrkräfte, die keine oder nur selten Captions einsetzen, die Nutzung von L2-Untertitel als hilfreich für das Hörverstehen. Zudem erfolge nach den Ansichten fast aller Befragten bei einem Einsatz von Captions eine Verknüpfung von sprachlichen und inhaltlichen Zusammenhängen, eine Förderung des Identifizierens und Begreifens von Wörtern, eine bessere Zugänglichkeit von Dialekten und Texten mit hohem Sprachniveau und fördere zudem die Motivation der Schüler, die sich mit Hilfe von Captions die gezeigten Videos leichter erschließen könnten.

12.3. Implikationen und Aussichten

Diese Studie hat ergeben, dass es im Schulalltag für den Lernerfolg keinen Unterschied zu machen scheint, ob Captions bei einer Videopräsentation im ersten oder im zweiten Durchlauf eingesetzt werden. Da die Lehrerumfrage – so wenig repräsentativ sie aufgrund der niedrigen Teilnehmerzahl auch sein mag – den Eindruck hinterließ, dass zeitliche Gründe für eine einmalige Präsentation sprechen, sollte das Material dann auch mit Captions gezeigt werden (vgl. Kapitel 7, S. 26). Eine Überlastung der kognitiven Ressourcen allein durch den Einsatz von Untertitel kann dabei nicht angenommen werden (siehe Kapitel 11, S.41), wie sich auch anhand der angeführten Theorien erklären lässt.

Studien, die auf Basis von kognitiven Theorien die Effekte von Captions auf das Lernergebnis untersucht haben, schienen stets „die“ ideale Instruktion für Lernende finden zu wollen. Theorien über Lernstile jedoch besagen, dass es individuelle Unterschiede im Lernverhalten gibt, die sich auch durch unterschied-liche soziale Bedingungen ergeben, in denen die Lernenden aufwachsen. Eine Untersuchung von Captions als Hilfestellung beim Lernen für ein optimales Lernergebnis müssten daher auch stets die „Verhaltensweisen und Kognitionen [bedenken], die von Lernenden aktiv zum Zweck des Wissenserwerbs eingesetzt werden.“ (Wild, 2005, S. 479.) Es geht also nicht nur darum, zu erforschen, ob eine simultane Belegung von visuellem und auditiv / verbalem Kanal zu einer kognitiven Überlastung führt oder doch eher Gelegenheiten gibt, sich ganz nach Präferenz die Präsentationsart auszusuchen, sondern auch darum, welche Strategien Lernende nutzen, um das im Arbeitsgedächtnis verarbeitete Wissen im Langzeitgedächtnis zu speichern, wie z. B. das Erstellen von Mindmaps, Lernen durch Schreiben, Lernen durch Vortragen etc.

Es wird davon ausgegangen, dass je nach individueller Einschätzung, Motiva-tion und Präferenz unterschiedliche Strategien zum Wissenserwerb eingesetzt werden. Zum Teil sind dabei aber gewohnte Lernstile, von denen sich die Schüler nicht immer selbst lösen können, hinderlich. Schüler können und sollten in der Schule durch entsprechende Instruktionen dahingehend gelenkt werden, dass sie flexibler in ihren Lernstrategien werden.

Instruktionen, die auf die individuellen Bedürfnisse der Lernenden zugeschnitten sind, können jedoch im Schulalltag kaum angewandt werden. Im Hinblick auf den Einsatz von Captions sollte daher zunächst der Fokus darauf gelegt werden, in wie weit sie bei unterschiedlichen Kompetenzstufen wirklich eine Hilfestelllung sind oder vielmehr tatsächlich die kognitiven Möglichkeiten des Arbeitsgedächtnisses überlasten. Winke et al. (2010) untersuchten zwar den Effekt von Captions auf das Lernergebnis von Lernenden im zweiten und im vierten Jahr, jedoch nur im Hinblick auf die Reihenfolge, in der Captions bei einer zweimaligen Präsentation des Videomaterials eingesetzt werden sollten. Wie auch in der vorliegenden Studie ließen sich in dieser Hinsicht keine signifikanten Unterschiede feststellen.

Ebenso untersuchten Lwo & Lin (2012) den Effekt von Captions auf unterschiedliche Kompetenzstufen, jedoch mit solch widersprüchlichen Ergebnissen, dass diese nicht als Grundlage für theoretische oder praktische Implikationen dienen können. Hier besteht weiterer Forschungsbedarf.

Literaturverzeichnis

Baddeley, A. (1999). Essentials of Human Memory. Bristol: Psychology Press.

Baddeley, A. (2000). The episodic buffer: a new component of working memory? Trends of Cognitive Science, 4(11), 417-423.

Borras, I. & Lafayette, R. (1994). Effects of multimedia courseware subtitling on the speaking performance of college students of French. The Modern Language Journal, 78, 61-74.

Craig, S.D., Gholson, B., & Driscoll, D.M. (2002). Animated pedagogical agents in multimedia educational environments: Effects of agent properties, picture features, and redundancy. Journal of Educational Psychology, 94(2), 428-434.

Garza, T. (1991). Evaluating the use of captioned video materials in advanced foreign language learning. Foreign Language Annals, 24(3), 239-258.

Gathercole, S.E. & Baddeley, A. (1993). Working Memory and Language. Hove: Earlbaum.

Guillory, H.G. (1998). The effects of keyword Captions to authentic French video on learner comprehension. CALICO Journal, 15(1-3), 89-108.

Heidler, M.D. (2013). Das Arbeitsgedächtnis. Ein Überblick für Sprachtherapeuten, Linguisten und Pädagogen. Bad Honnef: Hippocampus-Verlag.

Kalyuga, S., Chandler, P., & Sweller, J. (2004). When redundant on-screen text in multimedia technical instruction can interfere with learning . Human Factors: The Journal of the Human Factors and Ergonomics Society, 46(3), 567-581.

Krashen, S. (1989). We acquire vocabulary and spelling by reading: Additional evidence for the input hypothesis. Modern Language Journal, 73(4), 440-465.

Lwo, L. & Lin, M. (2012). The effects of Captions in teenagers’ multimedia L2 learning. ReCALL, 24, 188-208.

Lund, R.J. (1991). A comparison of second language listening and reading comprehension. Modern Language Journal, 75(2), 196-204.

Markham, P. (1999). Captioned videotapes and second language listening word recognition. Foreign Language Annals, 32, 321-328.

Markham, P. & Peter, L. (2003). The influence of English language and Spanish language Captions on foreign language reading/listening comprehension. Journal of Educational Technology Systems, 31(3), 331-341.

Mayer, R. (2001). Multimedia Learning. Cambridge: Cambridge Univ. Press.

Mayer, R. & Johnson, C. (2008). Revising the redundancy principle in multimedia learning. Journal of Educational Psychology, 100(2), 380-386

Mayer, R., Heiser, J., & Lonn, S. (2001). Cognitive constraints on multimedia learning: When presenting more material results in less understanding. Journal of Educational Psychology, 93(1), 187-198.

Neuman, S.B. & Koskinen, P. (1992). Captioned television as ‘comprehensible input’: Effects of incidental word learning from context for language minority students. Reading Research Quarterly 27(1), 95-106.

Paivio, A. (1986). Mental Representations. A Dual Coding Approach. Oxford: Oxford Univ. Press.

Papagno, C., Valentine, T., & Baddeley, A. (1991). Phonological short-term memory and foreign-language vocabulary learning. Journal of Memory and Language, 30, 331-347.

Plass, J.L. & Jones, L.C (2005). Multimedia learning in second language acquisition. In: R.E. Mayer (Ed.), The Cambridge Handbook of Multimedia Learning (S. 467-488). New York: Cambridge University Press.

Sweller, J., Ayres, P., & Kalyuga, S. (2011). Cognitive Load Theory. New York: Springer.

Wild, K-P. (2005). Lernstrategien und Lernstile. In: D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 479-485).4. Auflage, Weinheim, Basel: Beltz

Winke, Gass, & Sydorenko (2010). The effects of captioning videos used for foreign language listening activities. Language, Learning & Technology, 14(1), 65-86.

[...]


[1] Geschlechtsbezogene Begriffe werden hier in ihrer männlichen Form verwendet. Dies impliziert selbstverständlich auch die weibliche Form. Aus Gründen der Orthographie wird auf die Verwendung des Binnen-I verzichtet, aus Gründen der besseren Lesbarkeit auch auf die Verwendung der kumulativen Form.

[2] Markham (1999) und Markham & Peter (2003) unterschieden zwischen subtitles und Captions, ersteres eine (Bild-) Unterschrift in L1, letzteres eine Unterschrift in der zu erlernenden L2. Eine deutsche Entsprechung zu Captions gibt es nicht, daher werde ich im weiteren Verlauf den englischen Begriff nutzen.

[3] Derzeit gibt es in der Fachliteratur keine allgemeingebräuchlichen deutschen Übersetzungen. Ich habe daher die englischen Fachtermini der Bedeutung nach ins Deutsche übersetzt.

[4] Krashen dagegen sagt, dass das bewusste Lernen zu einem geringeren Kompetenzlevel führe (1989, S. 454).

[5] In einer Studie von 2008 revidiert er die Allgemeingültigkeit des Redundanz-Prinzips allerdings (Mayer & Johnson (2008). Revising the redundancy principle in multimedia learning. Journal of Educational Psychology, 100(2), S. 380-386.

[6] Plass und Jones (2005) unterscheiden zwischen Fremdsprachen lernen (Erlernen von Strukturen einer Sprache) und Fremdsprachen erwerb durch interaktive Kommunikation in der Zielsprache. In der Fachliteratur werden beide Begriffe meist synonym verwendet. Wird zwischen Erwerb und Lernen unterschieden, dann im Hinblick auf die Lernumgebung: der Erwerb findet in der kulturellen Umgebung der Zielsprache statt (z. B. Familie, fremdes Land etc.), während Lernen in einer ansonsten zielsprachenfremden Umgebung stattfindet (z. B. Schule). Da diese Unterscheidung jedoch nicht allgemein anerkannt in der Fachliteratur vertreten ist, verwende ich in meinen Ausführungen den Begriff Fremdsprachenlernen übergreifend.

[7] Mehr zur Audio-Video-Korrelation in Kapitel 10.

[8] +9 Auch unter Berücksichtigung des Vokabelvorwissens mit Hilfe einer Kovarianzanalyse bleiben die Unterschiede statistisch nicht bedeutsam. Daher wird der Einfachheit halber der t-Test für unabhängige Stichproben berichtet.

Ende der Leseprobe aus 52 Seiten

Details

Titel
Captions im Fremdsprachenunterricht
Hochschule
Universität Mannheim
Note
2,0
Autor
Jahr
2014
Seiten
52
Katalognummer
V286215
ISBN (eBook)
9783656865025
ISBN (Buch)
9783656865032
Dateigröße
992 KB
Sprache
Deutsch
Schlagworte
captions, fremdsprachenunterricht
Arbeit zitieren
Mareike Paulun (Autor:in), 2014, Captions im Fremdsprachenunterricht, München, GRIN Verlag, https://www.grin.com/document/286215

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Captions im Fremdsprachenunterricht



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden