Im Rahmen dieser Arbeit wird ein Testinstrument zur Messung von Bewertungskompetenz nach dem sogenannten Göttinger Modell der Bewertungskompetenz vorgestellt und die Ergebnisse einer ersten empirischen Erprobung des Instruments präsentiert. Dabei ist das Instrument so konstruiert, dass es Unterschiede im Bewertungsstrukturwissen der Schülerinnen und Schüler abbilden soll. Aufgrund der in der Erprobung mit Hilfe eines Pre-Post-Test-Design mit einer Interventions- und zwei Kontrollgruppen in drei siebten Klassen gewonnenen Ergebnisse wird gezeigt, dass das Testinstrument mit großer Wahrscheinlichkeit zur Messung von Bewertungskompetenz im Sinne des Göttinger Modells geeignet und im Physikunterricht einsetzbar ist.
Darüber hinaus liefert die Erprobung des Instruments Hinweise auf das Vorhandensein intuitiver Bewertungen bei Schülerinnen und Schülern und erlaubt Rückschlüsse auf Alltagsvorstellungen der Schülerinnen und Schüler in Bezug auf das in den Testaufgaben angesprochene Thema Energie.
Inhaltsverzeichnis
Zusammenfassung
Abstract
Inhaltsverzeichnis
Abbildungsverzeichnis
Tabellenverzeichnis
1 Einleitung
2 Theoretischer Rahmen
2.1 Der Kompetenzbegriff
2.2 Bewertungskompetenz als Ziel des naturwissenschaftlichen Unterrichts
2.3 Bewertungsstrukturwissen
2.4 Entscheidungspsychologische Grundlagen
2.4.1 Allgemeine Merkmale von Entscheidungsprozessen
2.4.2 Entscheidungsstrategien
2.4.3 Das Social Intuitionist Model als Zwei-Prozess-Modell
2.4.4 Zusammenfassender Überblick
2.5 Modellierung von Bewertungskompetenz
2.5.1 Ein Rahmenmodell für Entscheidungsprozesse
2.5.2 Das Modell der ethischen Urteilskompetenz
2.5.3 Das ESNaS-Modell
2.5.4 Das Göttinger Modell der Bewertungskompetenz
2.5.5 Vergleich der vorgestellten Modelle im Hinblick auf diese Arbeit
2.6 Testtheoretische Grundlagen
3 Methodisches Vorgehen
3.1 Untersuchungsdesign
3.2 Entwicklung des Erhebungsinstruments
3.3 Das Erhebungsinstrument
3.3.1 Die Planungsaufgaben
3.3.2 Die Entscheidungsaufgaben
3.3.3 Die Reflexionsaufgaben
3.3.4 Zusammenstellung der Aufgaben für die Untersuchung
3.4 Entwicklung der Interventionsstunde
4 Ergebnisse und Diskussion
4.1 Allgemeines
4.2 Beobachtung der Interventionsstunde
4.3 Kodierung der Testaufgaben
4.3.1 Antwortbeispiele
4.3.2 Ergebnisse der Mehrfachkodierung: Inter-Rater-Reliabilität
4.4 Pre- und Post-Test
4.4.1 Ergebnisse des Pre- und Post-Tests
4.4.2 Zeitbedarf zum Bearbeiten der Aufgaben
4.5 Äußerungen von Schülerinnen und Schülern
4.6 Weitere Ergebnisse
4.6.1 Hinweise auf intuitive Bewertungen
4.6.2 Rückschlüsse auf das Alltagsverständnis von Schülerinnen und Schülern
5 Beurteilung im Hinblick auf die Gütekriterien und Methodenkritische Reflexion
5.1 Objektivität
5.2 Reliabilität
5.3 Validität
5.4 Weitere Gütekriterien
5.5 Berechtigung der Förderung von Bewertungskompetenz
5.6 Methodenkritische Reflexion
6 Fazit und Ausblick
Literaturverzeichnis
Anhang
1 In der Untersuchung genutzte Aufgaben
1.1 Die Planungsaufgaben
1.2 Die Entscheidungsaufgaben
1.3 Die Reflexionsaufgaben
2 Kodierleitfäden
3 Arbeitsblatt zur Handybewertung
4 Ergebnisse der Mehrfachkodierung
5 Ergebnisse des Pre-Tests
6 Ergebnisse des Post-Tests
7 Gegenüberstellung von Pre- und Post-Test
Abbildungsverzeichnis
Abbildung 1: Unterteilung der eigentlich kontinuierlichen Kompetenzskala in diskrete Kompetenzniveaus.
Abbildung 2: Das Social Intuitionist Model von Haidt
Abbildung 3: Ein Rahmenmodell für Entscheidungsprozesse
Abbildung 4: Das allgemeine ESNaS-Kompetenzmodell
Abbildung 5: Das ESNaS-Kompetenzmodell der Bewertungskompetenz
Abbildung 6: Das Göttinger Modell der Bewertungskompetenz.
Abbildung 7: Aufbau der Untersuchung
Abbildung 8: Überblick über die Entwicklung des Instruments
Abbildung 9: Beispiel für eine Planungsaufgabe.
Abbildung 10: Beispiel für eine Entscheidungsaufgabe.
Abbildung 11: Aufgabenstamm bei der Reflexionsaufgabe „Apfelkauf".
Abbildung 12: Die non-kompensatorische Entscheidung von Ben.
Abbildung 13: Die kompensatorische Entscheidung von Sophie.
Abbildung 14: Überblick über die Ergebnisse der einzelnen Klassen.
Abbildung 15: Die im Mittel erreichten Punktzahlen bei den einzelnen Aufgaben.
Abbildung 16: Mittlere Punktzahl für die Planungsaufgabe.
Abbildung 17: Mittlere Punktzahl für die Entscheidungsaufgabe.
Abbildung 18: Mittlere Punktzahl für die Reflexionsaufgabe.
Abbildung 19: Der durchschnittliche Zeitbedarf
Abbildung 20: Ergebnisse des Zielscheiben-Feedbacks in Kontrollgruppe 2
Abbildung 21: Planungsaufgabe „Fahrt nach München“
Abbildung 22: Planungsaufgabe „Besuch in Frankfurt“
Abbildung 23: Entscheidungsaufgabe „Das neue Kraftwerk“
Abbildung 24: Entscheidungsaufgabe „Standort von Windenergieanlagen“
Abbildung 25: Aufgabenstamm der Reflexionsaufgabe „Apfelkauf“
Abbildung 26: Entscheidungswege bei der Reflexionsaufgabe „Apfelkauf“
Abbildung 27: Aufgabe 1 zur Reflexionsaufgabe „Apfelkauf“
Abbildung 28: Aufgaben 2 und 3 zur Reflexionsaufgabe „Apfelkauf“
Abbildung 29: Spontane Entscheidung bei der Reflexionsaufgabe „Apfelkauf“
Abbildung 30: Reflexionsaufgabe „Batterien für die neue Digitalkamera“
Abbildung 31: Entscheidungswege „Batterien für die neue Digitalkamera“
Abbildung 32: Aufgabe 1 bei der Reflexionsaufgabe „Batterien für die neue Digitalkamera“
Abbildung 33: Aufgaben 2 und 3 bei der Reflexionsaufgabe „Batterien für die neue Digitalkamera“
Abbildung 34: Die spontane Entscheidung bei der Reflexionsaufgabe „Batterien für die neue Digitalkamera“
Abbildung 35: Kodierleitfaden Item 1.1
Abbildung 36: Kodierleitfaden Item 1.2 und Item 1.3
Abbildung 37: Kodierleitfaden Item 2.1
Abbildung 38: Kodierleitfaden Items 2.2 und 2.3
Abbildung 39: Kodierleitfaden Item 3.1
Abbildung 40: Kodierleitfaden Item 3.2 und Item 3.3
Abbildung 41: Kodierleitfaden Item 3.4
Abbildung 42: Kodierleitfaden Item 3.5
Abbildung 43: Kodierleitfaden Item 3.6
Abbildung 44: Erste Seite des Arbeitsblatts der Interventionsstunde
Abbildung 45: Zweite Seite des Arbeitsblatts der Interventionsstunde
Abbildung 46: Dritte Seite des Arbeitsblatts der Interventionsstunde
Tabellenverzeichnis
Tabelle 1: Gegenüberstellung der Bildungsstandards zum Kompetenzbereich "Bewertung" der drei naturwissenschaftlichen Fächer.
Tabelle 2: Die Unterteilungen der Teilkompetenzen 1-2.
Tabelle 3: Die Unterteilungen der Teilkompetenzen Bewerten, Entscheiden, Reflektieren.
Tabelle 4: Die Unterteilungen der Teilkompetenz 3.
Tabelle 5: Scoring-Guide für die Planungsaufgaben
Tabelle 6: Verkürzter Kodierleitfaden für die Entscheidungsaufgaben
Tabelle 7: Verkürzter Kodierleitfaden für die Reflexionsaufgaben
Tabelle 8: Verlausplan der Interventionsstunde
Tabelle 9: Übersicht über die bei der Untersuchung berücksichtigten Fallzahlen
Tabelle 10: Berechnete κ-Koeffizienten für die Inter-Rater-Übereinstimmung
Tabelle 11: Ergebnisse der Mehrfachkodierung für Item 1.1
Tabelle 12: Ergebnisse der Mehrfachkodierung für Item 1.2
Tabelle 13: Ergebnisse der Mehrfachkodierung für Item 1.3
Tabelle 14: Ergebnisse der Mehrfachkodierung für Item 2.1
Tabelle 15: Ergebnisse der Mehrfachkodierung für Item 2.2
Tabelle 16: Ergebnisse der Mehrfachkodierung für Item 2.3
Tabelle 17: Ergebnisse der Mehrfachkodierung für Item 3.1
Tabelle 18: Ergebnisse der Mehrfachkodierung für Item 3.2
Tabelle 19: Ergebnisse der Mehrfachkodierung für Item 3.3
Tabelle 20: Ergebnisse der Mehrfachkodierung für Item 3.4
Tabelle 21: Ergebnisse der Mehrfachkodierung für Item 3.5
Tabelle 22: Ergebnisse der Mehrfachkodierung für Item 3.6
Tabelle 23: Ergebnisse des Pre-Tests der Interventionsklasse
Tabelle 24: Ergebnisse des Pre-Tests von Kontrollgruppe 1
Tabelle 25: Ergebnisse des Pre-Tests für Kontrollgruppe 2
Tabelle 26: Ergebnisse des Post-Tests der Interventionsgruppe.
Tabelle 27: Ergebnisse des Post-Tests von Kontrollgruppe 1
Tabelle 28: Ergebnisse des Post-Tests für Kontrollgruppe 2
Tabelle 29: Vergleich der Mittelwerte der einzelnen Klassen
Tabelle 30: Vergleich der Mittelwerte bei Aufgabe 1.
Tabelle 31: Vergleich der Mittelwerte bei Aufgabe 2
Tabelle 32: Vergleich der Mittelwerte bei Aufgabe 3
1 Einleitung
Unter anderem in Folge der Ergebnisse der Anfang dieses Jahrtausend publizierten PISA-Studie (P rogramme for I nternational S tudent A ssessment) (vgl. Baumert et al. 2001) wurde und wird in Deutschland verstärkt über die Qualität des bundesdeutschen Bildungssystems diskutiert (vgl. z.B. Ladenthin 2003). Auch in Folge dieses häufig so genannten „PISA-Schocks“ wurden die Ziele des schulischen Unterrichts neu formuliert. In den im Zuge der Reformbestrebungen neu entstandenen Bildungsstandards (vgl. Klieme et al. 2007) der naturwissenschaftlichen Fächer wird nun neben anderen explizit der Kompetenzbereich Bewertung aufgeführt. Hierdurch wird die Ausbildung von Bewertungskompetenz nicht mehr nur - wie bisher oftmals - zum impliziten Ziel des naturwissenschaftlichen Unterrichts, sondern nunmehr explizit gefordert (vgl. Kultusministerkonferenz 2005a, 2005b, 2005c).
Der Begriff der Bewertungskompetenz wird dabei jedoch weder von den Bildungsstandards der Fächer Physik, Chemie und Biologie noch in der fachdidaktischen Forschung einheitlich verstanden (vgl. Schecker & Höttecke 2007). Abseits von einem engen Begriffsverständnis als rein innerfachlichem Bewerten kann Bewertungskompetenz dabei auch weitergehend als eine Grundfertigkeit verstanden werden, die mündige Bürger zur aktiven Teilnahme am gesellschaftlichen und demokratischen Leben befähigt (vgl. Eilks, Hößle, Höttecke & Menthe 2011, S. 12).
Schülerinnen und Schüler kommen als zukünftige Staatsbürgerinnen und Staatsbürger immer wieder in die Situation, gesellschaftliche, politische und persönliche Entscheidungen zu fällen (oder sie durch ihr „Nicht-Entscheiden“ zu treffen) und gegenüber anderen zu rechtfertigen. Der naturwissenschaftliche Unterricht kann und soll hier einen bedeutenden Beitrag dazu leisten, dass Schülerinnen und Schülern diese aktive Teilhabe an der Gesellschaft ermöglicht wird (vgl. Bögeholz 2011). Ferner kann die Ausbildung von Bewertungskompetenz als Beitrag zu einer naturwissenschaftlichen Grundbildung verstanden werden (vgl. Gräber & Nentwig 2002) und eine Bildung für nachhaltige Entwicklung weiter fördern (vgl. De Hahn et al. 2008).
Bewertungskompetenz ist - so verstanden - nicht nur im gesellschaftlich-politischen und direkt naturwissenschaftlichen Handlungsfeld nötig. Vielmehr ist sie auch in diversen Berufen schlicht unabdingbar. Viele Berufsgruppen sind, weit abseits klassisch naturwissenschaftlicher Berufe, mit der Notwendigkeit konfrontiert, reflektierte Entscheidungen zu treffen (vgl. Jungermann, Pfister & Fischer 2010, S.2). Hierzu wird Bewertungskompetenz und das damit verbundene Bewertungsstrukturwissen, also Wissen um die Komplexität von Entscheidungssituationen und das Wissen um bestimmte Strategien, benötigt, um mit ethisch und faktisch schwierigen Urteilen und Entscheidungen umzugehen. Bewertungskompetenz und die Rolle von Bewertungsstrukturwissen sind in der Physikdidaktik allerdings bisher nur wenig erforscht. Es fehlen beispielsweise erprobte Instrumente zur Kompetenzmessung.
Ziel dieser Arbeit ist es daher zum einen, aufbauend auf vorhandenen Kompetenzmodellen, ein Erhebungsinstrument zur Messung eines Teilbereichs von Bewertungskompetenz zu entwickeln. Zudem soll es auch in der Schule einsetzbar sein. Die Aufgaben des Instruments sollen dabei auch der Überprüfung dienen, inwieweit die Schülerinnen und Schüler über Bewertungsstrukturwissen, also Wissen über Bewertungsprozesse, verfügen. Zum anderen wird das im Rahmen dieser Arbeit entwickelte Erhebungsinstrument erprobt und hinsichtlich seiner Eignung zur Erhebung von Bewertungskompetenz überprüft. Hierzu wurde eine Interventionsstunde entwickelt und durchgeführt sowie das Instrument in einem Pre-Post-Test-Design mit Kontrollgruppen erprobt. Somit steht zukünftig ein im Schulalltag nutzbares Instrument zur Verfügung, um einerseits explorativ die Bewertungskompetenz einer Klasse besser zu beurteilen und andererseits die Wirksamkeit bestimmter Unterrichtssequenzen zu untersuchen. Die Arbeit ist dabei wie folgt gegliedert:
Zu Beginn werden in Kapitel 2 die zu Grunde liegenden Begriffe der Kompetenz, der Bewertungskompetenz und des Bewertungsstrukturwissens näher definiert.
Danach werden einige Grundlagen der Entscheidungspsychologie kurz zusammengefasst, da die anschließend vorgestellten Kompetenzmodelle von Bewertungskompetenz auf diesem Wissen aufbauen. Schließlich werden noch einige testtheoretische Grundlagen umrissen, die zur Beurteilung des Erhebungsinstruments hinsichtlich seiner Eignung zur Messung von Bewertungskompetenz von Bedeutung sind.
In Kapitel 3 wird zunächst die Planung der zur Überprüfung des Testinstruments durchgeführten Untersuchung geschildert und daran anschließend die Entstehung des Instruments und das Testinstrument selbst mit dem zugehörigen Auswertungsleitfaden näher beschrieben. Schließlich wird in diesem Kapitel auch die Planung der im Rahmen der Untersuchung durchgeführten Interventionsstunde vorgestellt und begründet.
Die Ergebnisse der Untersuchung werden in Kapitel 4 präsentiert und diskutiert. Hierzu werden zunächst Beobachtungen während der Interventionsstunde geschildert, da diese für die weitere Interpretation bedeutsam sind. Darauf aufbauend wird der Auswertungsleitfaden durch Antwortbeispiele aus der Erprobung und weitere Erläuterungen ergänzt und die Inter-Rater-Übereinstimmung quantitativ überprüft. Es folgen die Ergebnisse des Pre- und Post-Tests. Schließlich werden einige Äußerungen von Schülerinnen und Schülern geschildert, die in einer Klasse als Feedback erhoben wurden. Den Abschluss dieses Kapitels bilden weitere Ergebnisse, die sich im Rahmen der Auswertung der Tests ergaben.
In Kapitel 5 wird das Erhebungsinstrument auf den in Kapitel 4 geschilderten Ergebnissen aufbauend im Hinblick auf die in Kapitel 2 bereits vorgestellten Gütekriterien untersucht. Außerdem erfolgt in diesem Kapitel eine methodenkritische Reflexion der durchgeführten Untersuchung.
Das abschließende Kapitel 6 soll einen zusammenfassenden Überblick über die Ergebnisse und den daraus abgeleiteten weiteren Forschungsbedarf geben. Im Anhang finden sich schlussendlich neben allen im Rahmen dieser Arbeit entwickelten Aufgaben nebst Auswertungsleitfaden die quantitativen Ergebnisse der Erprobung.
2 Theoretischer Rahmen
Ausgehend vom Kompetenzbegriff soll erläutert werden, was unter dem Terminus der Bewertungskompetenz verstanden wird und inwieweit die Förderung von Bewertungskompetenz ein Ziel des naturwissenschaftlichen Unterrichts ist. Ebenfalls wird der Begriff des Bewertungsstrukturwissens definiert und kurz in den Zusammenhang dieser Arbeit eingeordnet.
Darauf aufbauend erfolgt die Vorstellung einiger Grundlagen der Entscheidungspsychologie, da diese zum Verständnis der anschließend erläuterten Kompetenzmodelle, welche Bewertungskompetenz weiter ausschärfen, benötigt werden. Den Abschluss dieses Kapitels bilden einige testtheoretische Grundlagen, anhand derer das im Rahmen dieser Arbeit entwickelte Testinstrument später hinsichtlich seiner Eignung zur Messung von Bewertungskompetenz beurteilt werden soll.
2.1 Der Kompetenzbegriff
Der Kompetenzbegriff wird seit Anfang der 1970er Jahre, mittlerweile also seit mehr als 40 Jahren, im deutschsprachigen erziehungswissenschaftlichen Diskurs verwendet (vgl. Hartig & Klieme 2006; Klieme & Hartig 2008). Dabei ist jedoch festzustellen, dass der Begriff keinesfalls einheitlich gebraucht wird (vgl. Gnahs 2010).
Zunächst wurde Kompetenz in Sach-, Methoden- und Sozialkompetenz unterteilt und der Begriff somit weiter ausgeschärft (vgl. Klieme & Hartig 2008). Dabei leitet sich Kompetenz allgemein vom lateinischen „competentia“ her, was mit „Zusammentreffen“ übersetzt werden kann. Das entsprechende lateinische Adjektiv „competens“ bedeutet so viel wie „angemessen“ (vgl. Gnahs 2010). Kompetenz zeigt sich daher, vom Wortstamm ausgehend darin, dass die Fähigkeiten einer Person mit einer passenden Situation zusammentreffen und diese Situation aufgrund dieser Fähigkeiten erfolgreich bewältigt werden kann.
Es wurden mehrere Versuche unternommen, Kompetenz näher zu definieren. Sehr einflussreich in der deutschen Erziehungswissenschaft ist dabei die Definition von Weinert geworden. Dieser versteht unter Kompetenz
„die bei Individuen verfügbaren oder durch sie erlernbaren kognitiven Fähigkeiten und Fertigkeiten, um bestimmte Probleme zu lösen, sowie die damit verbundenen motivationalen, volitionalen und sozialen Bereitschaften und Fähigkeiten um die Problemlösungen in variablen Situationen erfolgreich und verantwortungsvoll nutzen zu können“ (Weinert 2001, S. 27–28) .
Kompetenzen sind also prinzipiell erlernbar, weshalb ihre Förderung zu einem möglichen Ziel pädagogischer Prozesse wird. Sie sind, im Gegensatz zu reinem Wissen, problembezogen und haben neben dem reinen Wissen und Können auch eine Selbststeuerungskomponente (vgl. Klieme & Hartig 2008). Sie sind bereichsspezifisch, das bedeutet an ein bestimmtes Problem und einen begrenzten Sektor gebunden. Trotzdem sind Kompetenzen prinzipiell auf andere, ähnlich strukturierte Probleme übertragbar (vgl. Hartig & Klieme 2006). Mit der zunehmenden Kompetenzorientierung des deutschen Bildungssystems ist zugleich eine Verschiebung der Steuerung desselben weg von einer Input- hin zu einer Output-Orientierung verbunden. Das letztliche Ziel von Bildung ist also der kompetente, mündige Bürger (vgl. Klieme 2004; Klieme & Hartig 2008). So verstandenen sind Kompetenzen Merkmale der Persönlichkeit.
Manche Autoren, vor allem aus früheren, sozialwissenschaftlichen Werken, unterscheiden diese Kompetenz im eigentlichen Sinne von der Performanz (vgl. Gnahs 2010). Letztere ist das tatsächlich von einer Person in einer bestimmten Situation gezeigte Verhalten, das unter anderem (aber nicht nur) durch die Kompetenz bestimmt wird. Die Performanz wäre somit Messungen zugänglich und erlaubte anhand mehrfacher Messungen Rückschlüsse auf die Kompetenz. Diese Unterscheidung ist in den Erziehungswissenschaften allerdings eher unüblich. Hartig und Klieme (2006) weisen aber auch im pädagogischen Diskurs auf die geringe Aussagekraft einmaliger Messungen hin. Durch die (einmalige) Messung der Performanz ist es nur schwer möglich, Aussagen über die Kompetenz einer bestimmten Person zu treffen. Klieme und Hartig betonen daher, dass Messinstrumente für Kompetenz immer eine „Palette von Einzelbeobachtungen bei unterschiedlichen Aufgaben bzw. in variierenden Situationen“ (Klieme & Hartig 2008, S. 24) ermöglichen müssen.
Kompetenz ist zwar dem Konstrukt der Intelligenz ähnlich, aber doch mit diesem nicht deckungsgleich. Sie unterscheiden sich zum einen in der Kontextualisierung. So sind Kompetenzen bereichsspezifisch gedacht und eher auf bekannte Bereiche bezogen, wohingegen Intelligenz als generalisierte Personeneigenschaft zu verstehen ist, die der Person die Bewältigung unbekannter Probleme erleichtert. Kompetenzen sind, im Gegensatz zu Intelligenz, prinzipiell erlernbar. Schließlich unterscheiden sich die beiden Konzepte in Bezug auf ihre Binnenstrukturen. Während Intelligenz vor allem durch die zu Grunde liegenden Strukturen der jeweiligen Person (genetischer Pool, Sozialisation u.a.) definiert wird, geschieht dies bei Kompetenz durch die spezifischen Anforderungen einer konkreten Situation (vgl. zur Unterscheidung von Kompetenz und Intelligenz Hartig & Klieme 2006).
Im Rahmen der Entwicklung der Bildungsstandards (vgl. Klieme et al. 2007) wird häufig ein auf kognitive Fähigkeiten fokussierter Kompetenzbegriff benutzt. So definieren Hartig und Klieme Kompetenzen als „kontextspezifische kognitive Leistungsdispositionen, die sich funktional auf bestimmte Klassen von Situationen beziehen“ (Hartig & Klieme 2006, S. 128). Ein derart auf kognitive Fähigkeiten verengter Kompetenzbegriff sei besser messbar (vgl. Hartig & Klieme 2006) und wird daher auch dieser Arbeit zu Grunde gelegt. Diese Definition von Kompetenz stellt jedoch eine Einschränkung dar und blendet andere, vor allem auch für Bewertungskompetenz wichtige motivationale, volitionale und soziale Komponenten von Kompetenz aus (vgl. die obige Definition von Weinert (2001)).
Um Kompetenz, ausgehend von der jeweiligen Definition des Begriffs, messbar zu machen, werden Kompetenzmodelle benötigt. Diese sollen einerseits Teildimensionen der jeweiligen Kompetenz unterscheiden (sog. Kompetenzstrukturmodelle) und andererseits Aussagen über verschiedene Ausprägungen der (Teil-)Kompetenzen treffen (sog. Kompetenzniveaumodelle) (vgl. Klieme 2004; Hartig & Klieme 2006). Kompetenzstrukturmodelle nutzen u.a. Faktorenanalysen, um Teildimensionen zu identifizieren, wohingegen Kompetenzniveaumodelle v.a. mit der Item-Response-Theorie arbeiten, die Personenfähigkeiten und Aufgabenschwierigkeiten auf einer gemeinsamen Skala abbilden (vgl. Hartig & Klieme 2006). Die so gewonnenen Kompetenzniveaus stellen allerdings oftmals eine mehr oder weniger willkürliche Diskretisierung eines Kontinuums dar, auf dem sich verschiedene Kompetenz einordnen lässt. Dieses Vorgehen ist schematisch in Abbildung 1 dargestellt.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Unterteilung der eigentlich kontinuierlichen Kompetenzskala in diskrete Kompetenzniveaus. Abbildung in Anlehnung an Hartig und Klieme (2006, S. 135).
Kompetenzmodelle sollten zum einen theoriegeleitet erstellt, zum anderen aber auch immer wieder empirisch überprüft werden (vgl. Klieme 2004). Es sei bei den meisten zurzeit vorhandenen Modellen unklar, ob die postulierten Niveaus eine Entwicklung oder einfach nur verschiedene Ausprägungen von Kompetenz beschrieben (vgl. Klieme 2004).
2.2 Bewertungskompetenz als Ziel des naturwissenschaftlichen Unterrichts
Die Bildungsstandards aller naturwissenschaftlichen Fächer (Kultusministerkonferenz 2005a, 2005b, 2005c) weisen neben den Kompetenzbereichen Fachwissen, Erkenntnisgewinnung und Kommunikation explizit auch den Kompetenzbereich Bewertung aus. In den Bildungsstandards für das Fach Physik wird hierbei beispielhaft unter Bewertung folgendes verstanden:
„Physikalische Sachverhalte in verschiedenen Kontexten erkennen und bewerten [sowie] [d]as Heranziehen physikalischer Denkmethoden und Erkenntnisse zur Erläuterung, zum Verständnis und zur Bewertung physikalisch-technischer und gesellschaftlicher Entscheidungen“ (Kultusministerkonferenz 2005c, S. 10).
Für dieses Konzept gibt es in der englischsprachigen Literatur kein vollständig deckungsgleiches Konstrukt (vgl. Hostenbach et al. 2011, S. 262). Konzeptuell ähnlich sind jedoch die sogenannten Socio Scientific Issues (SSI) und das damit verbundene Treffen von Entscheidungen (decision making). Somit wird im anglo-amerikanischen Sprachraum auch von decision making competence gesprochen (vgl. Eggert & Bögeholz 2006, S. 183). SSI sind hierbei komplexe, der Alltagswelt entlehnte Fragestellungen, die ethisch-moralisch aufgeladen sind sowie Schülerinnen und Schülern Raum für Entscheidungsprozesse und die Entwicklung von Reflexionsfähigkeit bieten (vgl. Zeidler et al. 2009, S. 74).
Ebenfalls ist im Sinne einer Bildung für nachhaltige Entwicklung, die als Leitbild auch den naturwissenschaftlichen Fachunterricht mit bestimmen sollte (vgl. Kultusministerkonferenz & Deutsche UNESCO-Kommission 2007), Bewertungskompetenz eine zentrale Fähigkeit zur Teilhabe an der nachhaltigen Entwicklung unserer Gesellschaft (vgl. Bögeholz 2011, S. 32). Im Rahmen der Bildung für nachhaltige Entwicklung kann unter Bewertungskompetenz die
„Fähigkeit, sich in komplexen Problemsituationen begründet und systematisch bei unterschiedlichen Handlungsoptionen zu entscheiden, um kompetent am gesellschaftlichen Diskurs um die Gestaltung von Nachhaltiger Entwicklung teilhaben zu können“ (Bögeholz 2011, S. 32)
verstanden werden. Bewertungskompetenz ist in diesem Sinne also eine notwendige, allein aber nicht hinreichende Fähigkeit, die Menschen zur aktiven Teilnahme am gesellschaftlichen Leben befähigt. Insbesondere müssen derart kompetente Bürgerinnen und Bürger in der Lage sein, sich begründet zu verschiedensten Themen zu positionieren. Da viele politisch diskutierte Fragestellungen unter anderem naturwissenschaftlich-technisches Wissen berühren, wird die Ausbildung von Bewertungskompetenz zu einem wichtigen Ziel schulischer Bildung und somit insbesondere ein Ziel des naturwissenschaftlichen Unterrichts.
Folgerichtig findet sich in den Bildungsstandards (Kultusministerkonferenz 2005a, 2005b, 2005c) für den mittleren Schulabschluss für alle naturwissenschaftlichen Fächer der Kompetenzbereich Bewertung. In den Bildungsstandards der Fächer Physik, Chemie und Biologie wird der Begriff jedoch – trotz der eingangs erwähnten ähnlichen Grunddefinition - sehr unterschiedlich verstanden (vgl. Höttecke & Mrochen 2010). Eine Gegenüberstellung der dem Kompetenzbereich Bewertung zugeordneten Kompetenzen findet sich in Tabelle 1.
Vor allem in den Bildungsstandards des Faches Physik wird Bewertung eher als innerfachliches Bewerten, beispielsweise der Güte von Messdaten verstanden. Weder die Bildungsstandards der Chemie noch diejenigen der Physik berücksichtigen, im Gegensatz zu den Bildungsstandards der Biologie, explizit den Einbezug relevanter Werte und Normen. Wohl aber berücksichtigen sowohl die Chemie- als auch die Physikstandards das Leitbild der nachhaltigen Entwicklung (vgl. Bögeholz 2011, S. 33). Diese Berücksichtigung wird beispielhaft am Standard B2 (Physik) deutlich, in dem die sogenannten drei Sphären nachhaltiger Entwicklung direkt angesprochen werden oder am Standard B5 (Chemie), in dem die Betrachtung gesellschaftlich wichtiger Sachverhalte unter verschiedenen Perspektiven gefordert wird.
Tabelle 1: Gegenüberstellung der Bildungsstandards zum Kompetenzbereich „Bewertung“ der drei naturwissenschaftlichen Fächer. Darstellung verändert übernommen von Hostenbach et al. (2011). Die einzelnen Standards sind den Bildungsstandards für den mittleren Schulabschluss entnommen (Kultusministerkonferenz 2005c, 2005b, 2005a).
Abbildung in dieser Leseprobe nicht enthalten
Andere Autoren definieren Bewertungskompetenz als „ theoretische Reflexionsfähigkeit “ (Reitschert & Hößle 2007, S. 126) oder durch das Gewichten von Zielen (vgl. Mayer et al. 2004, S. 172) und durch das Abwägen unter Berücksichtigung relevanter Wertvorstellungen (vgl. Rost 2002, S. 8). Einen anderen Weg gehen Eilks et al. (2011, S. 7), wenn sie funktional feststellen: Bewertungskompetenz „ ermöglicht in gesellschaftlichen Kontroversen […] reflektierte Teilhabe an Diskursen und Entscheidungen “.
Eine ähnliche Begriffsbestimmung nimmt auch Bögeholz (2011) vor, wenn sie schreibt, dass „Bewertungskompetenz erforderlich ist in Problemsituationen, die in der Regel nicht eine richtige Lösung aufweisen, Wertentscheidungen erfordern, mehrere gleich legitime Handlungsoptionen aufweisen und durch unsicheres Wissen gekennzeichnet sind“ (Bögeholz 2011, S. 34).
Zusammenfassend lässt sich bei Durchsicht der oben genannten Definitionen als Konsens festhalten, dass Bewertungskompetenz als eine für die reflektierte Teilhabe am gesellschaftlichen Diskurs notwendige Fähigkeit aufgefasst werden muss und die Förderung von Bewertungskompetenz somit legitimes Ziel von naturwissenschaftlicher Bildung ist. Dabei müssen zum einen innerfachliche Bewertungen vorgenommen werden, zum anderen aber auch in komplexen, durch unsicheres Wissen gekennzeichneten Situationen Entscheidungen getroffen und reflektiert werden. Hierzu ist es notwendig, Entscheidungen nicht nur im Hinblick auf ihren naturwissenschaftlichen Kern, sondern vielmehr auch im Hinblick auf ethische Implikationen zu treffen. Hinzu kommt, dass oftmals eine Gewichtung unterschiedlicher, miteinander konkurrierender Ziele erforderlich ist. In diesem Sinne wird Bewertungskompetenz im Rahmen dieser Arbeit verstanden.
2.3 Bewertungsstrukturwissen
Bewertungsstrukturwissen bezeichnet ein Wissen über die Struktur von Bewertungs- und Entscheidungssituationen. Bögeholz et al. (2004) verstehen unter Bewertungsstrukturwissen daher
„ein Strategiewissen über Verfahren zur Bewertung von Handlungsoptionen. Es umfasst z. B. Kompetenzen zur Auswahl, Gewichtung und Verknüpfung von Entscheidungskriterien. Bewertungsstrukturwissen ist erforderlich, um mit der doppelten Komplexität – bestehend aus faktischer und ethischer Komplexität – umzugehen, die vielen Gestaltungsaufgaben Nachhaltiger Entwicklung zu Grunde liegt“ (Bögeholz et al. 2004, S. 101, Hervorhebung H.S.).
Bögeholz et al. (2004) zählen zu diesem Meta-Wissen also sowohl Verfahren zur Bewertung, die denen später in Kapitel 2.4.2 beschriebenen Entscheidungsregeln weitestgehend entsprechen, als auch Kompetenzen zur Generierung und Gewichtung geeigneter Auswahlkriterien.
Eggert und Bögeholz (2006, S. 191) machen unter anderem fehlendes Bewertungsstrukturwissen dafür verantwortlich, dass Schülerinnen und Schüler oftmals Schwierigkeiten mit systematischen Entscheidungsprozessen haben und daher in Situationen, in denen inhaltlich wie ethisch komplexe Entscheidungen getroffen werden müssen, häufig intuitiv-rechtfertigend entscheiden. Höhere Niveaus in Modellen zur Bewertungskompetenz (siehe Kapitel 2.5) zeichnen sich daher in der Regel durch größeres Meta-Wissen über Bewertungsprozesse, also letztlich durch vermehrtes Bewertungsstrukturwissen aus.
Ausgehend von der oben zitierten Definition von Bögeholz et al. (2004) kann unter Bewertungsstrukturwissen aber auch das Wissen um den oftmals intuitiven Charakter von alltäglichen, vor allem moralischen Entscheidungsprozessen, wie sie Haidt (2001) beschreibt, verstanden werden. Auf die von Haidt (2001) geschilderten Prozesse wird in Kapitel 2.4.3 dieser Arbeit näher eingegangen. Wissen die Schülerinnen und Schüler um die Chancen und Risiken intuitiver Entscheidungen, so liegt die Annahme nahe, dass sie sich situativ reflektierend in bestimmten Situationen ganz bewusst für komplexe Bewertungsverfahren entscheiden und in anderen nicht. Diese Dimension von Bewertungsstrukturwissen und Bewertungskompetenz wird zurzeit allerdings von keinem der in Kapitel 2.5 vorgestellten Modelle erfasst. Bewertungsstrukturwissen in der eingangs erläuterten, engeren Sichtweise als Kenntnis der für Entscheidungsprozesse notwendigen Entscheidungsstrategien und Strategien im Umgang mit Unsicherheit und konkurrierenden Werten ist hingegen vor allem im später vorgestellten Göttinger Modell geradezu Kennzeichen stark ausgeprägter Bewertungskompetenz (vgl. Bögeholz 2006).
2.4 Entscheidungspsychologische Grundlagen
In diesem Abschnitt stehen einerseits Merkmale von Entscheidungssituationen und die beim bewussten Entscheiden möglichen Entscheidungsstrategien im Mittelpunkt. Andererseits soll auch das Social Intuitionist Model von Haidt (2001) kurz vorgestellt werden als Möglichkeit, auch intuitive Entscheidungen theoretisch zu erfassen.
2.4.1 Allgemeine Merkmale von Entscheidungsprozessen
In vielen Situationen haben Menschen mehrere Handlungsmöglichkeiten. Eine solche, eher alltägliche Handlungsmöglichkeit ist beispielsweise der Kauf eines bestimmten Brotaufstrichs im Supermarkt: Der Käufer kann entweder überhaupt keinen Brotaufstrich kaufen, Marmelade oder z.B. auch Aufschnitt kaufen. Er hat somit mehrere Möglichkeiten zu handeln. Diese verschiedenen Handlungsmöglichkeiten werden in der Entscheidungspsychologie auch als Optionen bezeichnet (vgl. Jungermann, Pfister & Fischer 2010, S. 3). Optionen können also einerseits konkrete Objekte sein, zwischen denen eine Entscheidung getroffen werden muss, andererseits aber auch Handlungen, die in einer bestimmten Situation denkbar sind oder längerfristige Strategien, die eher allgemeine Handlungsziele symbolisieren (vgl. Jungermann, Pfister & Fischer 2010, S. 19f).
Stehen mehrere - also mindestens zwei - Optionen in einer bestimmten Situation zur Auswahl, so wird von einer Entscheidungssituation gesprochen. Die Entscheidung als solche, also die Wahl einer bestimmten Option, zeigt sich durch verbale Äußerungen der bzw. des Entscheidenden oder aber ist durch sein bzw. ihr Handeln direkt beobachtbar (vgl. Jungermann, Pfister & Fischer 2010, S. 3).
Es ist wichtig festzuhalten, dass Entscheidungen nicht in jedem Fall bewusst getroffen werden. Dies bedeutet zum einen, dass eine Entscheidungssituation nicht immer als solche auch dem Entscheider bewusst ist (vgl. Jungermann, Pfister & Fischer 2010, S. 3). Zum anderen heißt das aber auch, dass viele Entscheidungen oftmals intuitiv getroffen und erst, wie Haidt (2001) ausführte, post-hoc gerechtfertigt werden, wenn die Begründung einer Entscheidung verlangt wird.
Jede Option ist nach Jungermann, Pfister & Fischer (2010) wiederum durch verschiedene Konsequenzen (die auch als Ergebnisse oder Folgen der Option bezeichnet werden) gekennzeichnet. Konsequenzen sind dabei die durch die Wahl einer Option zu erwartenden Folgen. Eine Entscheidung wird häufig - aber nicht immer - im Hinblick auf die Konsequenzen einer Option getroffen. Sind Konsequenzen multidimensional, bestehen also nicht z.B. allein daraus „viel oder wenig Geld bei einer Lotterie einzunehmen“, so spricht man auch von den Attributen einer Entscheidung. Ein Attribut ist dabei als eine Art Merkmal zu verstehen, dass eine Option besitzt. Ein solches Attribut wäre beispielsweise der „Preis“ eines Autos. Welche Attribute ein Entscheider als wichtig ansieht, wird vor allem durch seine Ziele, also beispielsweise durch persönliche Wertvorstellungen, bestimmt (vgl. Jungermann, Pfister & Fischer 2010, S. 22f).
Ereignisse haben, genau wie Zustände, einen Einfluss auf die Entscheidung. Ereignisse sind hierbei als Vorkommnisse zu verstehen, die außerhalb des Einflussbereichs des Entscheiders liegen und die Zukunft betreffen. Zustände hingegen sind bereits eingetretene Ereignisse, die der Entscheider jedoch zum Zeitpunkt der Entscheidung noch nicht kennt (vgl. Jungermann, Pfister & Fischer 2010, S. 21).
Ein Prozessmodell für Entscheidungsprozesse wird später in Kapitel 2.5.1 vorgestellt. Nach Menthe (2006) haben über die (objektiven) Zustände hinaus auch nicht thematisierte Einstellungen, Werte und Erfahrungen einen großen Einfluss auf das letztliche Urteil.
2.4.2 Entscheidungsstrategien
Wird eine komplexe Entscheidung bewusst getroffen, so setzen Entscheiderinnen und Entscheider meist bestimmte Regeln für die Entscheidungsfindung ein. Dabei wird davon ausgegangen, dass alle Optionen der Entscheidungssituation bekannt sind, ebenso die dazugehörigen Attribute sowie die Wichtigkeit der Attribute für den Entscheider oder die Entscheiderin. Dies ist in realen Situationen nur selten der Fall. Die Regeln beschreiben unter diesen Umständen die Art des Auswahlprozesses (vgl. Jungermann, Pfister & Fischer 2010, S.120).
Zunächst lassen sich non-kompensatorische und kompensatorische Regeln voneinander unterscheiden: Bei den non-kompensatorischen Regeln wird eine Option nicht ausgewählt, weil bestimmte Schwellenwerte (sog. cut-offs) auf einem Attribut überschritten werden. Hierbei lassen sich weiter Schwellen- und Eliminationsregeln unterscheiden (vgl. Jungermann, Pfister & Fischer 2010, S.120ff):
- Schwellenregeln . Die Entscheidung wird getroffen, indem bestimmte cut-offs für einzelne Attribute bekannt sind und die Optionen im Hinblick auf die Ausprägung des jeweiligen Attributs verglichen werden. Bei der Konjunktionsregel müssen alle cut-offs zugleich erfüllt sein. Dabei kann es passieren, dass keine – oder aber auch mehrere – Optionen gewählt werden. Nutzt der Entscheider die Disjunktionsregel, so muss mindestens ein Schwellenwert überschritten werden. Ebenfalls in diese Gruppe von Entscheidungsregeln lässt sich die Satisficing-Regel nach Simon (vgl. Betsch, Funke & Plessner 2011, S. 102) einordnen. Simon geht davon aus, dass Menschen oftmals nicht alle Optionen prüfen, sondern sich für die erste von ihnen untersuchte Option entscheiden, die sie zufrieden stellt, die also beispielsweise einen bestimmten Schwellenwert überschreitet (vgl. Jungermann, Pfister & Fischer 2010, S. 121).
- Eliminationsregeln . Die Entscheidung wird getroffen, indem die Wichtigkeit der einzelnen Attribute berücksichtigt wird. Bei der lexikographischen Regel (LEX-Regel) werden die Attribute nach Wichtigkeit geordnet und dann die Option gewählt, die auf dem wichtigsten Attribut die beste Ausprägung besitzt. Führt dies zu keiner eindeutigen Entscheidung, so wird das nächst wichtigere Attribut untersucht und so fort. Die EBA-Regel (Elimination-By-Aspects-Regel) ist dagegen stochastisch: Es wird ein zufällig ausgewähltes Attribut bei allen Optionen verglichen, wobei die Wahrscheinlichkeit dafür, dass ein bestimmtes Attribut zum Vergleich ausgewählt wird, proportional zur Wichtigkeit des jeweiligen Attributs ist (vgl. Jungermann, Pfister & Fischer 2010, S. 122).
Kompensatorische Regeln integrieren hingegen schlechte und gute Ausprägungen einer Option auf unterschiedlichen Attributen zu einem Gesamturteil, wobei gute Ausprägungen auf einem Attribut schlechte Ausprägungen auf einem anderen kompensieren können. Hierbei sind ebenfalls verschiedene Regeln zu unterschieden (vgl. Jungermann, Pfister & Fischer 2010, S. 123ff):
- Deterministische Regeln . Bei ihnen führt die wiederholte Anwendung der Regel immer zum gleichen Ergebnis. Besonders hervorzuheben ist in dieser Gruppe die sogenannte MAU-Regel (Multi-Attribute-Utility). Es wird von einer Entscheidungssituation ausgegangen, bei der alle Optionen mit allen relevanten Attributen präzise beschrieben sind und der Entscheider allen Attributen eine Wichtigkeit zuordnen kann. Dann wird für jede Option der Gesamtnutzen MAUi bestimmt. Hierzu wird die Wichtigkeit wj eines Attributs mit dem Partialnutzen uij, also der subjektiven Bewertung der Ausprägung des jeweiligen Attributs, multipliziert und aufsummiert:
Die Option mit dem höchsten Gesamtnutzen wird ausgewählt. Bei der Anwendung dieser Regel sorgt der mathematische Formalismus dafür, dass eine schlechte Ausprägung uij auf einem Attribut durch eine gute Ausprägung auf einem anderen kompensiert werden kann. Mit anderen Worten: der Entscheider wägt ab, er nutzt sogenannte trade-offs (vgl. ).
- Stochastische Regeln . Bei dieser Klasse von Regeln kann eine wiederholte Anwendung der jeweiligen Entscheidungsregel zu verschiedenen Ergebnissen führen. Es wird meist ein Attribut stochastisch ausgewählt, wobei die Auswahlwahrscheinlichkeit proportional zur Wichtigkeit des Attributs ist. Es werden dann z.B. – nach der Criterion Dependent Choice-Regel (CDC-Regel) – Differenzen zwischen Optionen basierend auf den ausgewählten Attributen berechnet. Dies wird solange wiederholt, bis die Gesamtdifferenz zweier Optionen einen bestimmten Schwellenwert überschreitet (vgl. Jungermann, Pfister & Fischer 2010, S. 127–129).
Es existieren weitere Regeln, die bei der Konstruktion der Aufgaben im Rahmen dieser Arbeit keine Rolle spielten. Diese werden deshalb an dieser Stelle nicht näher erläutert, aber beispielsweise von Jungermann, Pfister & Fischer (2010, S. 129) beschrieben.
2.4.3 Das Social Intuitionist Model als Zwei-Prozess-Modell
Zur theoretischen Beschreibung moralischer Entscheidungen kann das Model von Haidt (2001) herangezogen werden. Im sogenannten Social Intuitionist Model wird nicht das rationale Entscheiden betont, wie es oben beschrieben wurde, sondern vielmehr die intuitive Komponente von Entscheidungen sowie ihre Einbettung in soziale Kontexte.
Haidt (2001) geht davon aus, dass moralische Urteile meist intuitiv getroffen und erst, falls notwendig, im Nachhinein (post-hoc) gerechtfertigt werden. Er widerspricht hiermit rein rationalen Modellen, die davon ausgehen, dass systematische, rationale Urteilsprozesse dem eigentlichen Urteil vorgelagert sind. Das Model ist im Kern ein Zwei-Prozess-Modell, unterscheidet also zwischen dem schnellen, automatisch ablaufenden, eher unbewussten intuitiven System und dem langsam arbeitenden, kognitiv zugänglichen und somit kontrollierbaren reflektierenden System (vgl. Dittmer & Gebhard 2012). Das Modell von Haidt (2001) ist in Abbildung 2 skizziert und soll nun kurz erläutert werden. Dabei verweisen die im folgenden Text in Klammern genannten Nummern auf die entsprechenden Nummern in der Abbildung.
Haidt (2001) postuliert, dass moralische Entscheidungen zunächst intuitiv anhand von Heuristiken getroffen werden (1) und das intuitiv gefällte Urteil einen direkten Einfluss auf die Art der Argumentation und der Rechtfertigung des eigenen Urteils hat (2). Die intuitiv gefällte Entscheidung wird somit post-hoc gerechtfertigt. Durch die (daher meist post-hoc durchgeführte) Argumentation können in einem diskursiven Prozess die intuitiven Urteile anderer Menschen beeinflusst werden (3), da bei ihnen durch die Argumentation selbst Assoziationen und intuitive Urteile hervorgerufen werden. Ähnliches gilt für die Beeinflussung der Intuition anderer durch das Urteil an sich (4), da unser eigenes Urteil häufig mit dem Urteil unserer sozialen Gruppe identisch ist (Haidt (2001) nennt dies social persuasion).
Ebenfalls möglich, aber nicht mehr die einzige Form der Entscheidungsfindung wie in rein rationalistischen Modellen, ist das Bewerten durch Nachdenken (5) (vgl. Dittmer & Gebhard 2012). Hierbei werden in kritischer Distanz zur eigenen Intuition Argumente gegeneinander abgewogen und so ein Urteil konstruiert. Dies wird von Dittmer und Gebhard (2012) als kognitiv aufwändig beschrieben, wenngleich die kritische Distanz „ in der abendländischen Kultur ein hohes Gut und konstitutiver Bestandteil von Wissenschaft und Bildung “ (Dittmer & Gebhard 2012, S. 90) sei. Somit ist dieser Prozess der Ansatzpunkt der meisten gegenwärtigen didaktischen Modelle von Bewertungskompetenz (siehe Kapitel 2.5). Der innere Dialog (6) beschreibt schließlich, dass durch Perspektivwechsel, kognitive Konflikte sowie durch rationale Überlegungen in seltenen Fällen eine Veränderung der ursprünglichen Intuitionen stattfinden kann. Intuitionen sind demnach in gewissem Maße veränderbar.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Das Social Intuitionist Model von Haidt. Grafik verändert nach Haidt (2001) und Dittmer und Gebhard (2012).
Bewertungen werden nach Haidt (2001) also immer zumindest auch durch Intuitionen beeinflusst. Dies sei, Dittmer und Gebhard (2012) zufolge, „ Ausdruck unserer mentalen Konstitution “ (ebd., S. 91). Durch die Förderung von Perspektivenübernahme und die soziale Einbettung von Entscheidungssituationen im schulischen Kontext könnten nach Dittmer und Gebhard (2012) Intuitionen allerdings langfristig verändert und die eigene Haltung hin zu einer besseren Reflexionsfähigkeit eigener Entscheidungsprozesse weiterentwickelt werden (vgl. Dittmer & Gebhard 2012, S. 91).
2.4.4 Zusammenfassender Überblick
Haidt (2001) geht davon aus, dass viele Entscheidungen holistisch-intuitiv getroffen und erst post-hoc begründet werden. Die klassische Entscheidungsforschung hingegen postuliert einen rein rationalen Entscheider, der verschiedene Optionen im Hinblick auf ihren Nutzen auf unterschiedliche Art und Weise bewertet. Letzteres schließt das Modell von Haidt zwar nicht aus, weist aber darauf hin, dass solche rational getroffenen Entscheidungen eher die Ausnahme als die Regel darstellen und bei der Analyse von Entscheidungen auch soziale Faktoren wie die Bewertungen anderer Mitglieder der Peer-Group berücksichtigt werden müssen.
Die meisten Modelle von Bewertungskompetenz betonen derzeit die Fähigkeit, systematisch rationale, bewusste Entscheidungen zu treffen und dabei entsprechende Entscheidungsstrategien zu verwenden. Dittmer und Gebhard (2012) kritisieren dies und schlagen mit Blick auf die Berücksichtigung der intuitiven Vorstellungen die Förderung einer Haltung der moralischen Nachdenklichkeit vor, also letztlich eine Förderung von Reflexionsfähigkeit und Perspektivenübernahme.
2.5 Modellierung von Bewertungskompetenz
Es wurden verschiedene Versuche unternommen, auf entscheidungspsychologischen Untersuchungen aufbauend, Kompetenzmodelle für Bewertungskompetenz zu entwickeln. Die meisten Vorschläge stammen dabei aus der Biologiedidaktik, wie beispielsweise das Göttinger Modell der Bewertungskompetenz (vgl. Eggert & Bögeholz 2006; Bögeholz 2007, 2011) oder das Modell der ethischen Urteilskompetenz (vgl. Reitschert & Hößle 2007). Im Rahmen der Überprüfung der Nationalen Bildungsstandards wurde zudem von Hostenbach et al. (2011) ein alle naturwissenschaftlichen Fächer umfassendes Kompetenzstrukturmodell vorgeschlagen, das sogenannte ESNaS-Modell der Bewertungskompetenz.
Da die genannten Modelle auf einem Rahmenmodell von Entscheidungsprozessen nach Betsch, Funke & Plessner (2011) aufbauen, wird übersichtshalber zunächst das Rahmenmodell näher vorgestellt. Dem schließt sich eine Erläuterung der oben bereits genannten eigentlichen Modelle der Bewertungskompetenz an. Am Ende dieses Abschnitts stehen der kritische Vergleich der vorgestellten Modelle und ihre Einordnung in den Kontext dieser Arbeit.
2.5.1 Ein Rahmenmodell für Entscheidungsprozesse
Im Gegensatz zum Urteilen, bei dem das Urteil als das Endprodukt eines psychologischen Prozesses verstanden werden kann, geht es bei Entscheidungen um die (systematische) Wahl zwischen mehreren Optionen unter Berücksichtigung möglicher Konsequenzen (vgl. Betsch, Funke & Plessner 2011, S. 13). So wird unter dem Terminus Entscheiden folgendes Verstanden:
„Entscheiden (»decision making«) ist der Prozess des Wählens zwischen mindestens zwei Optionen, mit dem Ziel, erwünschte Konsequenzen zu erreichen und unerwünschte Konsequenzen zu vermeiden. Der Prozess führt im günstigen Fall zu einer Entscheidung (Wahl). Durch die Entscheidung wird eine Option selektiert und der Entschluss gebildet, diese zu realisieren, z. B. eine Handlung auszuführen“ (Betsch, Funke & Plessner 2011, S. 68).
Entscheidungen sind dementsprechend also als Prozesse zu verstehen, die sowohl das Beurteilen von Optionen, deren Wahl als auch (unter Umständen) die Umsetzung der gewählten Option beinhalten (vgl. Jungermann, Pfister & Fischer 2010, S. 4). Viele Autoren, z.B. Jungermann, Pfister & Fischer (2010), zählen darüber hinaus das Erkennen einer Entscheidungssituation als solche und das damit verbundene Konstruieren von Optionen zum Entscheidungsprozess selbst hinzu.
Um Entscheidungen im Allgemeinen näher zu untersuchen, schlagen Betsch, Funke & Plessner (2011) ein Rahmenmodell für Entscheidungsprozesse vor, das in Abbildung 3 skizziert ist.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3: Ein Rahmenmodell für Entscheidungsprozesse. Grafik verändert nach Betsch, Funke & Plessner (2011, S. 75)
Das Modell unterscheidet im Kern drei Phasen eines Entscheidungsprozesses (vgl.
Betsch, Funke & Plessner 2011, S. 75ff):
1. Die präselektionale Phase, in der zunächst eine Entscheidungssituation als solche identifiziert wird und daraufhin mögliche Optionen durch den Entscheider bzw. die Entscheiderin generiert werden. Um diese Optionen näher zu charakterisieren ist oftmals das Einholen weiterer Informationen notwendig. In dieser Phase sind also all diejenigen Teilprozesse von Entscheidungen verortet, die vor der eigentlichen Bewertung von Optionen und der Auswahl einer von ihnen stattfinden.
2. Die selektionale Phase, in der die eigentliche Bewertung und Entscheidung stattfindet. Verschiedene Optionen werden anhand von Attributen bewertet und ein Handlungsentschluss gefasst. Das Entscheidungsverhalten von Personen kann gut mit psychologischen Theorien wie der Prospect-Theorie erklärt werden (vgl.
Betsch, Funke & Plessner 2011), solange die Entscheidungssituation vollständig ist, d.h. alle Optionen mit allen Konsequenzen bekannt sind. Findet die Entscheidung bewusst statt (und wird nicht intuitiv-rechtfertigend entschieden), wenden Entscheider in dieser Phase spezifische Entscheidungsregeln an (kompensatorische, non-kompensatorische und Mischungen der eben genannten, siehe Kapitel 2.4.2).
3. Die postselektionale Phase umfasst schließlich die der eigentlichen Entscheidung folgenden Prozesse. Dazu zählt unter Umständen die Umsetzung der gewählten Option, falls dies im spezifischen Fall möglich und nötig ist. Außerdem finden hier verschiedene Lernprozesse statt, die über das Gedächtnis vermittelt zukünftige Entscheidungen in allen Teilen des Entscheidungsprozesses beeinflussen.
Die genannten Phasen beschreiben, so Betsch, Funke & Plessner (2010), bedeutende Teilprozesse von Entscheidungen. Das Rahmenmodell könne somit als Raster zur genaueren Analyse verschiedener Entscheidungen und Entscheidungstheorien dienen (vgl.
Betsch, Funke & Plessner 2011, S. 75).
2.5.2 Das Modell der ethischen Urteilskompetenz
Das Modell der ethischen Urteilskompetenz wurde im Rahmen der biologiedidaktischen Forschung in der Arbeitsgruppe von Reitschert & Hößle (2007) entwickelt. In diesem Modell wird Bewertungskompetenz als „theoretische Reflexionsfähigkeit“ (Reitschert & Hößle 2007, S. 126) verstanden. Es fokussiert also aus einer forschungsmethodischen Perspektive heraus auf eine kognitive Definition von Bewertungskompetenz (vgl. Reitschert & Hößle 2007).
Bei der theoretischen Konzeption des Modells wurden neben Befunden zur Bewertungskompetenz aus der biologiedidaktischen Forschung auch Modelle der Philosophiedidaktik berücksichtigt (vgl. Hostenbach et al. 2011). Das Modell identifiziert insgesamt acht Teilkomponenten von Bewertungskompetenz (vgl. Reitschert & Hößle 2007, S. 127):
1. Beim Wahrnehmen und Bewusstmachen moralisch-ethischer Relevanz geht es um die Teilkompetenz, ein moralisch-ethisches Problem als solches zu erkennen, es kognitiv zu fassen und den daraus folgenden Entscheidungsbedarf als gegeben anzuerkennen.
2. Wahrnehmen und Bewusstmachen der Quellen der eigenen Einstellung. Die Quellen der eigenen Einstellung sollen bewusst gemacht werden, indem beispielsweise relevante soziale und sozialisatorische Einflüsse erkannt werden.
3. Folgenreflexion beschreibt die Fähigkeit, mögliche Folgen einer Entscheidung im Vorfeld der Entscheidung zu erkennen und abzuschätzen.
4. Beurteilen. Das erkannte Problem soll hinsichtlich eine Rolle spielender Fakten, aber auch hinsichtlich beteiligter Werte und Normen beurteilt werden.
5. Das Ethische Basiswissen zielt auf die Fähigkeit ab, Werte, Normen und Moral begrifflich zu unterscheiden und ihre Bedeutung für den Urteilsprozess einzuschätzen.
6. Urteilen/Schlussfolgern. Hierbei wird „ der Mut und die Fähigkeit angesprochen, ein eigenes reflektiertes und begründetes Urteil zu fällen “ (Reitschert & Hößle 2007, S. 127).
7. Die Teilkomponente Argumentieren meint die Fähigkeit, einen sinnvollen Argumentationsgang aufzubauen und diesen zu verbalisieren.
8. Der Perspektivwechsel beschreibt schließlich die Fähigkeit, Argumente anderer Personen nachzuvollziehen und somit das vorhandene Problem auch aus anderen Perspektiven heraus zu betrachten.
Das Argumentieren und der Perspektivwechsel werden dabei als nicht von den anderen Fähigkeiten zu trennend angesehen (vgl. Hostenbach et al. 2011, S. 271).
Die hier vorgestellten Teilkomponenten von Bewertungskompetenz wurden weitergehend in jeweils drei Niveaustufen unterteilt (vgl. Reitschert & Hößle 2007), die sich durch zunehmende Perspektivübernahme und Komplexität der kognitiven Prozesse von einer Nicht-Anwendung der entsprechenden Kompetenz hin zur reflektierten Anwendung selbiger erstrecken (vgl. Hostenbach et al. 2011, S. 127).
2.5.3 Das ESNaS-Modell
Im Rahmen der Evaluation der Standards in den Naturwissenschaften für die Sekundarstufe 1 (ESNaS) wurde ein Modell zur Beschreibung des Kompetenzbereichs Bewertung der Bildungsstandards entwickelt (vgl. Hostenbach et al. 2011). Das ESNaS-Kompetenzmodell der Bewertungskompetenz basiert dabei auf dem der Evaluation der Bildungsstandards in den Naturwissenschaften zu Grunde liegenden allgemeinen Kompetenzmodell (vgl. Kauertz et al. 2010). Dieses wurde wiederum auf Basis des ursprünglich den Bildungsstandards zu Grunde liegenden Kompetenzmodells entwickelt (vgl. zu diesem ursprünglichen Modell Schecker 2007).
Das ursprünglich den Bildungsstandards zu Grunde liegende Modell unterscheidet neben den Kompetenzbereichen Fachwissen, Erkenntnisgewinnung, Kommunikation und Bewertung drei Anforderungsbereiche (Wiedergabe, Anwendung, Transfer). Eine weitere Differenzierung im Hinblick auf die vier Basiskonzepte des Physikunterrichts (Energie, Materie, Wechselwirkung, System) komplettiert die Verortung von Aufgaben in diesem dreidimensionalen Kompetenzmodell (vgl. Schecker 2007). Die Kompetenzmodelle der drei naturwissenschaftlichen Fächer unterscheiden sich dabei nur in ihren Basiskonzepten. Es lassen sich somit für jeden Kompetenzbereich verschiedene Anforderungsniveaus unterscheiden. Diese verschiedenen Anforderungsstufen werden oftmals als Kompetenzmatrix mit den Dimensionen Kompetenzbereich und Anforderungsbereich dargestellt (vgl. Schecker 2007).
Da das oben geschilderte, normativ orientierte Kompetenzmodell nicht trennscharf sei (vgl. Kauertz et al. 2010, S. 139) und somit zur Evaluation der Bildungsstandards nur bedingt geeignet, wird für die Evaluation ein verändertes Modell zu Grunde gelegt. Die Dimension Kompetenzbereich wird darin beibehalten und die einzelnen Kompetenzbereiche werden jeweils weiter untergliedert. Als die Schwierigkeit einer Aufgabe beschreibende Merkmale werden Komplexität und kognitive Prozesse als weitere Dimensionen definiert und für jeden Kompetenzbereich modelliert (vgl. Abbildung 4) (vgl. Kauertz et al. 2010).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 4: Das der Evaluation der Bildungsstandards zu Grunde liegende dreidimensionale Kompetenzmodell. Grafik verändert nach Kauertz et al. (2010, S. 145)
Die Dimension Komplexität wird bei diesem allgemeinen ESNaS-Model in insgesamt fünf Niveaustufen unterteilt, die sich durch zunehmende Verknüpfung von Fakten auszeichnen. Die Dimension Kognitive Prozesse unterscheidet insgesamt vier verschiedene Prozesse mit ansteigender Komplexität (reproduzieren, selegieren, organisieren, integrieren) (vgl. Kauertz et al. 2010).
Das ESNaS-Modell der Bewertungskompetenz (vgl. Hostenbach et al. 2011) konkretisiert nun den Kompetenzbereich Bewertung des soeben vorgestellten Kompetenzmodells und identifiziert zunächst drei Teilbereiche von Bewertungskompetenz, die an verschiedenen Stellen des Bewertungsprozesses verortet sind:
- Bewertungskriterien: Die Bewertungssituation als solche und mögliche Bewertungskriterien müssen von den Schülern erkannt und erschlossen werden. Dieser Teilbereich entspricht im Wesentlichen der präselektionalen Phase des Rahmenmodells. Er umfasst somit das Zusammentragen von relevanten (naturwissenschaftlichen) Fakten, Normen und Werten. Insgesamt sei in dieser Teilkompetenz der Sach- und Fachbezug von Bewertungskompetenz am stärksten ausgeprägt (vgl. Hostenbach et al. 2011, S. 276).
- Handlungsoptionen: Hier sind das Generieren möglicher Handlungsoptionen sowie das eigentliche Bewerten, u.U. mit passenden Bewertungsstrategien, angesiedelt. Ebenfalls gehören die Fähigkeit des Abschätzens möglicher Konsequenzen der einzelnen Optionen und der Einbezug multipler Perspektiven bei der Bewertung und Entscheidung in diesen Teilbereich. Er entspricht also Teilen der präselektionalen Phase sowie der selektionalen Phase des Rahmenmodells (vgl. Hostenbach et al. 2011, S. 276).
- Reflexion: Vorgegebene Bewertungssituationen oder selbst durchgeführte Bewertungsprozesse werden post-hoc reflektiert. Dieser Teilbereich bezieht sich also auf die Reflexionsfähigkeit in Bezug auf bereits erfolgte Entscheidungen. Er entspricht somit vor allem Aspekten der postselektionalen Phase des Rahmenmodells (vgl. Hostenbach et al. 2011, S. 277).
Die Autoren unterscheiden für jede Entscheidungssituation weiterhin verschiedene Aspekte. So könne eine Aufgabe den Fokus entweder auf persönliche, gesellschaftliche oder aber ethische Aspekte legen. Diese würden aber nicht als die Schwierigkeit einer Aufgabe bestimmende Merkmale angesehen (vgl. Hostenbach et al. 2011).
Die drei oben beschriebenen Teilbereiche bilden im ESNaS-Modell eine Dimension der Klassifizierung von Aufgaben zur Bewertungskompetenz. Gemeinsam mit den die Schwierigkeit einer Handlung (also letztlich das Kompetenzniveau) beschreibenden Dimensionen kognitive Prozesse und Komplexität bilden sie den dreidimensionalen Raum der Bewertungskompetenz. In diesen Raum lassen sich Aufgaben einordnen, wobei sich entsprechend viele Möglichkeiten durch Kombination der drei Dimensionen ergeben. Personen können anhand der von ihnen gelösten Aufgaben schließlich einem Kompetenzniveau zugeordnet werden.
Die Dimension Komplexität wird dabei für den Kompetenzbereich Bewertung weiter ausdifferenziert. Die fünf Stufen des allgemeinen Modells, die für jede der drei Teilkompetenzen durch ansteigende Komplexität gekennzeichnet sind, werden so für jede Teilkompetenz konkretisiert. Sie lauten beispielhaft für die Teilkompetenz Bewertungskriterien (vgl. Hostenbach et al. 2011, S. 280):
1. Berücksichtigung eines Bewertungskriteriums.
2. Berücksichtigung von zwei Bewertungskriterien.
3. Berücksichtigung eines Zusammenhangs zwischen zwei Kriterien.
4. Berücksichtigung von zwei Zusammenhängen zwischen mindestens zwei Kriterien.
5. Berücksichtigung eines übergeordneten Konzepts bzw. die Analyse eines Bewertungsprozesses.
Die Dimension kognitive Prozesse entspricht im Wesentlichem dem eingangs geschilderten allgemeinen Modell nach Kauertz et al. (2010). Eine Übersicht über das dreidimensionale ESnAS-Modell der Bewertungskompetenz gibt Abbildung 5.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 5: Das ESNaS-Kompetenzmodell der Bewertungskompetenz. Grafik verändert nach Hostenbach et al. (2011, S. 273).
Bei der Modellierung von Bewertungskompetenz verzichtet das ESNaS-Modell auf Doppelkodierungen. Aus diesem Grund werden Bereiche wie das Generieren und Reflektieren von Sachinformationen des Göttinger Modells (s.u.) oder das Argumentieren im Modell von Reitschert (s.o.) nicht der Bewertungskompetenz im Sinne des ESNaS-Modells zugeordnet (vgl. Hostenbach et al. 2011, S. 274).
2.5.4 Das Göttinger Modell der Bewertungskompetenz
Das Göttinger Modell der Bewertungskompetenz (vgl. Eggert & Bögeholz 2006; Bögeholz 2007, 2011) wurde im Rahmen der biologiedidaktischen Forschung v.a. an der Universität Göttingen entwickelt. Es ist speziell auf den Kontext der nachhaltigen Entwicklung ausgerichtet und identifiziert - zunächst theoriegeleitet - Teilkompetenzen von Bewertungskompetenz und beschreibt für diese jeweils verschiedene Niveaustufen (vgl. Bögeholz 2007). Mittlerweile liegt zumindest für eine Teilkompetenz - Bewerten, Entscheiden und Reflektieren - auch eine empirische Überprüfung vor (vgl. Eggert & Bögeholz 2010).
Das Göttinger Modell (vgl. Abbildung 6) beinhaltet vier Teilkompetenzen von Bewertungskompetenz, die jeweils in vier Niveaustufen unterteilt werden (vgl. Eggert & Bögeholz 2006):
a) Kennen und Verstehen von Werten und Normen
b) Kennen und Verstehen von Nachhaltiger Entwicklung
c) Generieren und Reflektieren von Sachinformationen
d) Bewerten, Entscheiden und Reflektieren
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 6: Das Göttinger Modell der Bewertungskompetenz. Abbildung angelehnt an Bögeholz (2007). Vertikal sind die vier Teilkompetenzen dargestellt. Rechts sind symbolisch die vier Niveaustufen jeder Teilkompetenz angedeutet.
Die beiden Teilkompetenzen Kennen und Verstehen von Werten und Normen und Kennen und Verstehen von Nachhaltiger Entwicklung werden von den Autoren selbst zuweilen zusammengefasst (z.B. in Bögeholz 2011). Die Trennung in zwei verschiedene Teilkompetenzen ermögliche es jedoch, das Modell für andere Kontexte aufzubereiten und so auch für Entscheidungsprozesse jenseits der Nachhaltigen Entwicklung fruchtbar zu machen (vgl. Bögeholz 2007). Im Rahmen der vorliegenden Ausarbeitung soll die Trennung daher ebenfalls beibehalten werden.
Die erste Teilkompetenz – Kennen und Verstehen von Werten und Normen – umfasst vor allem ethisches Basiswissen und den Umgang mit diesem. So beinhaltet sie beispielsweise die Fähigkeit, Werte und Normen einerseits und (naturwissenschaftliches) Faktenwissen andererseits klar voneinander zu unterscheiden (vgl. Eggert & Bögeholz 2006). Diese Unterscheidung sei notwendig, um „normative Entscheidungen zu erkennen und zu reflektieren“ (Eggert & Bögeholz 2006, S. 190). Weiterhin umfasst diese Teilkompetenz das Wissen um das Wesen von Werten und Normen. Hiermit ist vor allem gemeint, dass diese Produkt eines gesellschaftlichen Aushandlungsprozesses sind und somit prinzipiell vorläufig und – einen gesellschaftlichen Konsens vorausgesetzt – auch veränderbar sind (vgl. Eggert & Bögeholz 2006).
Das Kennen und Verstehen von Nachhaltiger Entwicklung umfasst nicht nur das Kennen einer Begriffsdefinition des Konzepts der Nachhaltigen Entwicklung, sondern auch ein Verständnis der zentralen Zusammenhänge wie der gleichzeitigen Beachtung ökologischer, ökonomischer und sozialer Implikationen von Entscheidungsprozessen, den sogenannten drei Sphären der nachhaltigen Entwicklung. Darüber hinaus geht es in dieser Teilkompetenz um die Konzepte der intra- und intergenerationellen Gerechtigkeit. Erstere beinhaltet eine gerechte Verteilung von z.B. Reichtum, Ressourcen und Wissen zwischen den zurzeit lebenden Menschen, während letztere auch die Interessen zukünftiger Generationen berücksichtigt (vgl. Eggert & Bögeholz 2006). Die beiden eben beschrieben Teilkompetenzen bilden eine Art Rahmen für Entscheidungsprozesse und werden in allen Schritten der Entscheidung berücksichtigt.
Die Teilkompetenz Generieren und Reflektieren von Sachinformationen umfasst zentrale Aspekte der präselektionalen Phase im zuvor beschriebenen Rahmenmodell (vgl. Eggert & Bögeholz 2006). Sie beinhaltet Fähigkeiten, die zur Aufbereitung der eigentlichen Entscheidung notwendig sind. Zunächst ist dies das Erkennen einer Entscheidungssituation als solcher, weiterhin das Erheben für die Entscheidung notwendiger Daten, deren sachgerechte Aufbereitung und schließlich die daraus resultierende Beschreibung aller Aspekte der möglichen Handlungsoptionen (vgl. Bögeholz 2011). Hierbei spielen sowohl naturwissenschaftliche als auch andere „Daten“ im weiteren Sinne, wie Werte und Normen, eine Rolle. In diese Phase fällt auch die methoden- und quellenkritische Reflexion der gewonnen Informationen und die insgesamt daraus resultierende Beschreibung der Konsequenzen der einzelnen Optionen (vgl. Eggert & Bögeholz 2006).
Die beim Generieren und Reflektieren von Sachinformationen eine starke Rolle spielenden Daten sollen im Rahmen des Göttinger Modells in mehrerer Hinsicht kritisch reflektiert werden. Hier sind vor allem die Reflexion unter dem Gesichtspunkt der Qualität der Daten, eine Quellenkritik bezogen auf die Herkunft selbiger sowie die Reflexion des Modellcharakters des generierten Handlungsmodells zu nennen (vgl. Eggert & Bögeholz 2006).
Die vierte Teilkompetenz – Bewerten, Entscheiden und Reflektieren – entspricht in weiten Teilen der selektionalen Phase des Rahmenmodells. Sie beschreibt die einzelnen Prozesse, die schließlich zur Auswahl einer der zur Diskussion stehenden Optionen führen. Das Modell legt Wert darauf, dass gerade in komplexen, gesellschaftlich und persönlich wichtigen Entscheidungssituationen intuitiv, post-hoc rechtfertigendes Entscheidungsverhalten, wie es Haidt (2001) beschreibt, aus einer didaktischen Perspektive heraus nicht ausreicht (vgl. Bögeholz 2007).
Stattdessen wird die Anwendung verschiedener Entscheidungsstrategien wie die Nutzung von cut-off-Kriterien, also das Ausschließen einzelner Optionen bei Überschreiten eines kritischen Wertes auf einem Attribut, oder das Abwägen verschiedener Kriterien gegeneinander (trade-off) beschrieben. Schließlich wird in dieser Teilkompetenz die kritische Reflexion der Gewichtung einzelner Normen und Werte dargestellt (vgl. Eggert & Bögeholz 2006). Um nach dem Göttinger Modell große Bewertungskompetenz zu besitzen, sei es geradezu notwendig, systematische Entscheidungsstrategien und Wissen um die Rahmenbedingungen – kurz also Bewertungsstrukturwissen – zu besitzen (vgl. Eggert & Bögeholz 2006).
Alle genannten Teilkompetenzen werden in Niveaustufen unterteilt, wobei zunehmende Kompetenz im Allgemeinen durch ein Ansteigen der Komplexität der in Betracht gezogenen Fakten, Werte und Normen sowie durch einen höheren kognitiven Aufwand gekennzeichnet sind. Die Unterteilung der Teilkompetenzen 1 und 2 ist überblicksartig in Tabelle 2 dargestellt.
Tabelle 2: Die Unterteilungen der Teilkompetenzen 1-2 des Göttinger Modells. Darstellung verändert übernommen von Bögeholz (2007, S. 215).
Abbildung in dieser Leseprobe nicht enthalten
Die Niveaustufen der Teilkompetenz Bewerten, Entscheiden und Reflektieren wurden empirisch überprüft und sind im Wesentlichen konsistent mit der theoretischen Annahmen. Die von Eggert und Bögeholz (2010) vorgeschlagene Unterteilung der Teilkompetenz auf einer eindimensionalen Skala ist also plausibel, da das Rasch-Partial-Credit Modell auf die Antworten der untersuchten Stichprobe passte und somit konsistent mit dem hier vorgestellten theoretischen Modell erklärt werden kann (vgl. Eggert & Bögeholz 2010). Die Unterteilung dieser Teilkompetenz ist in Tabelle 3 vorgestellt. Insgesamt wird zunehmende Kompetenz also im Göttinger Modell durch die zunehmende Nutzung kompensatorischer Entscheidungsstrategien und einen zunehmend reflektierteren Umgang mit diesen Strategien deutlich. Kurz gesagt handelt es sich hierbei damit eine Zunahme des Bewertungsstrukturwissens auf den höheren Kompetenzniveaus.
Tabelle 3: Die Unterteilungen der Teilkompetenzen „Bewerten, Entscheiden, Reflektieren“. Verändert nach Bögeholz (2007, S. 216).
Abbildung in dieser Leseprobe nicht enthalten
Die Teilkompetenz Generieren und Reflektieren von Sachinformationen wurde von Gausmann et al. (2010) untersucht. Sie schlagen auf Basis einer Studie mit verschiedenen Aufgabenformaten ein Rahmenmodell für diese Teilkompetenz vor, um verschiedene Aufgaben darin zu verorten. Außerdem präzisieren sie die von Bögeholz (2007) vorgeschlagene Graduierung. Diese wurde bisher allerdings nicht empirisch überprüft (vgl. Gausmann et al. 2010). Sowohl der Vorschlag von Gausmann et al. (2010) als auch der ursprüngliche Vorschlag von Bögeholz (2007) sind in Tabelle 4 gegenübergestellt.
Tabelle 4: Die Unterteilungen der Teilkompetenz 3. Verändert übernommen aus Bögeholz (2007, S. 215) und Gausmann et al. (2010, S. 214).
Abbildung in dieser Leseprobe nicht enthalten
2.5.5 Vergleich der vorgestellten Modelle im Hinblick auf diese Arbeit
Keines der vorgestellten Modelle wurde speziell für die Physikdidaktik entwickelt: Das Modell der ethischen Bewertungskompetenz von Reitschert & Hößle (2007) sowie das Göttinger Modell von Eggert & Bögeholz (2006) entstammen der Biologiedidaktik und wurden speziell für den Kontext bioethischer Fragestellungen bzw. der nachhaltigen Entwicklung ausgearbeitet. Das ESNaS-Kompetenzmodell von Hostenbach et al. (2011) wurde hingegen explizit für alle naturwissenschaftlichen Fächer mit der Zielsetzung einer empirischen Überprüfung der Bildungsstandards entwickelt.
Vor allem das ESNaS-Modell ist eher deskriptiv. Es dient zur Festlegung und der Identifikation von Aufgabenschwierigkeiten und grenzt Bewertungskompetenz stark von Teilkompetenzen wie der Argumentationsfähigkeit ab, da diese im Rahmen der Bildungsstandards anderen Kompetenzbereichen zugeordnet werden.
Im Gegensatz zum ESNaS-Modell können die anderen genannten Modelle als Grundlage für die Planung und Gestaltung von Unterricht dienen. Sie betrachten die jeweils identifizierten Teilkompetenzen nicht als vollständig unabhängig voneinander, vielmehr werden in auf diesen Modellen basierenden Aufgaben meist mehrere Teilkompetenzen zugleich gefordert.
Besonders das Modell der ethischen Bewertungskompetenz und das Göttinger Modell betonen die Notwendigkeit der Reflexion der eigenen Werte und der Perspektivübernahme. Im ESNaS-Modell der Bewertungskompetenz wird hingegen die Teilkompetenz Reflexion eher als post-hoc-Reflexion bereits erfolgter Entscheidungen verstanden. Reflexionen haben hier also keinen direkten Einfluss auf den Bewertungsprozess als solchen, sondern sind diesem eher im Sinne der post-selektionalen Phase nachgelagert.
Allen Modellen ist gemeinsam, dass sich höhere Kompetenz durch eine größere Komplexität, d.h. vermehrt zur Wahl stehende Optionen mit mehr Attributen und mehr konkurrierenden Zielen und Wertvorstellungen sowie die Nutzung kognitiv aufwändigerer Entscheidungsstrategien, auszeichnet. In jedem von ihnen wurde Urteilen als eigene Teilkompetenz identifiziert. Es ist also plausibel anzunehmen, dass ein größeres Repertoire an Entscheidungsstrategien und somit (zumindest unbewusst vorhandenes) großes Bewertungsstrukturwissen ein höheres Kompetenzniveau kennzeichnet.
Alle vorgestellten Kompetenzmodelle gehen von einem kognitiven Kompetenzbegriff aus und fokussieren von diesem Standpunkt her auf rationale Entscheidungsmodelle. Wie Haidt (2001) jedoch zeigte und oben erläutert wurde können nicht alle Entscheidungsprozesse mit der Annahme eines vollständig rationalen Entscheiders erklärt werden. Vielmehr spielen holistisch-intuitive Bewertungen und post-hoc-Reflexionen eine Rolle. Dieser Umstand wird in keinem der hier vorgestellten Modelle berücksichtigt. Somit blenden zurzeit gängige Kompetenzmodelle von Bewertungskompetenz nicht-rationale, intuitive Entscheidungsprozesse und die explizite Reflexion über diesen Umstand größtenteils aus. Hier bestünde daher eine eventuelle Perspektive zur Weiterentwicklung der Modelle.
Für den Kontext dieser Arbeit ist vor allem das Göttinger Modell der Bewertungskompetenz relevant, da auf diesem die in Kapitel 3 entwickelten Aufgaben und der Auswertungsleitfaden basieren. Hauptsächlich soll das im Rahmen dieser Arbeit entwickelte Testinstrument die Teilkompetenz Bewerten, Entscheiden und Reflektieren des Göttinger Modells abbilden. Da diese Teilkompetenz in allen vorgestellten Modellen ähnlich verstanden wird, lassen sich die Aufgaben allerdings auch in diesen Modellen verorten.
In allen Modellen zeichnen sich höhere Kompetenzniveaus zudem durch eine erhöhte Berücksichtigung von Komplexität aus. Die in später Kapitel 3 vorgestellten Aufgaben enthalten sehr komplexe Informationen. Die Zuordnung einer Antwort auf die Aufgaben zu einem bestimmten Niveau bestimmt sich dabei nicht nach der Schwierigkeit der Aufgabe, sondern im Wesentlichen nach der Komplexität der Antwort. Dieses Vorgehen ist zwar nicht von allen vorgestellten Modellen so intendiert, lässt sich aber doch mit ihnen in Einklang bringen.
2.6 Testtheoretische Grundlagen
Die Testtheorie ist die wissenschaftliche Theorie über sogenannte psychologische Tests, also Testinstrumente, die ein bestimmtes, psychisches Persönlichkeitsmerkmal erfassen sollen. Diese Theorie stellt einen Zusammenhang zwischen dem Verhalten einer Untersuchungsperson im psychologischen Test und dem jeweils untersuchten Personenmerkmal her (vgl. Rost 2004, S. 21). Zudem nennt die (klassische) Testtheorie einige Gütekriterien für psychologische Testinstrumente. Dies sind vor allem die Kriterien Objektivität, Validität und Reliabilität (vgl. Rost 2004, S. 33). Daneben existieren auch weitere Gütekriterien wie Skalierung, Normierung, Testökonomie, Nützlichkeit, Zumutbarkeit, Unverfälschbarkeit und Fairness (vgl. Moosbrugger & Kelava 2012, S. 8). Da das im Rahmen dieser Arbeit entwickelte Testinstrument vor allem hinsichtlich der drei Hauptkriterien Objektivität, Validität und Reliabilität beurteilt werden soll, werden diese ausführlicher erläutert und die weiteren Kriterien anschließend kurz umrissen.
Die Objektivität beschreibt, inwieweit das mit Hilfe eines bestimmten Tests ermittelte Ergebnis unabhängig von äußeren Einflüssen ist. Da psychologische Testinstrumente im Hinblick auf ein latentes Personenmerkmal konstruiert werden, sollten Einflüsse auf das Testergebnis, die nicht auf dieses Merkmal zurückzuführen sind, möglichst minimiert werden (vgl. Rost 2004, S. 33). Der Begriff der Objektivität kann dabei auf den Testleiter bezogen werden (Durchführungsobjektivität). So sollte das Ergebnis unabhängig davon sein, wer als Testleiter bzw. Testleiterin fungiert (vgl. Rost 2004, S. 39). Daher sollten verbale Interaktionen zwischen untersuchten Personen und dem Testleiter soweit wie möglich unterbleiben und alle zur Lösung der Aufgaben notwendigen Anweisungen möglichst in schriftlicher Form vorhanden sein (vgl. Moosbrugger & Kelava 2012, S. 9). Des Weiteren sollte der Test im Hinblick auf den Auswertenden (Auswertungsobjektivität) und den Interpreten des Tests (Interpretationsobjektivität) objektiv sein, d.h. verschiedene Auswerter bzw. Interpreten des Ergebnisses sollten zu gleichen Ergebnissen kommen. Dies macht vor allem das Vorhandensein eines detaillierten Auswertungsmanuals nötig (vgl. Moosbrugger & Kelava 2012, S. 9). Schließlich sollte ein Test auch von allen anderen äußeren Einflüssen möglichst unabhängig sein, beispielsweise von der Itemauswahl (spezifische Objektivität) (vgl. Rost 2004, S. 40).
Reliabilität oder Zuverlässigkeit eines Tests beschreibt, wie genau ein Test etwas misst. Die Reliabilität beschreibt also die Messgenauigkeit („wie genau der Test das misst, was er misst“ (Rost 2004, S. 33)). Ergebnisse mit sehr großer Reliabilität sind arm an zufälligen Fehlern, können jedoch systematische Fehler enthalten. Reliabilität beschreibt in diesem Sinne also, wie groß der Anteil der Personenunterschiede an der gesamten Varianz der Messwerte ist (vgl. Rost 2004, S. 39). Zur Bestimmung der Reliabilität eines Tests werden verschiedene Verfahren unterschieden (vgl. Moosbrugger & Kelava 2012, S. 12):
- Retest-Reliabilität. Hierbei wird überprüft, ob bei einem erneuten Test derselben Person mit dem gleichen Test vergleichbare Ergebnisse erzielt werden. Diesem Ansatz liegt die idealisierte Annahme zu Grunde, dass sich das zu messende Merkmal zwischen den beiden Testungen nicht verändert hat. Aus dem Maß der Übereinstimmung zwischen beiden Tests kann auf die Reliabilität geschlossen werden.
- Paralleltest-Reliabilität. Hierbei wird die Korrelation zwischen den Ergebnissen in zwei parallel durchgeführten Tests berechnet. Dabei sollten beide Tests möglichst inhaltsgleich sein.
- Testhalbierungs-Reliabilität. Hierbei wird der Test in zwei möglichst vergleichbare Teile geteilt. Aus der Korrelation der beiden Teile kann auf die Reliabilität geschlossen werden.
- Innere Konsistenz. Hierbei wird ähnlich der Bestimmung der Testhalbierungs-Reliabilität vorgegangen, jedoch jedes Item des zu untersuchenden Tests als eigener Test interpretiert. Aus der Korrelation der einzelnen Items untereinander kann die innere Konsistenz als Maß für die Reliabilität bestimmt werden und nummerisch, z.B. als Cronbachs α, angegeben werden.
Ebenfalls zur Reliabilität eines Testinstruments wird die Beobachterübereinstimmung (Inter-Rater-Reliabilität) gezählt (vgl. Bortz & Döring 2002, S. 274). Diese beschreibt, inwieweit mehrere Beobachter bei der Beurteilung von Testitems oder allgemeiner von Testobjekten übereinstimmen. Für kategoriale Daten hat sich als Maß für die Beobachterübereinstimmung der κ-Koeffizient von Cohen (für zwei Beurteiler) bzw. von Fleiss (mehrere Beurteiler) etabliert (vgl. Bortz & Lienert 2008, S. 309–320). Dabei berücksichtigen beide Koeffizienten nicht nur die prozentuale Übereinstimmung der Beobachter, sondern setzen diese ins Verhältnis zu den zufällig zu erwartenden Übereinstimmungen (vgl. Bortz & Lienert 2008, S. 309–320). Hat der Koeffizient einen Wert von 1, so stimmen die Beurteiler bei allen Beurteilungsobjekten vollständig überein. Ist Fleiss’s κ entsprechend κ=0, so stimmen die Beurteiler nur im Rahmen der zufällig zu erwartenden Übereinstimmungen überein (vgl. Bortz & Lienert 2008, S. 309–320). Von einer guten Übereinstimmung wird nach Bortz und Döring im Falle von Cohens κ ab einem κ-Wert größer als 0,70 gesprochen (vgl. Bortz & Döring 2002, S. 277).
Die Validität beschreibt schließlich das Ausmaß, mit dem der Test diejenige Variable misst, die er messen soll (vgl. Rost 2004, S. 33). Dabei wird zwischen Inhalts -, Augenschein -, Konstrukt - und Kriteriumsvalidität unterschieden (vgl. Moosbrugger & Kelava 2012, S. 15).
- „Unter Inhaltsvalidität versteht man, inwieweit ein Test oder ein Testitem das zu messende Merkmal repräsentativ erfasst“ (Moosbrugger & Kelava 2012, S. 15).
- Die Augenscheinvalidität beschreibt, ob und inwieweit die Validität eines Testinstruments einem Laien plausibel erscheint. Diese kann gerade im Hinblick auf die emotionale Einstellung von Testpersonen zum Test von Bedeutung für die erfolgreiche Durchführung eines Tests sein.
- Konstruktvalidität bezeichnet die Validität im eigentlichen Sinne, also inwieweit die Antworten bzw. das Verhalten der untersuchten Personen im Test Rückschlüsse auf eine theoretisch postulierte Personeneigenschaft zulassen. Somit sollte beispielsweise ein Intelligenztest auch tatsächlich Rückschlüsse über ein psychisches Konstrukt „Intelligenz“ zulassen (vgl. Moosbrugger & Kelava 2012, S. 16).
- Von Kriteriumsvalidität wird schließlich gesprochen, wenn auf Grund der Antworten bzw. des Verhaltens der untersuchten Personen auch Rückschlüsse auf das Verhalten in praktischen Situationen möglich sind.
Des Weiteren wird oftmals zwischen externer und interner Validität unterschieden (vgl. Rost 2004, S. 35). Unter externer Validität wird dabei die Verallgemeinerbarkeit von Untersuchungsergebnissen auf andere Personen, Dinge oder Zeitpunkte über die konkrete Studie hinaus verstanden. Dagegen beschreibt der Begriff der internen Validität, inwieweit der in einer Studie untersuchte Forschungsgegenstand mit dem der Untersuchung zu Grunde liegenden theoretischen Konstrukt und der daraus resultierenden Hypothese in Verbindung gebracht werden kann (vgl. Bortz & Döring 2002, S. 37).
[...]
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.