Bewertungshandeln von Lehrkräften in der Grundschule

Inwieweit die traditionelle Leistungsbewertung dem Gütekriterium der Objektivität für eine höhere Einheitlichkeit und Vergleichbarkeit von Beurteilungen genügt


Masterarbeit, 2014

73 Seiten, Note: 1,0

Katharina Sonnenschein (Autor:in)


Leseprobe


Inhaltsverzeichnis

1 Einleitung

2 Theoretische Aspekte der Leistungsbewertung
2.1 Die „Messung“ schriftlicher Schulleistungen
2.2 Messtheoretische Gütekriterien
2.3 Bezugsnormen der Leistungsbewertung
2.4 Rechtliche Grundlagen zur Leistungserfassung und -bewertung
2.5 Anforderungen an die Leistungsbeurteilung
2.6 Exemplarische Darstellung der empirisch relevanten Studien
2.7 Alternative Methoden der Leistungsbewertung

3 Methodischer Aufbau der Studie
3.1 Erkenntnisinteresse der Untersuchung
3.2 Überlegungen zum Erhebungsinstrument
3.2.1 Bestimmung und Beschreibung des Erhebungsinstrumentes
3.2.2 Vorstellung des verwendeten Fragebogens
3.3 Zum Untersuchungsgegenstand
3.4 Feldzugang und Rücklauf
3.5 Deskriptive Statistik
3.6 Das Verfahren der qualitativen Inhaltsanalyse

4 Darstellung der Befunde
4.1 Deskriptive Darstellung
4.2 Begründete Auswahl und Entwicklung von Kategorien
4.3 Analyse der qualitativen Antworten

5 Interpretationen
5.1 Interpretationen der deskriptiven Befunde
5.2 Interpretationen zu den Ergebnissen der kategorialen Analyse
5.3 Gegenüberstellung zentraler Befunde

6 Fazit

7 Literatur

Anhang

Tabelle

Tabelle 1: Bewertung des Deutschaufsatzes (deskriptiv)

Tabelle 2: absolute und relative Häufigkeiten der vergebenen Schulnoten (vgl. Tabelle 1)

Tabelle 3: bewertete Bereiche/Kriterien in Bezug auf Fragestellung 2.3 (deskriptiv)

Tabelle 4: absolute und relative Häufigkeiten der bewerteten Bereiche/Kriterien

Tabelle 5: aufgeführte Bezugsnormen der Fragestellung 3.4

Tabelle 6: absolute und relative Häufigkeiten der Bezugsnormen

Tabelle 7: Auflistung der Einzelnennungen bzw. Kombinationen der Bezugsnormen

Tabelle 8: absolute und relative Häufigkeiten der Nennungen der Tabelle 7

Tabelle 9: Auswertungstabelle zur ersten Oberkategorie (Bezugsnormen der Lehrkräfte)

Tabelle 10: Erwähnte Bezugsnormen in offenen Fragestellungen

Tabelle 11: Auswertungstabelle zur zweiten Oberkategorie

Tabelle 12: Zusammenfassung der Unterkategorie 2.1

Tabelle 13: Zusammenfassung der Unterkategorie 2.2

Tabelle 14: Ausprägungen der Unterkategorie 2.2

Tabelle 15: absolute und relative Häufigkeiten der Nennungen der Tabelle 14

Tabelle 16: absolute und relative Häufigkeiten der priorisierten Bewertungskriterien

Tabelle 17: Gegenüberstellung der Antworten bezüglich der Bezugsnormen

Tabelle 18: Gegenüberstellung der Antworten betreffs der Bewertung des exemplarischen Deutschaufsatzes

Tabelle 19: Gegenüberstellung aller Ergebnisse hinsichtlich der bewerteten Bereiche und Kriterien

Legende/Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

Mit der Leistungsbewertung fällt eines der mächtigsten und einflussreichsten Instrumente zur Bestimmung der Chancen auf schulischen wie auch beruflichen Erfolg in den Verantwortungsbereich von Lehrerinnen und Lehrern. Basierend auf deren Beurteilungen werden weitreichende Laufbahnentscheidungen wie „das Eröffnen oder Verwehren von Zugängen zu weiterführenden Schulen, das Versetzen oder Nichtversetzen am Ende eines Schuljahres, die Zuweisung zu unterschiedlich anspruchsvollen Kursen im Fachleistungskurssystem, die Aufnahme in Förderkurse [sowie] die Einleitung von Sonderschulüberweisungsverfahren“ (Jürgens 2005: 58) getroffen. Dieses Verteilungs- und Selektionswesen legitimiert sich durch die vorausgesetzte Vergleichbarkeit[1] von Leistungsbewertungen und der damit einhergehenden angenommenen Erfüllung messtheoretischer Gütekriterien beim Beurteilungsprozess. Aufgrund der bedeutenden Relevanz jener Voraussetzungen bzw. Annahmen ist die Vergleichbarkeit von schulischen Bewertungen mehrmals in den Fokus der bildungswissenschaftlichen Forschung gerückt. Bereits Anfang der 70er Jahre existierten zahlreiche empirische Studien, die bezüglich der Vergleichbarkeit sowie der Messqualität von Beurteilungen erhebliche Mängel herausstellten (vgl. u.a. Ingenkamp 1989; Thiel/Valtin 2002: 67; Winter 2012: 3). Trotz andauernder Kritik hält das deutsche Schulsystem weitestgehend an traditionellen Prüfungs- und Bewertungsmethoden fest (vgl. Jachmann 2003: 13; Winter 2012: 3).

Die veralteten Studienergebnisse, die Diskrepanz zwischen Wissenschaft und Praxis sowie die unverkennbare Relevanz von Bewertungsentscheidungen für den beruflichen wie auch persönlichen Erfolg von Schülerinnen und Schülern begründen eine erneute Auseinandersetzung mit dem Bewertungshandeln von Lehrkräften. Unter Einbeziehung eigener empirischer Untersuchungen wird der Anspruch der schriftlichen Leistungsbewertung im Primarbereich der Wirklichkeit gegenübergestellt.

In diesem Zusammenhang soll überprüft werden, inwieweit die traditionelle Leistungsbewertung dem Gütekriterium der Objektivität für eine höhere Einheitlichkeit und Vergleichbarkeit von Beurteilungen genügt.

Dazu werden 20 Lehrpersonen im Rahmen eines Fragebogens gebeten, einen beispielhaft angeführten Deutschaufsatz zu zensieren, die angedachte Benotung zu begründen und weitere Fragen bezüglich ihres Bewertungsverhaltens zu beantworten. Neben der Gesamtnote sind auch die Beurteilung einzelner Kriterien und Bereiche sowie die der Leistungsbeurteilung zugrunde gelegten Bezugsnormen von Bedeutung. Die entsprechenden Daten werden sowohl mit Verfahren der deskriptiven Statistik ausgewertet als auch anhand von Kategorien auf Grundlage der qualitativen Inhaltsanalyse analysiert.

Die Ausarbeitungen zur Untersuchung des Bewertungshandelns von Lehrkräften gliedern sich in theoretische, methodische und empirische Abschnitte. Nachstehend werden die einzelnen Kapitel für einen besseren Überblick kurz skizziert.

Den einleitenden Worten folgend, wird das zweite Kapitel („Theoretische Aspekte der Leistungsbewertung“) mit den Grundlagen zur Erfassung und Bewertung von Schulleistungen eröffnet. In diesem Zusammenhang sind die Darlegung der messtheoretischen Gütekriterien sowie die Anführung der Leistungsbewertung zugrunde liegenden Bezugsnormen unerlässlich (Kapitel 2.1 - 2.3). Sowohl die Feststellung als auch die Beurteilung von Leistungen basiert auf rechtlichen Verordnungen, die in Kapitel 2.4 zusammenfassend dargestellt werden. Weitere Anforderungen und Funktionsbeschreibungen bezüglich der Leistungsbewertung finden sich in der wissenschaftlichen Literatur (u.a. bei Jürgens 2005) begründet (Kapitel 2.5). Die Darstellung exemplarischer und empirisch relevanter Studien dient der Anbindung der eigenen Untersuchung an den aktuellen Forschungsstand. Mit Rückgriff auf die Kritik an den traditionellen Erhebungs- und Bewertungsmethoden enden die theoretischen Grundlagen der Arbeit mit einer kurzen Beschreibung von alternativen Methoden der Leistungsbewertung.

Vor diesem Hintergrund werden im dritten Kapitel die methodischen Grundlagen der Arbeit formuliert. Das der Untersuchung zugrunde liegende Erkenntnisinteresse (Kapitel 3.1), sowie die Bestimmung und Beschreibung des verwendeten Erhebungsinstrumentes werden zu Beginn des Kapitels angeführt (Kapitel 3.2). Es folgen Erläuterungen zum Untersuchungsgegenstand sowie zum Feldzugang und dem entsprechenden Rücklauf (Kapitel 3.3 und 3.4). Die in Kapitel 3.5 und 3.6 vorgestellten Verfahren der deskriptiven Statistik und der qualitativen Inhaltsanalyse dienen der nachstehenden Auswertung der erhobenen Daten.

Neben der begründeten Auswahl und Entwicklung von Kategorien (Kapitel 4.2) findet sich weiterhin im vierten Kapitel eine nach den beiden Auswertungsmethoden untergliederte Darstellung der herausgestellten Befunde (Kapitel 4.1 und 4.3).

Die folgenden Interpretationen bedienen sich ebenfalls dieser Vorgehensweise der Unterteilung der Ergebnisse nach Auswertungsverfahren. Im Anschluss an die separate Betrachtung (Kapitel 5.1 und 5.2) werden die entsprechenden Befunde miteinander in Beziehung gesetzt (Kapitel 5.3). Unter Berücksichtigung der theoretischen Grundlagen des zweiten Kapitels werden dazu die empirischen Ergebnisse mit bestehenden Forschungsbefunden verglichen.

Abgeschlossen wird die vorliegende Arbeit mit einem Fazit, in dem sich eine Zusammenfassung zentraler Ergebnisse mit erneutem Rückgriffe auf die in Kapitel 2 vorgestellten Studien finden lässt.

2 Theoretische Aspekte der Leistungsbewertung

Neben der Beschreibung der Grundlagen zur traditionellen Feststellung und Beurteilung von schulischen Leistungen finden sich nachstehend zusätzlich die Darlegung des aktuellen und für die eigene Studie relevanten Forschungsstandes sowie Angaben zu alternativen Methoden der Leistungsbewertung.

2.1 Die „Messung“ schriftlicher Schulleistungen

Auf Grundlage des vorgestellten Leistungsprinzips wird unter Schul- bzw. Lernleistungen der Zusammenschluss aller „von der Schule initiierten Lernprozesse und Lernergebnisse“ der Schülerinnen und Schüler verstanden (Ingenkamp/Lissmann 2008: 131). Im Mittelpunkt der vorliegenden Arbeit stehen traditionelle schriftliche Schulleistungen[2], die zur Ermittlung bzw. Messung[3] von schulischen Lern- und Leistungsprozessen eingesetzt werden (Leistungsfeststellung[4] ) (vgl. Jachmann 2003: 16f). „Die schriftliche Überprüfung des Lernerfolgs geschieht durch Arbeiten, die vom Aufsatz über Übersetzungen, Arbeiten mit Kurzfragen, Mathematikarbeiten bis zum Diktat sehr unterschiedliche Anforderungen stellen und die von formellen Prüfungsarbeiten bis zu informellen Zettelarbeiten unterschiedliche Gestaltungen und Gewichtungen aufweisen“ (Ingenkamp/Lissmann 2008: 142). Kennzeichnend für die überwiegende Anzahl der Prüfungssituationen sind die zeitliche Begrenzung des Bearbeitungszeitraums, die für alle Schülerinnen und Schüler identischen Aufgabenstellungen, die Beschränkung von Hilfsmitteln oder gemeinschaftlichen Arbeitsprozessen sowie die regelmäßige Widerkehr der Leistungsprüfungen (vgl. Winter 2012: 34).

Eine sinnvolle Messung ist bei diesen unterschiedlichen Formen der Leistungsermittlung nicht immer möglich. Hier werden zwei wesentliche Leistungsarten unterschieden: konvergente und divergente Leistungen. „Messbar sind vor allem konvergente Lernprozesse, die zu einem richtigen oder eindeutig besten Ergebnis führen. Nur selten oder mit z.T. problematischen Hilfskonstruktionen sind dagegen divergente Leistungen messbar, die zu mehreren, im Prinzip gleichwertigen Lösungen führen können“ (Ingenkamp/Lissmann 2008: 136). Berichte, Sacherörterungen, Beschreibungen (z.B. einer Person) und Ähnliches gelten bei Deutschaufsätzen als konvergente Leistungen, während Stimmungsbilder oder Besinnungsaufsätze Beispiele für kreative, individuelle und grundsätzlich gleichrangige Gestaltungen eines Themas sind (divergente Leistungserbringungen). Bei der zuletzt genannten Leistungsart muss der Lehrkraft die Subjektivität der eigenen Bewertung (oder besser Schätzung) bewusst sein, um fachkundig und pädagogisch sinnvoll Stellung nehmen zu können. Die Anwendung und Überprüfung messtheoretischer Gütekriterien (siehe Kapitel 2.2) ist somit vorwiegend bei konvergenten Leistungen realisierbar (vgl. ebd.: 133).

2.2 Messtheoretische Gütekriterien

Die Aussagekraft von Messvorgängen und Messergebnissen hängt im Wesentlichen von der Qualität der Messung ab. Ihr Wert wird über die Einhaltung grundlegender Qualitäts-anforderungen, sogenannter Gütekriterien, bestimmt. Jene basieren auf den Überlegungen der klassischen Testtheorie. Schulische Leistungsmessungen und -beurteilungen müssen diesen Gütekriterien ebenfalls genügen[5] (vgl. Jürgens 2005: 73; Jürgens/Sacher 2008: 70).

Im Rahmen der vorliegenden Arbeit wird lediglich das Gütekriterium der Objektivität aufgrund seiner Relevanz für die vorliegende Arbeit aufgeführt. Der Schwerpunkt liegt dabei auf der Auswertungs- und Interpretationsobjektivität.

Zur Gewährleistung von Objektivität müssen die Messergebnisse unabhängig von der beurteilenden Person sein. Ein Wechsel des Prüfers oder Beurteilers sollte sich somit nicht in einer Veränderung des Messergebnisses niederschlagen (vgl. Brügelmann et al. 2006: 25; Jürgens 2005: 74). Leistungsmessungen und -bewertungen gelten demnach als objektiv, „wenn intersubjektive Einflüsse der Untersuchung möglichst ausgeschaltet werden können“ (Ingenkamp/Lissmann 2008: 52). Der Prozess der Objektivität lässt sich in drei Segmente unterteilen.

Bei der Durchführungsobjektivität versucht man die situativen Bedingungen der Leistungskontrolle sowie die Anforderungen an die Schülerinnen und Schüler anzugleichen. Darunter fallen beispielsweise die Aufgabenstellung, die Auswahl der Hilfsmittel oder der zeitliche Rahmen einer Prüfung. Erst diese Reglementierung und Vereinheitlichung der Prüfungssituation ermöglicht einen Vergleich der gemessenen Leistungen (vgl. Ingenkamp/Lissmann 2008: 52; Jürgens/Sacher 2008: 70).

Auswertungsobjektivität bedeutet die Verfahrensweise bei der Korrektur der erhobenen Daten durch entsprechende Maßnahmen (z.B. ein Lösungsschema, eine Schablone o.Ä.) zu vereinheitlichen. Diese Komponente der Objektivität ist gegeben, wenn die Auswertung von Leistungskontrollen unabhängig von der auswertenden Person erfolgt, sodass „intrasubjektive und intersubjektive Einflüsse ausgeschaltet werden“ können (Jürgens/Sacher 2008: 70).

Die Interpretationsobjektivität liegt vor, wenn unterschiedliche Lehrerinnen und Lehrer die erhobenen und ausgewerteten Daten identisch interpretieren bzw. objektiv in einen festen Bezugsrahmen einordnen (vgl. Jürgens 2005: 75; Ingenkamp/Lissmann 2008: 145). Zur Gewährleistung der Interpretationsobjektivität werden meist übereinstimmende Bewertungskriterien oder die Vorgabe von Mindestkompetenzen eingesetzt (vgl. Jürgens 2005: 75).

Die Objektivität gilt als notwendige Voraussetzung für die weiteren Gütekriterien Reliabilität (Zuverlässigkeit) und Validität (Gültigkeit) (vgl. Ingenkamp/Lissmann 2008: 54; zum Weiterlesen siehe Ingenkamp/Lissmann 2008; Jürgens 2005; Jürgens/Sacher 2008). Diese Relevanz der Objektivität bei Messverfahren begründet die Fragestellung der vorliegenden Arbeit.

2.3 Bezugsnormen der Leistungsbewertung

Im Anschluss an die erfolgte Leistungsermittlung werden die erfassten Informationen über den erreichten Wissens- und Kenntnisstand durch die Einordnung in eine vorgegebene Rangordnung, im Allgemeinen die Zensurenskala (Ziffernzensuren 1-6), hinsichtlich ihrer Qualität bzw. ihres Wertes beurteilt (vgl. Jürgens 2005: 56; Winter 2012: 34).

Doch Schülerleistungen wie sieben Rechtschreibfehler in einem Diktat, 25 Punkte in einer Mathematikarbeit oder neun korrekt gelöste Aufgaben bei einem Sachunterrichtstest können für sich allein stehend nicht bewertet werden. Es fehlt ein geeigneter Vergleichsmaßstab oder Bezugspunkt, um diese Informationen interpretieren, beurteilen und somit zu einem festgelegten Rangplatz (Zensierung) zuordnen zu können. In der Literatur hat sich hierfür der Begriff Bezugsnorm etabliert (vgl. Ingenkamp/ Lissmann 2008: 63; Winter 2012: 64). Die gewählte Bezugsnorm bestimmt die Wahrnehmung und damit auch die Bewertung einer Leistung (vgl. Brügelmann et al. 2006: 28; Winter 2012: 66). „Die Richtung der Bewertung – ob positiv oder negativ, unterdurchschnittlich oder überdurchschnittlich, ausreichend oder nicht – [hängt nämlich im Wesentlichen davon ab], welchen Maßstab die Lehrkraft an die Einzelleistung anlegt“ (Jachmann 2003: 19). Drei Bezugsnormen sind zu unterscheiden[6]:

„Wird der Leistungsbeurteilung eine soziale Bezugsnorm zu Grunde gelegt, so wird die erbrachte Leistung des/der Einzelnen mit den Leistungen einer Bezugsgruppe, im schulischen Alltag meist die Schulklasse, in Beziehung gesetzt“ (Beer 2006: 54). Eine Rangordnung von Schülerleistungen entsteht, wobei der Durchschnittswert der Gruppe den Wert der Leistung des Individuums bestimmt. Ob eine durchschnittliche Schülerleistung als gut oder schlecht bewertet wird, ist somit abhängig von der Leistungsschwäche bzw. Leistungsstärke der jeweiligen Schulklasse. Individuelle Lernfortschritte, ebenso wie die Erreichung von bestimmten Lernzielen bleiben unberücksichtigt (vgl. Beer 2006: 54; Jachmann 2003: 19; Jürgens/Sacher 2008: 101).

Bei Anwendung der individuellen Bezugsnorm richtet sich die Aufmerksamkeit der Lehrkraft auf den individuellen Lernfortschritt des Kindes. Zur Bewertung dieses Lernzuwachses wird das aktuell erbrachte Lernergebnis mit früheren Leistungen verglichen. Die Leistungsbewertung ist dabei nicht abhängig von den unterschiedlichen Leistungsniveaus und ermöglicht es somit selbst leistungsschwächeren Schülerinnen und Schülern, „den Zusammenhang zwischen eigenen Lernbemühungen und Lernerfolg wahrzunehmen“ (Rheinberg 2002: 65). Jürgens und Sacher sehen in dieser Bezugsnorm beachtliche Chancen zur Stärkung des Selbstkonzeptes und der Lernmotivation (vgl. 2008: 102). Als Nachteil der individuellen Bezugsnorm gilt deren fehlende Vergleichbarkeit und die Unvereinbarkeit mit rationalen Selektionsentscheidungen (vgl. ebd.; Rheinberg 2002: 65f).

Die sachliche Bezugsnorm wird in der einschlägigen Literatur auch als curriculare oder kriteriale Bezugsnorm bezeichnet. Weder eigene noch fremde Leistungen bilden hierbei den Vergleichsmaßstab. Eine Leistungsbewertung basiert auf der sachlichen Bezugsnorm, „wenn die Leistung einer Person mit vorab festgelegten, fachlich begründeten und präzise definierten Lernzielen verglichen wird“ (Beer 2006: 54). Diese die Anforderungen aufzeigende Kriterienliste, die es von den Schülerinnen und Schülern zu erfüllen gilt, basiert meist auf den im Lehrplan beschriebenen Kompetenzen. Problematisch hierbei sind allerdings die ungenauen und teilweise unverbindlichen Vorgaben des Lehrplans (vgl. Jachmann 2003: 20; Rheinberg 2002: 66f). In wie weit Einigkeit und Einheitlichkeit bei den befragten Lehrkräften bezüglich dieser Kriterien besteht, soll als Teilaspekt der vorliegenden Untersuchung geklärt werden.

Jede Bezugsnorm weist Vor-, aber auch Nachteile auf und ist somit nicht universell einsetzbar. Die Verwendung von mehreren Bezugsnormen kann die Kompensierung unliebsamer Nachteile fördern. Im Schulalltag sind, in Anlehnung an die wissenschaftliche Literatur, meist die soziale Bezugsnorm oder Mischformen vorherrschend (vgl. Brügelmann et al. 2006: 30; Jachmann 2003: 21; Rheinberg 2002: 69).

2.4 Rechtliche Grundlagen zur Leistungserfassung und -bewertung

Die schulische Leistungsfeststellung und -bewertung sollte bestimmten rechtlichen Vorgaben genügen. Derartige Verordnungen basieren auf dem nordrhein-westfälischen Schulgesetz, der Ausbildungsordnung für den Primarbereich (AO-GS) mit dazugehöriger Verwaltungsvorschrift (VVzAO-GS) sowie auf den Richtlinien und Lehrplänen für die Grundschule in NRW.

In den entsprechenden rechtlichen Grundlagen ist festgelegt, dass bei der Ermittlung und Bewertung von Leistungen nicht nur „Ergebnisse des Lernprozesses zu einem bestimmten Zeitpunkt im Vergleich zu den verbindlichen Anforderungen und Kompetenzerwartungen [berücksichtigt werden], sondern auch die Anstrengungen und Lernfortschritte, die zu den Ergebnissen geführt haben“ (Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen 2008: 16). Inhaltlich bezieht sich die Leistungsbewertung auf die im Unterricht vermittelten Kenntnissen, Fähigkeiten und Fertigkeiten, die an den im Lehrplan verankerten Kompetenzerwartungen[7] orientiert sind (vgl. § 48 Abs. 2 SchulG; Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen 2008: 35).

„Zur Feststellung [dieses] individuellen Lernfortschritts sind [neben mündlichen und praktischen Beiträgen] nach Maßgabe der Lehrpläne [auch] kurze schriftliche Übungen zulässig“ (AO-GS § 5 Abs. 1). Weiterhin werden in den Fächern Mathematik, Deutsch und Englisch schriftliche Arbeiten ab der dritten Klasse geschrieben (vgl. ebd.). Die dabei ermittelten Informationen über die individuelle Lernentwicklung der Schülerinnen und Schüler werden bei der Planung des weiteren Unterrichts als auch bei der Ausarbeitung zusätzlicher Fördermaßnahmen herangezogen (vgl. § 48 Abs. 1 SchulG; Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen 2008: 35)

Ab der dritten Klasse werden Schulleistungen mit Noten bewertet (vgl. AO-GS § 5 Abs. 2). Die Verwaltungsvorschriften der Ausbildungsordnung sehen vor, dass diese Noten durch „förderliche, ermutigende und beratende Hinweise zum sinnvollen Weiterlernen ergänzt werden“ (AO-GS VV zu § 5, 5.2 zu Abs. 2, 5.21). Die Unterteilung in die einzelnen Notenstufen (§ 48 Abs. 3 SchulG) befindet sich zum Nachlesen im Anhang.

Ein verbindlicher, allgemeingültiger und detaillierter Kriterienkatalog zur Bewertung von Schulleistungen konnte nicht herausgestellt werden. Die Auflistung der Kompetenzerwartungen ist oftmals zu unpräzise und oberflächlich formuliert (vgl. auch Jachmann 2003: 20; Rheinberg 2002: 66f).

2.5 Anforderungen an die Leistungsbeurteilung

Die Intentionen und Ziele der schulischen Leistungsfeststellung und -bewertung können nach Jürgens weder mit den vorgestellten rechtlichen Grundlagen noch anhand der in der wissenschaftlichen Literatur verorteten Funktionsbeschreibungen pädagogisch legitimiert werden. Diese Problematik hängt u.a. mit den widersprüchlichen Anforderungen zusammen, die der Institution Schule zugeschrieben werden (vgl. Jürgens 2005: 56).

Die Schule gilt zum einen als gesellschaftliche Institution, die unter Berücksichtigung diverser Auslese- und Selektionsmechanismen beliebte und zugleich begrenzte Zugangsberechtigungen verteilt. Diese Allokations- und Klassifikationsfunktion wird über die Leistungsbeurteilung realisiert. Dadurch wird der Bewertung von Schulleistungen eine bedeutende Rolle bezüglich zukünftiger Laufbahnentscheidungen und damit einhergehenden schulischen, beruflichen und sozialen Aufstiegschancen beigemessen (vgl. Jachmann 2003: 29; Jürgens 2005: 56, 58f).

Demgegenüber steht die curriculare Funktion, die für die Schule als pädagogische Institution zur Förderung der kindlichen Persönlichkeitsentwicklung unverzichtbar ist und die der kontinuierlichen Überprüfung der Lehr- und Lernplanungen dient (vgl. Jürgens 2005: 56f).

„Leistungsbeurteilungsprozesse stellen in diesem Sinne diagnostische Aktivitäten dar, mit deren Hilfe sich pädagogische Handlungsentscheidungen im Rahmen schulischen Unterrichts vorbereiten, durchführen und auswerten lassen. Die curriculare (lernzielbezogene) Kontrolle ist sowohl für die Optimierung der individuellen Förderung von Schülerinnen und Schülern als auch für die inhaltliche Planung und Organisation von Lernprozessen von unverzichtbarer Bedeutung“ (Ebd.: 57).

Die im Hinblick auf die Leistungsermittlung und -beurteilung fehlende einheitliche Festlegung der pädagogischen Legitimation ist auch auf die Notengebung übertragbar. Neben den beiden beschriebenen Funktionen zur Leistungsbewertung, werden der Zensierung in der erziehungswissenschaftlichen Literatur noch weitere, teilweise unvereinbare Funktionen zugeordnet (vgl. Jürgens 2005: 61)[8].

Die konstante Präsenz der Ziffernnote im deutschen Bildungssystem wird u.a. mit ihrer einfachen Handhabung, ihrer suggerierten Eindeutigkeit und ihrer universellen Einsetzbarkeit legitimiert (vgl. Jürgens 1999: 29; Winter 2012: 38).

2.6 Exemplarische Darstellung der empirisch relevanten Studien

Zahlreiche empirische Studien haben bereits vor Jahrzehnten die Bedenken bezüglich der Leistungsbewertung traditioneller schriftlicher Arbeiten, insbesondere hinsichtlich der Notengebung[9], wissenschaftlich untermauert (u.a. Birkel/Birkel 2002; Carter 1952; Eells 1930; Ingenkamp 1969, 1975, 1995; Schröter 1971; Starch/Elliot 1912, 1913; Thiel/Valtin 2002; Weiss 1965) (vgl. Ingenkamp 1989[10] ; Ingenkamp/Lissmann 2008: 143-151; Schröter 1971). Aufgrund der darin enthaltenen Thematisierung des Gütekriteriums der Objektivität und ihrer Ähnlichkeit zur eigenen Studie bzw. ihrer Relevanz für die eigene Erhebung werden nachstehend zwei dieser Untersuchungen exemplarisch angeführt.

Bei der ersten hier vorgestellten Erhebung handelt es sich um eine Replikationsstudie der Untersuchungen von Rudolf Weiss aus den 1960er Jahren. Birkel und Birkel haben darin Aufsatzbewertungen von 89 Grundschullehrerinnen und -lehrern miteinander verglichen. Dazu wurden den Lehrkräften im Frühjahr 1999 vier Aufsätze unterschiedlicher Qualität und Quantität zur Beurteilung präsentiert. Die Auswertungen der Daten ergaben für alle vier Aufsätze erhebliche Abweichungen bei den Benotungen (vgl. Birkel/ Birkel 2002: 219-222). „Je nach beurteiltem Aufsatz streuten die Lehrerurteile zwischen 3 bis 4 Notenstufen“ (Ingenkamp/Lissmann 2008: 144). Damit konnten Birkel und Birkel die Ergebnisse von Weiss replizieren und folglich erneut bestätigen, dass sich „bei der Beurteilung ein und desselben Aufsatzes durch verschiedene [Lehrerinnen und] Lehrer eine Notenstreuung, die u. U. fast die ganze Notenskala ausschöpft“, ergibt (Birkel/Birkel 2002: 222).

Die Vergleichbarkeit der in verschiedenen Klassen gleichen Jahrganges erteilten Zensuren als Voraussetzung für unser System der Jahrgangsklassen und als notwendige Bedingung für das Verteilungs- und Selektionswesen wurde in den vergangenen Jahrzehnten vielfach kritisiert (vgl. Thiel/Valtin 2002: 72). Die Kritik geht u.a. auf das für den deutschsprachigen Raum bereits 1969 von Ingenkamp nachgewiesene klasseninterne Bezugssystem[11] zurück, welches als Gegenstand der zweiten hier präsentierten Erhebung fungiert (vgl. Ingenkamp 1989: 194-199; Ingenkamp/Lissmann 2008: 146). In einer Untersuchung von 37 Klassen des 6. Grundschuljahres (Berlin) wurde dieses Phänomen durch den „Vergleich von Zensuren und Testergebnissen bei [Schülerinnen und] Schülern nachgewiesen, die in der gleichen Klassenstufe nach gleichen Lehrplänen unterrichtet und in Rechtschreibung, Lesen, Mathematik und Englisch mit den gleichen Tests untersucht wurden“ (Ingenkamp/Lissmann 2008: 146). Sowohl die Studie Ingenkamps als auch aktuellere Untersuchungen mit ähnlichen Forschungsdesigns (u.a. im Rahmen des Projektes NOVARA – einer Längsschnittstudie aus den 90er Jahren) konnten einen kennzeichnenden Zusammenhang zwischen der Klassenzugehörigkeit und der vergebenen Zensur diagnostizieren, der auf eine sich ähnelnde Notenverteilung der unterschiedlichen Klassen zurückzuführen ist. Da die zufällige Zugehörigkeit zu einer Klasse und nicht - wie etwa vom Schulsystem angedacht - das eigentliche Leistungsniveau die Bewertung einer Leistung bestimmt, lässt die Vergleichbarkeit von Zensuren, insbesondere im Hinblick auf deren Bedeutung bei den diversen Übergängen im Schulsystem (u.a. Übergang zur Sekundarstufe, zur Berufsausbildung, zur tertiären Ausbildung), problematisch erscheinen (vgl. Ingenkamp/Lissmann 2008: 146f; Thiel/ Valtin 2002: 72-75).

Das klasseninterne Bezugssystem wird in dieser Arbeit als Konsequenz der sozialen Bezugsnorm interpretiert. Deren vermutete überwiegende Verwendung bei Bewertungsentscheidungen (vgl. Brügelmann et al. 2006: 30; Rheinberg 2002: 69) wurde bereits in Kapitel 2.3 aufgeführt.

„Mit dem [aufgezeigten] Fehlen der Objektivität in der Beurteilung ergibt sich fast schon zwingend, dass auch wesentliche Aspekte der Reliabilität und Validität nicht gegeben sind“ (Jachmann 2003: 52). So weisen Studien beispielsweise von Eells (1930) nach, dass eine von derselben Lehrkraft wiederholte Beurteilung eines Schüleraufsatzes zu unterschiedlichen Ergebnissen führt (vgl. Eells 1989: 167-172). „Die nicht ausreichende prognostische Validität zeigt sich darin, dass Zensuren nicht dazu geeignet sind, zukünftiges Leistungsverhalten zu prognostizieren“ (Jürgens/Sacher 2008: 63; vgl. auch Valtin 2002: 12).

Trotz erwiesener Mängel der traditionellen Leistungsbewertung in Hinblick auf die messtheoretischen Gütekriterien und der damit einhergehende wissenschaftliche Diskurs stellen schriftliche Leistungsüberprüfungen (überwiegend Klassenarbeiten) weiterhin das am häufigsten verwendete Instrument zur Erfassung und Beurteilungen von Schülerleistungen im deutschen Bildungssystem dar (vgl. Ingenkamp/Lissmann: 2008: 154; Jürgens 2005: 82).

Die fehlende Aktualität der im Rahmen dieser Arbeit vorgestellten Untersuchungen geht einher mit einem Mangel an Replikationsstudien, der, ungeachtet stetiger Änderungen der Rahmenbedingungen früherer Erhebungen wie der Lehrpläne, der Lehrerausbildung etc., dennoch existent ist (vgl. auch Ingenkamp/Lissmann 2008: 144). Die Seltenheit dieser überprüfenden Studien kann als weiterer Beweggrund für die eigene Erhebung angesehen werden.

2.7 Alternative Methoden der Leistungsbewertung

Als Reaktion auf die mit den Studienergebnissen verbundene Kritik haben Überlegungen zu alternativen Bewertungsmethoden[12] in den letzten Jahren wieder an Aktualität gewonnen. Die tradierten Leistungsfeststellungs- und -bewertungsmethoden, für die künstliche Prüfungssituationen wie Klassenarbeiten und Tests sowie die Einordnung der Schülerleistung in eine sechsstufige Rangliste charakteristisch sind, werden zunehmend durch andere Instrumente erweitert bzw. ersetzt (vgl. Winter 2012: 34, 40). Doch erste Schritte, wie das auf die ersten beiden Schuljahre bezogene Austauschen traditioneller Ziffernzeugnisse gegen Berichtszeugnisse oder die Anwendung von Leistungstests sind umstritten (Ausführungen hierzu siehe Ingenkamp/Lissmann 2008: 189-191, 196; Winter 2012: 139ff). Hingegen wird der Portfolioarbeit, dem Einsatz von Lerntagebüchern oder auch den Selbstbewertungsprozessen ein weitaus pädagogischer und differenzierter Umgang mit Schülerleistungen zugeschrieben. Detaillierte Ausführungen zu diesen und weiteren alternativen Bewertungsmethoden finden sich u.a. bei Winter (2012).

3 Methodischer Aufbau der Studie

Nachstehend werden methodische Grundlagen zum Erhebungs- und Auswertungsverfahren der vorliegenden Untersuchung erörtert. Diese gelten in Verbindung mit den vorgestellten theoretischen Annahmen zur Leistungsbewertung als Fundament für die Analyse und Interpretation der erhobenen Daten.

3.1 Erkenntnisinteresse der Untersuchung

Die unverkennbare Relevanz von Bewertungsprozessen für zukünftige Bildungs- und Berufswege von Schülerinnen und Schülern (vgl. Kapitel 2.5) begründet eine differenzierte und detaillierte Untersuchung des Bewertungshandelns von Lehrkräften im Primarbereich. Basierend auf den im voranstehenden Kapitel dargelegten Erkenntnissen zur Leistungsbewertung, insbesondere unter Berücksichtigung früherer Forschungsarbeiten (Kapitel 2.6), wurden folgende Vermutungen abgeleitet und zur Überprüfung in einen für Lehrkräfte konzipierten Fragebogen eingebaut.

Als übergeordnete Vorstellung der nachstehenden Untersuchung gilt die Annahme, dass die traditionelle schulische Leistungserfassung und -beurteilung dem Gütekriterium der Objektivität nicht gerecht wird (vgl. Kapitel 2.6) und somit die Vergleichbarkeit von Bewertungen nicht gegeben ist. Die sich daraus ergebenden weiteren Differenzierungen, werden aus Gründen der Übersichtlichkeit kurz und prägnant aufgeführt. Weitere Erläuterungen finden sich u.a. in den Kapiteln, auf die nachfolgend verwiesen wird.

Annahme 1: Das Fehlen von verbindlichen und einheitlichen Bewertungskriterien in den Richtlinien initiiert Lehrkräfte zur Erstellung eigener Kriterienkataloge und damit einhergehend zu unterschiedlichen Prioritätensetzungen der zu bewertenden Bereiche (vgl. Kapitel 2.4). Unstimmigkeiten in den der Beurteilung zugrunde liegenden Kriterien ermöglichen keine auswertungsobjektive Leistungsbewertung (vgl. Kapitel 2.2).

Annahme 2: Für die Bewertung von Schülerleistungen wird überwiegend die soziale Bezugsnorm verwendet (vgl. Kapitel 2.6). Die Anwendung der sozialen Bezugsnorm wird im Rahmen dieser Arbeit als Hinweis auf den klasseninternen Maßstab interpretiert. Ein mehrheitlicher Gebrauch dieser Bezugsnorm würde somit, aufgrund der ausbleibenden Zuordnung der ausgewerteten Befunde in einen objektiven und absoluten Maßstab, zu einer fehlenden Gewährleistung der Interpretationsobjektivität führen (vgl. Ingenkamp/Lissmann 2008: 145f).

Welche Bedeutung eine Verifizierung oder Falsifizierung dieser Annahmen hat, wird Thema der Interpretation und des Fazits sein.

3.2 Überlegungen zum Erhebungsinstrument

3.2.1 Bestimmung und Beschreibung des Erhebungsinstrumentes

Zur Überprüfung der vorgestellten Thesen erweist sich eine qualitative Befragungsform als sinnvolles Erhebungsinstrument. Zum einen ist die gewählte Stichprobe für eine quantitative Erhebung nicht von ausreichender und damit repräsentativer Größe, zum anderen können individuelle Erfahrungen, Verhaltensweisen, Einstellungen und Motive hinsichtlich des benannten Sachverhaltes über offene Frageformate mit einem entsprechend konzipierten Fragebogen schriftlich erfasst werden (vgl. Ingenkamp /Lissmann 2008: 104; Friebertshäuser/Langer 2010: 439). Das Instrument des Fragebogens wird hierbei definiert als „Zusammenstellung von Fragen, die Personen zur Beantwortung vorgelegt werden mit dem Ziel, deren Antworten zur Überprüfung der den Fragen zugrundeliegenden theoretischen Konzepte und Zusammenhänge zu verwenden. Somit stellt ein Fragebogen das zentrale Verbindungsstück zwischen Theorie und Analyse dar“ (vgl. Porst 1996: 738).

Die im Zitat aufgegriffene Zusammenstellung der Fragen lässt sich bezüglich ihres Strukturierungsausmaßes (flexibles bzw. festes Frageschema), ihres Standardisierungsgrades (vorgegebene Antwortkategorien) sowie ihrer Antworttechnik (offen bzw. geschlossen) differenzieren[13] (zum Nachlesen vgl. Atteslander 2008: 129-139). Der in der vorliegenden Studie verwendete Fragebogen gilt als stark strukturiert, da die Anzahl, Formulierung und Reihenfolge der Fragen festgelegt sind (vgl. Ingenkamp/Lissmann 2008: 97). Darüber hinaus werden mehrere Standardisierungsgrade ebenso wie unterschiedliche Frageformate gewählt[14].

Standardisierte Antworten, die sich durch die Vorgabe einer begrenzten und definierten Anzahl von Antwortkategorien auszeichnen, gehen meist einher mit geschlossenen Fragetechniken (vgl. ebd.: 98; Porst 2008: 52). In der Literatur werden zwischen Einfachnennungen (eine zulässige Antwort; Entscheidung für eine vorgegebene Kategorie) und Mehrfachnennungen (mehrere zulässige Antworten) unterschieden[15]. Der Vorteil dieser Frageform liegt in ihrer einfachen und schnellen Datenauswertung (vgl. Porst 2008: 51ff).

[...]


[1] Hiermit ist nicht das Nebengütekriterium der Vergleichbarkeit von Untersuchungen gemeint

[2] Klassenarbeiten, Texts, Aufsätze…

[3] Die Begriffe Leistungsermittlung und Leistungsmessung können nicht synonym verwendet werden, da nicht jede Leistungsermittlung die Gütekriterien einer Messung erfüllt (vgl. Jachmann 2003: 17) Der Begriff der Messung schließt den der Ermittlung allerdings ein

[4] Die Begriffe Leistungsermittlung, Leistungsfeststellung, Leistungsüberprüfung und Leistungserfassung werden bei dieser Arbeit synonym verwendet

[5] In wie weit diese Einhaltung gelingt, wird in späteren Kapiteln thematisiert

[6] Erläuternde Abbildung siehe Anhang

[7] Auf die Darstellung einzelner Kompetenzbereiche wird im Rahmen dieser Arbeit verzichtet

[8] Eine detaillierte Beschreibung dieser Unterscheidungen findet sich u.a. bei Jachmann 2003: 26-34; Jürgens 2005: 61-66; Winter 2012: 41-64.

[9] Kritik an Noten steht nicht im Mittelpunkt der vorliegenden Arbeit. Doch es sei kurz gesagt, dass „anstatt eine aussagekräftige, informative Rückmeldung zu bekommen, erhält ein Kind mit einer Zensur lediglich eine dürftige Mitteilung darüber, ob es erfolgreich oder nicht in seinen Anstrengungen war und wie diese im Vergleich zu seinen Mitschülerinnen und Mitschülern eingestuft werden“ (Jürgens 1999: 28). Weiterhin bezeichnet Jürgens die Zensur als „eine an Simplizität kaum noch zu überbietende“ Form der Rückmeldung (Ebd.: 29).

[10] Von Ingenkamp zusammengestellte Sammlung von Untersuchungsberichten

[11] Die Ergebnisse von Ingenkamp wurden viel zitiert und gelten als Grundlage mehrerer Untersuchungen. Ihre Präsentation wird demnach, trotz fehlender Aktualität, als relevant empfunden.

[12] Erste Überlegungen bereits in den 1960er-Jahren (Ingenkamp/Lissmann 2008: 178)

[13] Die Unterscheidung ist zu beachten, auch wenn die Begriffe in der Literatur oft synonym verwendet werden (vgl. Atteslander 2008: 135)

[14] Genauere Ausführungen hierzu in Kapitel 3.2.2

[15] In Form von „Ankreuzfragen“

Ende der Leseprobe aus 73 Seiten

Details

Titel
Bewertungshandeln von Lehrkräften in der Grundschule
Untertitel
Inwieweit die traditionelle Leistungsbewertung dem Gütekriterium der Objektivität für eine höhere Einheitlichkeit und Vergleichbarkeit von Beurteilungen genügt
Hochschule
Universität Bielefeld
Note
1,0
Autor
Jahr
2014
Seiten
73
Katalognummer
V293143
ISBN (eBook)
9783656903154
ISBN (Buch)
9783656903161
Dateigröße
1146 KB
Sprache
Deutsch
Anmerkungen
Eine Fragebogenauswertung auf Grundlage der qualitativen Inhaltsanalyse
Schlagworte
Leistungsbewertung, Bewertungshandeln, qualitative Inhaltsanalyse, Zensierung, Fragebogen, Objektivität, Grundschule
Arbeit zitieren
Katharina Sonnenschein (Autor:in), 2014, Bewertungshandeln von Lehrkräften in der Grundschule, München, GRIN Verlag, https://www.grin.com/document/293143

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Bewertungshandeln von Lehrkräften in der Grundschule



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden