2) Gütekriterien für Tests
a) Objektivität
nach Lienert (S. 69):
Man unterscheidet nach verschiedenen Phasen des diagnostischen Prozesses folgende Objektivitäten:
Durchführung- oder Darbietungsobjektivität
Bei der Darbietung und Durchführung des Tests darf soziale Interaktion auf das Maß beschränkt bleiben, das der Test vorgibt. Eine gewisse Subjektivität bleibt unvermeidbar, auch, wenn sich der Versuchsleiter an die Testanweisung hält, denn Blickkontakt, Stimmführung usw. sind natürlich personabhängig. Auch die äußerliche Situation (Räumlichkeiten, Tageszeit...) sollte für alle gleich sein.
Auswertungsobjektivität
Auch die Auswertung sollte unabhängig vom Versuchsleiter gleich ausfallen. Bei Unterscheidung in ‚richtig‘ oder ‚falsch‘ oder bei gebundenen Aufgaben ist das relativ einfach zu gewährleisten, jedoch bei Aufgaben, die die Spontaneität oder Kreativität ist das schon schwieriger.
Interpretationsobjektivität
Die volle Interpretationsobjektivität ist gegeben, wenn die Auswertung einen numerischen Wert liefert, der die Position des Pbn in einer Rangskala festlegt. Ansonsten ist dieses Kriterium nicht durchzuhalten.
Objektivität der Konsequenzen
Gemeint ist hiermit, daß das Testbuch Auskunft über die Maßnahmen enthalten soll, die aufgrund einer bestimmten Diagnose einzuleiten sind.
Durch einen psychologische Test kann niemals die Ausgangsfragestellung der Untersuchenden beantwortet werden.
2
b) Reliabilität
nach LIENERT (S. 73):
Unter Reliabilität versteht man „den Grad der Genauigkeit, mit dem er ein bestimmtes Persönlichkeits- oder Verhaltensmerkmal mißt, gleichgültig, ob er diese Merkmal auch zu messen beansprucht.“
Bei einer Wiederholung des Testes unter gleichen Bedingungen dürfte der Testwert demnach kaum schwanken.
Es ist üblich, die Zuverlässigkeit eines Tests als Korrelationskoeffizient anzugeben. Er wird von dem Symbol ‚r‘ bezeichnet und ist so angelegt, daß er Werte zwischen r=+1,00 und r=-1,00 annimmt. Ein ausreichender Korrelationsquotient ist ab r=+0,80 gegeben.
Voraussetzungen für die Reliabilität:
1. Stabilität des zu messenden Merkmals, d.h. das Merkmal darf sich nicht schnell verändern.
2. gesicherte Objektivität
3. ausreichend viele Aufgaben (Items)
Methoden zur Bestimmung der Reliabilität:
Paralleltestmethode
Von einem Test müssen zwei Formen (A,B) vorliegen. Diese werden dann mit demselben Probanden aufeinanderfolgend mit kurzen zeitlichen Abstand durchgeführt. Je genauer die Ergebnisse übereinstimmen, desto größer ist die Reliabilität. Allerdings kann auch hier eine Gewöhnung an die Art der Testaufgaben vorliegen (Bekanntheit des Testes)
Retestmethode
Derselbe Test wird bei derselben Person wiederholt. Hierzu muß ein großer zeitlicher Abstand vorliegen. Liegen die Zeitpunkte zu nah beieinander, besteht wieder die Gefahr der Bekanntheit des Testes. Liegen die Zeitpunkte zu weit auseinander, könnten sich die Bedingungen in der Person geändert haben.
Spit-half-Reliabilität
Der Test wird in zwei Hälften geteilt (z.B. gerade Aufgabennummern - ungerade Aufgabennummern) und jeweils der Korrelationskoeffizient der einen Hälfte mit dem der anderen Hälfte verglichen. Bei der Aufteilung müssen beide Testhälften hinsichtlich des Schwierigkeitsgrades gleich sein.
3
Konsitenzanalyse
Der Test wird in so viele Teile zerlegt, wie der Test Aufgaben hat. Der Korrelationskoeffizient geht aus dem Vergleich aller Aufgaben hervor.
Die Forderung nach hoher Reliabilität könnte in Konflikt geraten mit dem Gedanken an Förderung, denn der förderdiagnostisch arbeitende Pädagoge möchte ja erreichen, daß sich etwas ändert.
c) Validität
nach LIENERT (S. 79):
Der Validitätskoeffizient liegt unter dem Reliabilitätskoeffizient:
Bei den Vorgehensweisen zur Ermittlung der Validität unterscheidet man vier Möglichkeiten der Bestimmung:
1. inhaltliche Validität
2. kriterienbezogene Validität
3. prognostische Validität
4. Konstruktvalidität
4
Ein hohe Validität kann nur eintreten, wenn hohe Objektivität und hohe Reliabilität gegeben sind.
d) Zusatzgütekriterien
i) Normierung
Über einen Test sollen Angaben verfügbar sein, die eine Einordnung des individuellen Testergebnisses in ein größeres Bezugssystem ermöglichen, nämlich Normen.
Man kann davon ausgehen, daß sich Testergebnisse aus zwei Komponenten zusammensetzen: aus dem tatsächlichen Ergebnis und einem Fehleranteil.
Der Bereich in dem der ‚wahre Wert‘ mit großer Wahrscheinlichkeit liegt, wird Vertrauensbereich genannt. Zur Berechnung des Vertrauensbereichs wird der Standardmeßfehler herangezogen. Die Wahrscheinlichkeit, mit der der ‚wahre‘ Testwert außerhalb des Vertauensbereichs liegt, bezeichnet man als Irrtumswahrscheinlichkeit. Die Irrtumswahrscheinlichkeit wird in Prozent ausgedrückt. Sie sollte 5% nicht übersteigen.
Den Mindestunterschied, den zwei Testwerte zeigen müssen, damit die ‚wahren‘ Werte der Probanden als tatsächlich voneinander verschieden bezeichnet werden können heißt kritische Differenz.
ii) Vergleichbarkeit
Ein Test ist vergleichbar, wenn Parallelformen vorhanden sind, die sich vor allem hinsichtlich der Validität weitgehend entsprechen.
iii) Ökonomie
Von einem ökonomischen Test spricht man, wenn er möglichst alle nachfolgenden Kriterien erfüllt:
1. ein kurze Durchführungszeit
2. geringer Materialverbrauch
3. einfache Handhabung
4. Durchführung als Gruppentest möglich
5. schnelle und bequeme Auswertung
5
iv) Nützlichkeit
Ein Test gilt dann als nützlich, wenn er ein Persönlichkeitsmerkmal oder eine Verhaltensweise mißt oder vorhersagt, für dessen (deren) Untersuchung ein praktisches Bedürfnis vorliegt. Dabei muß dieser Test in besondere Weise geeignet sein, so daß er durch keinen anderen Test vertreten werden kann.
Im sonderpädagogischen Arbeitsbereich bedeutet Nützlichkeit, daß der Test in irgendeiner Weise zur Förderung eines in Not geratenen Kindes beitragen muß. Er sollte z.B. Wege zu einem Funktionstraining aufweisen, therapeutische Maßnahmen implizieren, zu pädagogischem Handeln auffordern.
6
3) Kritik
Die Bedingungen einer standardisierten Situation sind so eng, daß dem Diagnostiker kein eigener Ermessensspielraum zur Ausgestaltung der Situation bleibt.
Man kann nicht verhindern, daß Kinder durch klassische Testverfahren ständig über- oder unterfordert werden. Es wird häufig viel Zeit für die Durchführung eines Testes benötigt und trotzdem wird möglicherweise die wirkliche Leistungsfähigkeit gar nicht ermittelt. Müdigkeit, Konzentrationsmangel und Frustration kann ein Verfahren nach sich ziehen, das ein Kind über- oder unterfordert.
Tests sind nicht ökonomisch, weil sie keine Antwort auf spezifische Fragestellungen liefern.
Die Forderung nach Objektivität ist gerade im Zusammenhang mit ‚Problemkindern‘ schwierig. Ohne Lob, Ermutigung und Pausen wären manche Kinder überhaupt nicht testfähig. Auch bei sprachlichen Verständnisschwierigkeiten besteht die Neigung zu besonderen Erklärungen, Wiederholungen oder neuen Akzentuierungen. Schließlich wird im förderdiagnostischen Prozeß gefordert, das Kind zu Verstehen. Das setzt aber ein Bemühen um eine Beziehung zum Kind voraus.
Beim Einsatz von Tests besteht die Gefahr, das Kind auf seine Funktionsbereiche zu reduzieren und damit auch seine Lebenswirklichkeit und die Lerngeschichte nicht zu erfassen.
Letztlich bleibt zu sagen, daß sich ein Dilemma für den Untersucher ergibt. Setzt er Tests ein, dann kommen die gerade genannten Kritikpunkte und Gefahren voll zum Tragen. Setzt er keine Tests ein, riskiert er den Vorwurf, unwissenschaftlich zu arbeiten.
Ein guter Kompromiß stellt die Verwendung eines adaptiven Testverfahrens, z.B. AID dar, so kann zumindest das Problem der Über-und Unterforderung umgangen werden.
7
Arbeit zitieren:
Stefanie Plener, 1999, Psychologische Tests, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Change Management - Problemlösung durch den Einsatz von Mediation in C...
BWL - Unternehmensführung, Management, Organisation
Seminararbeit, 46 Seiten
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Stefanie Plener hat den Text Psychologische Tests veröffentlicht
Stefanie Plener hat einen neuen Text hochgeladen
Josef Hofrichter hat den Text Psychologische Tests kommentiert
A Collection of Test Problems for Constrained Global Optimization Algo...
Christodoulos A. Floudas, Panos M. Pardalos
Test des Satzverständnisses bei Kindern (TSVK)
Eine profilorientierte Diagnos...
Julia Siegmüller, Christina Kauschke, Susanne van Minnen, Dagmar Bittner
Josef Hofrichter
MPU / Hilfesuchend.
In wie fern sind Ihrer meinung psychilogische Tests relivant?
Die Gesprächsdauer beläuft sich ca. 20 Min. und wird vom durchfürenden Psychologen durch gezielte Fragen in eine Richtung geleitet!
Um ein gewünschtes Resultat zu bekommen bracht es nur die richtigen Fragen , die wiederum anzuführen es braucht um ein Ergebniss zu bekommen das gewollt war.
Wie sehen sie das ?
um eine Antwort ............
MfG
Josef
am Thursday, November 06, 2008-