Psychologische Tests
1) Der psychologische Test
Unter dem Wort „Test“ können mehrere Dinge verstanden werden: In den meisten Fällen ist mit Test ein Verfahren zur Untersuchung eines Persönlichkeitsmerkmals gemeint.
nach LIENERT (S. 61/62):
„ Ein Test ist ein wissenschaftliches Routineverfahrenzur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einermöglichst quantitativen Aussage über den relativenGrad der Merkmalsausprägung.“
Der psychologische Test ist ein Beobachtungs- oder Prüfsystem, das sich auf eine Verhaltensstichprobe richtet. Er klassifiziert eine Person innerhalb einer Gruppe oder stuft sie quantitativ auf einer Skala ein. Ein Test will Aussagen über zukünftiges Verhalten ma- chen (Prognose).
Der Testtheorie liegt die Annahme zugrunde, daß sich psychische Eigenschaften messen lassen z.B. mit Hilfe von Punkten oder Ra- ting-Skalen.
Ein psychologischer Test besteht aus Material bestandteilen und Durchführungs bestandteilen.
Zu den Material bestandteilen gehören das Testhandbuch, das Testmaterial und die Auswertungshilfen.
Zu den Durchführungs bestandteilen gehören die Testanweisung o- der Instruktion des Testleiters, die Testdurchführung, die Testauswertung und die Interpretation.
2) Gütekriterien für Tests
a) Objektivität
nach Lienert (S. 69):
Objektivität ist der „ Grad, in dem die Ergebnisse eines Tests unabhängig vom Untersucher sind. Ein Test wäre demnach vollkommen objektiv, wenn verschiedene Un-tersucher bei demselben Pbn zu gleichen Ergebnissen gelangten“
Man unterscheidet nach verschiedenen Phasen des diagnostischen Prozesses folgende Objektivitäten:
Durchführung- oder Darbietungsobjektivität
Bei der Darbietung und Durchführung des Tests darf soziale Interaktion auf das Maß beschränkt bleiben, das der Test vorgibt.
Eine gewisse Subjektivität bleibt unvermeidbar, auch, wenn sich der Versuchsleiter an die Testanweisung hält, denn Blickkontakt, Stimmführung usw. sind natürlich personabhängig.
Auch die äußerliche Situation (Räumlichkeiten, Tageszeit...) sollte für alle gleich sein.
Auswertungsobjektivität
Auch die Auswertung sollte unabhängig vom Versuchsleiter gleich ausfallen. Bei Unterscheidung in ‚richtig‘ oder ‚falsch‘ oder bei gebundenen Aufgaben ist das relativ einfach zu gewährleisten, je- doch bei Aufgaben, die die Spontaneität oder Kreativität ist das schon schwieriger.
Interpretationsobjektivität
Die volle Interpretationsobjektivität ist gegeben, wenn die Auswer- tung einen numerischen Wert liefert, der die Position des Pbn in einer Rangskala festlegt. Ansonsten ist dieses Kriterium nicht durchzuhalten.
Objektivität der Konsequenzen
Gemeint ist hiermit, daß das Testbuch Auskunft über die Maßnah- men enthalten soll, die aufgrund einer bestimmten Diagnose einzu- leiten sind.
Durch einen psychologische Test kann niemals die Ausgangsfragestellung der Untersuchenden beantwortet werden.
b) Reliabilität
nach LIENERT (S. 73):
Unter Reliabilität versteht man „ den Grad der Genauigkeit, mit dem er ein bestimmtes Persönlichkeits- oder Verhaltensmerkmal mißt, gleichgültig, ob er dieseMerkmal auch zu messen beansprucht.“
Bei einer Wiederholung des Testes unter gleichen Bedingungen dürfte der Testwert demnach kaum schwanken.
Es ist üblich, die Zuverlässigkeit eines Tests als Korrelationskoeffi- zient anzugeben. Er wird von dem Symbol ‚r‘ bezeichnet und ist so angelegt, daß er Werte zwischen r=+1,00 und r=-1,00 annimmt. Ein ausreichender Korrelationsquotient ist ab r=+0,80 gegeben.
Voraussetzungen für die Reliabilität:
1. Stabilität des zu messenden Merkmals, d.h. das Merkmal darf sich nicht schnell verändern.
2. gesicherte Objektivität
3. ausreichend viele Aufgaben (Items)
Methoden zur Bestimmung der Reliabilität:
Paralleltestmethode
Von einem Test müssen zwei Formen (A,B) vorliegen. Diese werden dann mit demselben Probanden aufeinanderfolgend mit kurzen zeitlichen Abstand durchgeführt. Je genauer die Ergebnisse übereinstimmen, desto größer ist die Reliabilität.
Allerdings kann auch hier eine Gewöhnung an die Art der Testaufgaben vorliegen (Bekanntheit des Testes)
Retestmethode
Derselbe Test wird bei derselben Person wiederholt. Hierzu muß ein großer zeitlicher Abstand vorliegen.
Liegen die Zeitpunkte zu nah beieinander, besteht wieder die Ge- fahr der Bekanntheit des Testes. Liegen die Zeitpunkte zu weit auseinander, könnten sich die Bedingungen in der Person geändert haben.
Spit-half-Reliabilität
Der Test wird in zwei Hälften geteilt (z.B. gerade Aufgabennum- mern - ungerade Aufgabennummern) und jeweils der Korrelations- koeffizient der einen Hälfte mit dem der anderen Hälfte verglichen.
Bei der Aufteilung müssen beide Testhälften hinsichtlich des Schwierigkeitsgrades gleich sein.
Konsitenzanalyse
Der Test wird in so viele Teile zerlegt, wie der Test Aufgaben hat. Der Korrelationskoeffizient geht aus dem Vergleich aller Aufgaben hervor.
Die Forderung nach hoher Reliabilität könnte in Konflikt geraten mit dem Gedanken an Förderung, denn der förderdiagnostisch ar- beitende Pädagoge möchte ja erreichen, daß sich etwas ändert.
c) Validität
nach LIENERT (S. 79):
Unter Validität versteht man den Grad der Genauigkeit, „mit dem dieser Test dasjenige Persönlichkeitsmerkmal oder diejenige Verhaltensweise, das (die) er messen o-der vorhersagen soll, tatsächlich mißt oder vorhersagt.“
Der Validitätskoeffizient liegt unter dem Reliabilitätskoeffizient:
Abbildung in dieser Leseprobe nicht enthalten
Bei den Vorgehensweisen zur Ermittlung der Validität unterscheidet man vier Möglichkeiten der Bestimmung:
1. inhaltliche Validität
Sachverständige beurteilen, ob die Aufgaben tatsächlich für das zu testende Sachgebiet Relevanz besitzen. Im schulischen Kontext spricht man auch von Lehrplangültigkeit.
2. kriterienbezogene Validität
Ein Außenkriterium mit ausreichender Reliabilität und Validität (etwa ein anderer Test) wird zum Vergleich herangezogen.
3. prognostische Validität
Es wird überprüft, ob sich eine Vorhersage später erfüllt, z.B. Erfolg in einer bestimmten Schulform.
4. Konstruktvalidität
Es geht hier um den Nachweis wie gut ein Test mit der ihm zugrunde gelegten Theorie übereinstimmt.
Ein hohe Validität kann nur eintreten, wenn hohe Objektivität und hohe Reliabilität gegeben sind.
d) Zusatzgütekriterien
i) Normierung
Über einen Test sollen Angaben verfügbar sein, die eine Einordnung des individuellen Testergebnisses in ein größeres Bezugssystem ermöglichen, nämlich Normen.
Man kann davon ausgehen, daß sich Testergebnisse aus zwei Komponenten zusammensetzen: aus dem tatsächlichen Ergebnis und einem Fehleranteil.
Der Bereich in dem der ‚wahre Wert‘ mit großer Wahrscheinlich- keit liegt, wird Vertrauensbereich genannt. Zur Berechnung des Vertrauensbereichs wird der Standardmeßfehler herangezogen. Die Wahrscheinlichkeit, mit der der ‚wahre‘ Testwert außerhalb des Vertauensbereichs liegt, bezeichnet man als Irrtumswahrscheinlich-keit. Die Irrtumswahrscheinlichkeit wird in Prozent ausgedrückt. Sie sollte 5% nicht übersteigen.
Den Mindestunterschied, den zwei Testwerte zeigen müssen, damit die ‚wahren‘ Werte der Probanden als tatsächlich voneinander ver- schieden bezeichnet werden können heißt kritische Differenz.
ii) Vergleichbarkeit
Ein Test ist vergleichbar, wenn Parallelformen vorhanden sind, die sich vor allem hinsichtlich der Validität weitgehend entsprechen.
iii) Ökonomie
Von einem ökonomischen Test spricht man, wenn er möglichst alle nachfolgenden Kriterien erfüllt:
1. ein kurze Durchführungszeit
2. geringer Materialverbrauch
3. einfache Handhabung
4. Durchführung als Gruppentest möglich
5. schnelle und bequeme Auswertung
iv) Nützlichkeit
Ein Test gilt dann als nützlich, wenn er ein Persönlichkeitsmerkmal oder eine Verhaltensweise mißt oder vorhersagt, für dessen (deren) Untersuchung ein praktisches Bedürfnis vorliegt. Dabei muß dieser Test in besondere Weise geeignet sein, so daß er durch keinen anderen Test vertreten werden kann.
Im sonderpädagogischen Arbeitsbereich bedeutet Nützlichkeit, daß der Test in irgendeiner Weise zur Förderung eines in Not geratenen Kindes beitragen muß. Er sollte z.B. Wege zu einem Funktionstraining aufweisen, therapeutische Maßnahmen implizieren, zu pädagogischem Handeln auffordern.
3) Kritik
Die Bedingungen einer standardisierten Situation sind so eng, daß dem Diagnostiker kein eigener Ermessensspielraum zur Ausgestaltung der Situation bleibt.
Man kann nicht verhindern, daß Kinder durch klassische Testverfahren ständig über- oder unterfordert werden.
Es wird häufig viel Zeit für die Durchführung eines Testes benötigt und trotzdem wird möglicherweise die wirkliche Leistungsfähigkeit gar nicht ermittelt. Müdigkeit, Konzentrationsmangel und Frustrati- on kann ein Verfahren nach sich ziehen, das ein Kind über- oder unterfordert.
Tests sind nicht ökonomisch, weil sie keine Antwort auf spezifische Fragestellungen liefern.
Die Forderung nach Objektivität ist gerade im Zusammenhang mit ‚Problemkindern‘ schwierig. Ohne Lob, Ermutigung und Pausen wären manche Kinder überhaupt nicht testfähig. Auch bei sprachli- chen Verständnisschwierigkeiten besteht die Neigung zu besonde- ren Erklärungen, Wiederholungen oder neuen Akzentuierungen. Schließlich wird im förderdiagnostischen Prozeß gefordert, das Kind zu Verstehen. Das setzt aber ein Bemühen um eine Beziehung zum Kind voraus.
Beim Einsatz von Tests besteht die Gefahr, das Kind auf seine Funktionsbereiche zu reduzieren und damit auch seine Lebenswirklichkeit und die Lerngeschichte nicht zu erfassen.
Letztlich bleibt zu sagen, daß sich ein Dilemma für den Untersucher ergibt. Setzt er Tests ein, dann kommen die gerade genannten Kritikpunkte und Gefahren voll zum Tragen. Setzt er keine Tests ein, riskiert er den Vorwurf, unwissenschaftlich zu arbeiten.
Häufig gestellte Fragen zu "Psychologische Tests"
Was ist ein psychologischer Test?
Ein psychologischer Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der Merkmalsausprägung. Er ist ein Beobachtungs- oder Prüfsystem, das sich auf eine Verhaltensstichprobe richtet und Personen innerhalb einer Gruppe klassifiziert oder auf einer Skala einstuft. Tests sollen Aussagen über zukünftiges Verhalten ermöglichen.
Aus welchen Bestandteilen besteht ein psychologischer Test?
Ein psychologischer Test besteht aus Material- und Durchführungsbestandteilen. Zu den Materialbestandteilen gehören das Testhandbuch, das Testmaterial und die Auswertungshilfen. Zu den Durchführungsbestandteilen gehören die Testanweisung oder Instruktion des Testleiters, die Testdurchführung, die Testauswertung und die Interpretation.
Welche Gütekriterien sind für psychologische Tests wichtig?
Die wichtigsten Gütekriterien sind Objektivität, Reliabilität und Validität. Zusätzlich gibt es Zusatzgütekriterien wie Normierung, Vergleichbarkeit, Ökonomie und Nützlichkeit.
Was versteht man unter Objektivität bei psychologischen Tests?
Objektivität ist der Grad, in dem die Ergebnisse eines Tests unabhängig vom Untersucher sind. Es wird zwischen Durchführungsobjektivität, Auswertungsobjektivität, Interpretationsobjektivität und Objektivität der Konsequenzen unterschieden.
Was bedeutet Reliabilität (Zuverlässigkeit) bei psychologischen Tests?
Reliabilität ist der Grad der Genauigkeit, mit dem ein Test ein bestimmtes Persönlichkeits- oder Verhaltensmerkmal misst, unabhängig davon, ob er dieses Merkmal auch zu messen beansprucht. Sie wird oft als Korrelationskoeffizient angegeben (r), wobei Werte ab r=+0,80 als ausreichend gelten.
Welche Methoden gibt es zur Bestimmung der Reliabilität?
Es gibt verschiedene Methoden, darunter die Paralleltestmethode, die Retestmethode, die Split-half-Reliabilität und die Konsistenzanalyse.
Was ist Validität (Gültigkeit) bei psychologischen Tests?
Validität ist der Grad der Genauigkeit, mit dem ein Test dasjenige Persönlichkeitsmerkmal oder diejenige Verhaltensweise tatsächlich misst oder vorhersagt, das (die) er messen oder vorhersagen soll.
Welche Arten von Validität werden unterschieden?
Man unterscheidet inhaltliche Validität, kriterienbezogene Validität, prognostische Validität und Konstruktvalidität.
Was sind Zusatzgütekriterien bei psychologischen Tests?
Zusatzgütekriterien sind Normierung (Vergleichswerte), Vergleichbarkeit (Parallelformen), Ökonomie (kurze Durchführungszeit, geringer Materialverbrauch, einfache Handhabung) und Nützlichkeit (praktischer Nutzen der Testergebnisse für die Untersuchung des Merkmals).
Welche Kritikpunkte gibt es an psychologischen Tests?
Kritikpunkte umfassen die eingeschränkte standardisierte Situation, die mögliche Über- oder Unterforderung der Testpersonen, den hohen Zeitaufwand, fehlende Antworten auf spezifische Fragestellungen, Schwierigkeiten bei der Objektivität insbesondere bei "Problemkindern" und die Gefahr, die Komplexität einer Person auf einzelne Funktionsbereiche zu reduzieren. Es wird auch kritisiert, dass Tests Lebenswirklichkeit und Lerngeschichte des Kindes nicht berücksichtigen.
Was ist ein adaptives Testverfahren (z.B. AID) und wie kann es Probleme bei Tests lösen?
Ein adaptives Testverfahren passt den Schwierigkeitsgrad der Aufgaben an das Leistungsniveau des Kindes an und kann so die Über- oder Unterforderungsproblematik umgehen.
- Arbeit zitieren
- Stefanie Plener (Autor:in), 1999, Psychologische Tests, München, GRIN Verlag, https://www.grin.com/document/96984