Diese Arbeit soll die Frage beantworten, was besser gemacht werden kann, damit ein Test wissenschaftlich fundiert und interpretiert werden kann.
Zuerst beschäftigt sich diese Arbeit mit der Theorie in Kapitel 2-4 (Teststandards, Reliabilität und Testwertinterpretation) und anschließend werden die Inhalte an einem Praxisbeispiel in Kapitel 5 verdeutlicht. Kapitel 6 und 7 runden diese Arbeit mit einer Diskussion zu den Teststandards und der Testwertinterpretation sowie mit einem Fazit und Ausblick ab.
Fragebögen und Tests sind wichtige Konstrukte, um die Meinungen und Leistungen eines Menschen zu erfassen. Kritisch wird es allerdings, wenn diese Tests nicht wissenschaftlich sind. Beispielweise möchte ein Testanwender oder eine Testanwenderin einen Rechentest verwenden, um die Rechenfähigkeit von einem Schüler oder einer Schülerin zu erfassen. Dieser Test ist nun allerdings sehr schlecht erstellt worden, die Items machen eher Aussagen über die Konzentrationsfähigkeit als über die Rechenfähigkeit (Validität), bei mehrfacher Messung des Tests kommen deutlich unterschiedliche Ergebnisse raus, sodass angenommen werden muss, dass der Test einen deutlichen Messfehler hat (Reliabilität) und aufgrund dessen, dass ein Testmanual fehlt, weiß der Testanwender oder die Testanwenderin nicht wie er oder sie den Test bewerten soll (Objektivität). Das sind gerade einmal die Probleme der Hauptgütekriterien, aber es können auch noch mehr Probleme auftreten. So können die Fragen schlecht erstellt sein, indem entweder die Schwierigkeit zu leicht ist und deshalb alle gut abschneiden oder zu schwer sein, indem alle schlecht abschneiden. Auch durch Multiple-Choice-Fragen können die Schüler und Schülerinnen raten, anstatt zu rechnen. Aber selbst, wenn ein Test wissenschaftlich gut ist, muss der Testanwender oder die Testanwenderin wissen, wie er oder sie den Test interpretieren soll. Dazu ist es wichtig die Norm oder die Kriterien richtig zu definieren und die passende Methode zu verwenden, damit die Ergebnisse überhaupt brauchbar sein können. [...]
Inhaltsverzeichnis
1 Einleitung
2 Teststandards
2.1 Standards für die Testentwicklung im Allgemeinem
2.2 Teststandards beim pädagogischen Test
2.3 Qualitätsbeurteilung von Tests
3 Reliabilität
3.1 Retest- Reliabilität
3.2 Paralleltest-Reliabilität
3.3 Split-Half-Reliabilität
4 Testwertinterpretation
4.1 Kriteriumsorientierte Testwertinterpretation
4.2 Normorientierte Testwertinterpretation
4.3 Prozentrangwerte
5 Praxisbeispiel: Rechentest
5.1 Teststandards
5.2 Reliabilität
5.3 Testwertinterpretation und Prozentränge
5.4 Zusammenfassung
6 Diskussion
7 Fazit und Ausblick
Zielsetzung und Themen der Arbeit
Die vorliegende Arbeit zielt darauf ab, die grundlegenden Anforderungen an die wissenschaftliche Erstellung und Interpretation von Tests zu erläutern, wobei insbesondere auf Teststandards, Reliabilität und verschiedene Interpretationsmethoden fokussiert wird, um deren praktische Anwendung anhand eines fiktiven Rechentests zu verdeutlichen.
- Grundlagen der Teststandards in der psychologischen und pädagogischen Diagnostik
- Methoden zur Bestimmung der Reliabilität (Retest, Paralleltest, Split-Half)
- Unterscheidung und Anwendung kriteriums- und normorientierter Testwertinterpretationen
- Praktische Umsetzung der Gütekriterien und Interpretationsstrategien im Kontext eines Rechentests
- Kritische Reflexion über Herausforderungen und Grenzen der Testdiagnostik
Auszug aus dem Buch
3.2 Paralleltest-Reliabilität
Bei der Paralleltest-Reliabilität wird zu einem ursprünglichen Test ein zweiter Test mit vergleichbaren Aufgaben bearbeitet. Sollte der zweite Test zu ähnlichen Ergebnissen kommen, wie der erste Test, dann wird von einer guten Reliabilität gesprochen (Lohaus & Vierhaus, 2019, S. 79). Wichtig ist hierbei, dass der zweite Test nahezu identisch zum ersten Test ist, falls es so einen Test nicht gibt, dann kann diese Methode nicht angewendet werden (Döring & Bortz, 2016, S. 444). Ob zwei Tests ähnlich sind, kann mit faktorenanalytischen Verfahren herausgefunden werden (Moosbrugger & Kelava, 2020, S. 29).
In Kapitel 2.3 Qualitätsbeurteilung von Tests wurde darauf eingegangen, dass Tests bewertet werden durch Rezensionen und diese frei zugänglich sind. Durch diese Methode könnte ein ähnlicher, bereits wissenschaftlich etablierter Test gefunden und verwendet werden.
Ein weiterer Vorteil dieser Methode ist, dass sich die Testpersonen nicht an vorherige Antworten erinnern können, da es schließlich andere Aufgaben sind. Außerdem können beide Tests hintereinander, am selben Tag bearbeitet werden (Rammstedt, 2010, S. 245). Laut Lohaus und Vierhaus (2019, S. 79) können allerdings auch hier die Tests zeitlich abgegrenzt werden, sofern das Zeitintervall nicht zu lang ist.
Zusammenfassung der Kapitel
1 Einleitung: Die Einleitung thematisiert die Problematik mangelhafter Testkonstruktionen und definiert das Ziel der Arbeit, Wege zu einer wissenschaftlich fundierten Testentwicklung und -interpretation aufzuzeigen.
2 Teststandards: Dieses Kapitel erläutert wichtige Leitlinien für die Entwicklung und Qualitätssicherung von psychologischen und pädagogischen Tests sowie deren praktische Bedeutung.
3 Reliabilität: Hier werden die theoretischen Grundlagen der Messgenauigkeit behandelt und drei spezifische Methoden zur Reliabilitätsbestimmung – Retest, Paralleltest und Split-Half – detailliert vorgestellt.
4 Testwertinterpretation: Es wird erklärt, wie Rohwerte aus Tests transformiert werden können, wobei zwischen kriteriums- und normorientierten Ansätzen sowie Prozentrangwerten unterschieden wird.
5 Praxisbeispiel: Rechentest: Die theoretischen Erkenntnisse aus den vorangegangenen Kapiteln werden hier auf ein konkretes, fiktives Praxisbeispiel eines Rechentests angewendet.
6 Diskussion: Das Kapitel reflektiert kritisch über die vorgestellten Methoden und hinterfragt die praktische Umsetzung sowie die wissenschaftliche Validität der Ansätze.
7 Fazit und Ausblick: Zusammenfassend wird die Bedeutung der Einhaltung wissenschaftlicher Teststandards für die Qualität und Aussagekraft diagnostischer Verfahren betont.
Schlüsselwörter
Teststandards, Reliabilität, Testwertinterpretation, Validität, Retest-Reliabilität, Paralleltest-Reliabilität, Split-Half-Reliabilität, Kriteriumsorientierte Interpretation, Normorientierte Interpretation, Prozentrangwerte, Rechentest, Pädagogische Diagnostik, Testmanual, Gütekriterien, Wissenschaftliche Testentwicklung
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit den wissenschaftlichen Anforderungen an die Konstruktion, Anwendung und Interpretation von Tests in der Psychologie und Pädagogik.
Was sind die zentralen Themenfelder der Publikation?
Die Arbeit konzentriert sich auf die Einhaltung von Teststandards, die Sicherstellung der Reliabilität und die korrekte Interpretation von Testergebnissen.
Welches primäre Ziel verfolgt die Arbeit?
Das Hauptziel ist es aufzuzeigen, wie ein Test wissenschaftlich fundiert erstellt und interpretiert werden kann, um eine aussagekräftige Diagnostik zu gewährleisten.
Welche wissenschaftlichen Methoden zur Reliabilitätsprüfung werden verwendet?
Vorgestellt werden die Retest-Reliabilität, die Paralleltest-Reliabilität und die Split-Half-Methode als zentrale Ansätze zur Bestimmung der Messgenauigkeit.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die theoretische Erläuterung der Teststandards und Interpretationsmethoden sowie deren praktische Anwendung an einem fiktiven Rechentest.
Welche Schlüsselwörter charakterisieren diese Arbeit am besten?
Teststandards, Reliabilität, Testwertinterpretation, Validität, Prozentrangwerte und wissenschaftliche Testkonstruktion sind zentrale Begriffe dieser Arbeit.
Warum ist die Unterscheidung zwischen kriteriums- und normorientierter Interpretation wichtig?
Die Wahl der Methode entscheidet darüber, ob die Leistung eines Individuums gegen ein absolutes Kriterium oder im Vergleich zu einer Bezugsgruppe bewertet wird, was je nach Testzweck unterschiedliche Anforderungen an die Auswertung stellt.
Welche Rolle spielt der Rechentest als Praxisbeispiel in Kapitel 5?
Das Beispiel dient dazu, die theoretisch erläuterten Konzepte wie Validität, Fairness und verschiedene Interpretationsarten auf eine konkrete diagnostische Situation in der Schule anzuwenden und praktisch greifbar zu machen.
- Arbeit zitieren
- Denis Pyttel (Autor:in), 2022, Teststandards und Testwertinterpretation für einen Rechentest, München, GRIN Verlag, https://www.grin.com/document/1175864