Testmethodik und Fragebogenkonstruktion – messmethodische Grundlagen


Seminararbeit, 2010
45 Seiten, Note: 1,7

Leseprobe

Inhaltsverzeichnis

1 Problemstellung

2 Grundlagen der Test- und Fragebogenmethodik
2.1 Wesen und Bedeutung des Tests
2.2 Die Fragebogenmethode
2.3 Gütekriterien als wesentliche Anforderungen
2.3.1 Objektivität
2.3.2 Reliabilität
2.3.3 Validität

3 Methodischer Ablauf eines Tests
3.1 Überblick des Testablaufs
3.2 Formulierung des Forschungsproblems, Planung und Vorbereitung
3.3 Durchführung, Auswertung und Berichterstattung

4 Grundzüge der Fragebogenkonstruktion
4.1 Konstruktion von Fragen
4.1.1 Kognitive Prozesse während der Befragung
4.1.2 Auswahl von Fragen
4.1.3 Fragetypen
4.1.4 Regeln zur Fragenformulierung
4.2 Skalen und Skalierungsverfahren
4.3 Struktureller Aufbau des Fragebogens

5 Mögliche Einflüsse auf verfälschte Fragebogenergebnisse
5.1 Antwortverhaltenstendenzen und deren Kontrollmöglichkeiten
5.2 (Un)bewusste Fragebogenmanipulation durch den Forscher

6 Abschließende Betrachtung und kritische Würdigung

Literaturverzeichnis

Abbildungsverzeichnis

Abbildung 1: Zusammenfassung der Haupt- und Nebengütekriterien

Abbildung 2: Hauptphasen einer empirischen Untersuchung

Abbildung 3: Prozesse bei der Beantwortung von Fragen

Abbildung 4: Gebräuchliche Skalierungsverfahren der Sozialwissenschaften

Abbildung 5: Rating-Skala

Abbildung 6: Eckpunkte einer gelungenen Test- bzw. Fragebogenkonstruktion

Tabellenverzeichnis

Tabelle 1: Zentrale Fragen bei der Bestimmung der Inhaltsvalidität

Tabelle 2: Phasen einer empirischen Untersuchung

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Problemstellung

In einer zunehmend komplexeren Welt, die mitunter durch tiefgreifende Ver­änderungen innerhalb unserer Wissensgesellschaft geprägt ist, kommt neben der Generierung neuen Wissens der systematischen Dokumentation, Beschreibung und Bewertung sozialer Tatbestände aber auch der Erfassung von Persönlichkeits­merkmalen und Einstellungen – sei es aus Perspektive der Markt-, Meinungs- oder Bildungs­forschung – immer größere Bedeutung zu (vgl. Atteslander, 2008, S. V-7; Gollwitzer & Jäger, 2009, S. XI). Dabei werden u. a. in der wissenschaftlichen Praxis unterschiedlichste Ansätze und Methoden zur Erforschung der Umwelt verwendet, die je nach Aspekt und Ziel des Evaluationsgegenstandes stark voneinander variieren können (vgl. Gollwitzer & Jäger, 2009, S. XI; Mayer, 2008,
S. 5). Als weitverbreitetes Untersuchungsverfahren hat sich dabei die Fragebogen­methode, insbesondere in der psychologischen Forschung, etabliert (vgl. Mummendey& Grau, 2008, S. 13; Pospeschill&Spinath, 2009, S. 92).

Im Zuge dessen erweist es sich als große Herausforderung, Fragebögen auf wissenschaftlich fundierter Basis zu erstellen, deren Entwicklung, Durchführung und Auswertung sich an einer strukturierten Vorgehensweise orientieren (Mayer, 2008,
S. 5). Das Spektrum an ‚Regeln’ für die gelungene Fragebogenkonstruktion reicht dabei von der Berücksichtigung einiger wesentlicher Gütekriterien, die ebenfalls bei der Testentwicklung zu befolgen sind, bis hin zur geeigneten Auswahl und Formulierung der Fragen sowie dem gelungenen Aufbau eines Fragebogens (vgl. Bortz & Döring, 2006, S. 253; Rost, 1996, S. 31). Eine der Hauptschwierigkeiten besteht insbesondere in der gelungenen Auswahl und Reihenfolge der Fragen, sogenannte Items, die den Untersuchungsgegenstand möglichst reliabel und valide erfassen sollen, aufgrund ihrer unglücklichen Komposition jedoch auch Spielraum für Missverständnisse zulassen können (Mummendey& Grau, 2008, S. 40-41). „Die Formulierung von Items hat also einen erheblichen Einfluss auf das Verständnis von Fragen und auf deren Beantwortung“ (Mummendey& Grau, 2008, S. 40). Rost (1996, S. 60) sieht sogar in der Formulierung und Konstruktion von Items „die eigentliche Arbeit der Testkonstruktion“.

Vor diesem Kontext müssen „neben Intuition, Sprachgefühl und Erfahrung auch und vor allem wissenschaftliche Erkenntnisse über die bei der Befragung ablaufenden Prozesse[...]“ (Porst, 2009, S. 12) bei der Fragebogenkonstruktion berücksichtigt werden, um verwertbare Ergebnisse zu erhalten, die nicht rein zufälliger bzw. will­kürlicher Natur sind (Mayer, 2008, S. 5). Vielfältige Untersuchungen aus der Methodenforschung haben bereits diverse Effekte durch eine bestimmte Fragen­konstellation bzw. unterschiedliche Fragenformulierung auf die Antwortresultate auf­gezeigt und analysiert. Einflüsse dieser Art sollten bei der Test- und Fragebogen­konstruktion zumindest bekannt sein, um unerwünschte Antworteffekte zu vermeiden, oder bereits vorliegende Fragebögen – auch vor dem Hintergrund des bewussten Einsatzes solcher Effekte – besser beurteilen zu können (Schumann, 2006, S. 51).

Dennoch genügen viele Fragebögen nicht den an sie gestellten wissenschaftlichen Ansprüchen und liefern in dem Sinne „irgendwie irgendeine Art von Antwort[...]“ (Porst, 2009, S. 11). Doch auch bei Berücksichtigung wesentlicher wissen­schaftlicher Kriterien für eine gelungene Test- und Fragebogenkonstruktion erkennen Bradburn, Sudman undWansink (2004, S. 317) Folgendes: „Even after yearsofexperience, no expert canwrite a perfectquestionnaire“. Daraus wird bereits ersichtlich, dass trotz einschlägiger Fachliteratur und umfassender empirischer Studien zu diesem Themenkomplex die Konstruktion von Fragebögen keineswegs als trivialer Vorgang bezeichnet werden kann.

In dieser Arbeit soll daher die zentrale, zielleitende Frage geklärt werden, wie ein gelungener Test bzw. Fragebogen auf wissenschaftlich fundierter Basis konstruiert werden sollte, dessen Entwicklung, Durchführung und Auswertung in strukturierter Vorgehensweise verläuft. Einführend wird dazu im zweiten Kapitel zunächst auf die Grundlagen der Test- und Fragebogenmethodik eingegangen und wesentliche Begrifflichkeiten näher erläutert, die als theoretisches Fundament für das weitere Verständnis von elementarer Bedeutung sind. Weiterhin sei hierbei das Augenmerk auf einige wesentliche Gütekriterien gelenkt, deren Einhaltung einen essenziellen Beitrag für die berechtigte Frage nach einer zufriedenstellenden Ergebnisgüte leistet. Mit dem notwendigen theoretischen Basiswissen wird nachfolgend im dritten Kapitel näher darauf eingegangen, wie ein Test in strukturierter Vorgehensweise ab­laufen sollte. Der prozessähnliche Ablauf stellt dabei eine gute Orientierungshilfe für den Forscher dar, dessen einzelne Phasen unter Berücksichtigung wichtiger Aspekte vorgestellt werden. Auf Basis dessen werden in den nachfolgenden Kapiteln daraus ausgewählte, wichtige Themengebiete näher aufgegriffen. Dazu wird im vierten Kapitel der Frage nachgegangen, wie die eigentliche Konstruktion eines Fragebogens durchgeführt wird. Insbesondere ‚Test- und Fragen­bogen­neu­linge’ haben vor diesem Kontext Schwierigkeiten, das komplexe Spektrum an Faktoren zu überblicken und sind infolgedessen in diesem Stadium oftmals über­fordert. Daher sollen zunächst die kognitiven Prozesse der Probanden während der Befragung im Mittelpunkt stehen, da ein Mindestmaß an Kenntnissen darüber für die Fragebogenkonstruktion benötigt wird. Anschließend soll nicht nur der Frage nach einer gelungenen Fragenformulierung nachgegangen werden, sondern auch die Fragenauswahl, die verschiedenenSkalen undSkalierungsverfahren sowie der strukturelle Aufbau des Fragebogens detailliert erläutert werden. Im Anschluss wird näher darauf eingegangen, welche Phänomene Fragebogenergebnisse verfälschen können und welche Lösungsmöglichkeiten es diesbezüglich gibt. Dabei zielt das fünfte Kapitel ebenfalls darauf ab, die Leser –auch vor dem Hintergrund weiterer aufgezeigter Manipulationsmöglichkeiten – für bestimmte Effekte zu sen­si­bi­lisieren. Im letzten Kapitel wird die Test- und Frage­bogen­me­tho­dik sowie deren Umsetzung durch den Forscher unter Rekurrierung der vorherigen Abschnitte einer abschließenden Betrachtung und kritischen Würdigung unterzogen.

2 Grundlagen der Test- und Fragebogenmethodik

2.1 Wesen und Bedeutung des Tests

Im deutschen Sprachgebrauch ist der aus dem englischen Wortschatz stammende Begriff ‚Test' mittlerweile zu einem festen Bestandteil geworden, dessen Ver­wendung in unterschiedlichsten Bedeutungszusammenhängen zum Tragen kommt und dabei bei weitem die ursprüngliche Bedeutung, nämlich ‚Probe’, übersteigt (vgl. Lienert &Raatz, 1998, S. 1; Grubitzsch, 1999, S. 17). Die Bedeutungsvielfalt des Begriffs kann durch folgende Auflistung nach Lienert undRaatz (1998, S. 2) verdeutlicht werden, die den Test der Bedeutung nach wie folgt gliedern:

a) „Ein Verfahren zur Untersuchung eines Persönlichkeitsmerkmals.
b) Den Vorgang der Durchführung der Untersuchung.
c) Die Gesamtheit der zur Durchführung notwendigen Materialien.
d) Jede Untersuchung, sofern sie Stichprobencharakter hat.
e) Gewisse mathematisch-statistische Prüfverfahren (z. B. χ2-Test)
f) Kurze, außerplanmäßige ‚Zettelarbeiten’ im Schulunterricht.“

Im Folgenden soll nun näher auf die erste dargestellte Bedeutung eingegangen werden, auch vor dem Hintergrund einer thematischen Verzahnung mit dem Konstrukt des Fragebogens, das ebenfalls im Zuge dieser Arbeit sukzessive erschlossen werden soll.

Ein Test „zur Erfassung psychischer Eigenschaften oder Merkmale von Personen“ (Rost, 1996, S. 17) kann dabei als „wissenschaftliches Routineverfahren zur Unter­suchung eines oder mehrerer empirisch abgrenzbarer Per­sönlich­keits­merk­male mit dem Ziel einer möglichst genauen quantitativen Aussage über den Grad der individuellen Merkmalsausprägung“ (Lienert &Raatz, 1998, S. 1) verstanden werden. In diesem Zusammenhang wird oftmals auch von psychologischen bzw. psychometrischen Tests gesprochen (vgl. Rost, 1996, S. 17; Bühner, 2006, S. 23). Unabhängig von der genauen Bezeichnung ist jedoch die ‚Wissenschaftlichkeit’ vordergründiges Merkmal eines solchen Verfahrens, das u. a. bestimmten test­theoretischen Qualitätsansprüchen bei der Testprozedur genügen muss (Moosbrugger&Kelava, 2007a, S. 2).

Deutlich davon abzugrenzen sind ‚alltägliche’ Tests, die bspw. in vielfältiger Art und Weise zur Persönlichkeitsmessung in Illustrierten eingesetzt werden, jedoch Behauptungen über eine Sache unbegründet im Raum stehen lassen (Grubitzsch, 1999, S. 18). Wissenschaftliche Tests hingegen laufen vielmehr unter routine­mäßigen, also standarisierten Bedingungen ab und ermöglichen „eine relative Positionsbestimmung des untersuchten Individuums innerhalb einer Gruppe von Individuen oder im Bezug auf ein bestimmtes Kriterium [...]“ (Lienert &Raatz, 1998, S. 1).

Je nach Betrachtungsweise wird in der Fachliteratur oftmals auch von einem Test im ‚weiteren’ bzw. ‚engeren’ Sinne gesprochen. Dabei soll insbesondere der Test im weiteren Sinne hervorgehoben werden, da hierunter auch Fragebögen, standard­isierte Interviews und standardisierte Beobachtungen subsumiert werden können. Unter Tests im engeren Sinne zählen nur solche Verfahren, die sich nicht durch Intention der untersuchten Person in eine gewünschte Richtung verfälschen lassen (vgl. Bühner, 2006, S. 20; Rost, 1996, S. 17). An dieser Stelle sei schon einmal erwähnt, dass die Beeinflussung von Tests, insbesondere bei der Verwendung von Fragebögen, Beobachtungen und Interviews ein ernst­zunehmendes Problem darstellt, dessen Tragweite genauer im Kapitel 5dargestellt werden soll.

2.2 Die Fragebogenmethode

Die heutigen Einsatzgebiete von Fragebögen sind so mannigfaltig wie deren Konstruktion selbst (Mummendey& Grau, 2008, S. 19-20). Daher kann der Begriff des Fragebogens auch nur in begrenztem Umfang mit den englischen Bezeichnungen ‚Questionnaire’ bzw. ‚Scale’ gleichgesetzt werden, da dieser als eine Art„Sammelausdruck für vielfältige Formen schriftlicher Befragung in verschiedenen inhaltlichen Bereichen [...]“ (Moosbrugger&Kelava, 2007a, S. 2) eingesetzt wird.

Im Groben lassen sich Fragebögen in zwei Kategorien unterteilen. Auf der einen Seite werden sie zur Erfassung eindeutig abgegrenzter Persönlichkeitsmerkmale oder Einstellungen eingesetzt und entsprechen damit in ihrer Zielsetzung dem englischen Questionnaire. Die Konstruktion solcher Fragebögen orientiert sich eng an den qualitativen Anforderungen eines Tests und beschreibt im Ergebnis summarisch die Ausprägung des geprüften psychischen Merkmals durch induktiven Schluss des Antwortverhaltens (vgl. Bortz & Döring, 2006, S. 253; Moosbrugger&Kelava, 2007a, S. 2; Rost, 1996, S. 20). Auf der anderen Seite werden Fragebögen jedoch auch konzipiert, um konkrete Verhaltensweisen der untersuchten Teilnehmer zu erfassen, Informationen über generelle Sachverhalte oder Zustände zu ermitteln oder Angaben über das Verhalten anderer Personen zu identifizieren. Dabei liegt der Fokus solcher Fragebögen auf der „Beschreibung und Bewertung konkreter Sachverhalte durch die befragten Personen“ (Bortz & Döring, 2006, S. 253). Anders als bei Einstellungs- und Persönlichkeitsfragebögen ist das Antwortverhalten in solchen Fragebögen genau dasjenige, was auch direkt erfasst werden soll (Rost, 1996, S. 20). Mit der exemplarischen Frage, welche Partei eine befragte Person bei der nächsten Bundestagswahl zu wählen beabsichtigt, ist der Forscher also direkt an der Antwort selbst interessiert – im Sinne einer politischen Umfrage – und schließt nicht implizit vom Antwortverhalten auf ein zu messendes Merkmal, wie bspw. das politische Interesse.

Weitaus schwieriger stellt sich die Sachlage dar, wenn Einstellungen bzw. Persönlichkeitsmerkmale erfasst werden sollen, die erst durch induktiven Schluss mittels Operationalisierung durch bestimmte Fragestellungen erfasst werden können. Dabei handelt es sich um theoretische Konstrukte, die oftmals auch als ‚latente Variablen bezeichnet werden (vgl. Mayer, 2008, S. 59; Bühner, 2006, S. 21). Als eines der wohl bekanntesten psychologischen Konstrukte kann dabei ‚Intelligenz’ genannt werden. Durch geschickte Fragebogenkonstruktion wird somit versucht, solche latenten Variablen durch das entsprechende Antwortverhalten messbar zu machen. „Es wird also angenommen, dass eine (zunächst unbekannte) latente Variable für das Zustandekommen der Antworten [...] ‚verantwortlich’ ist und daher deren beobachtbare Zusammenhänge ‚produziert’“ (Bühner, 2006, S. 21). Genau solchen Herausforderungen stehen Fragebögen gegenüber, die nach Prinzipien der Testentwicklung konstruiert werden (Bortz & Döring, 2006, S. 253).

Unabhängig von der Intention von Fragebögen sollten jedoch wesentliche ‚Testgütekriterien’ beachtet und eingehalten werden, um den geforderten hohen Qualitätsansprüchen gerecht zu werden (Moosbrugger&Kelava, 2007a, S. 2). Weiterhin stellen „die Auswahl und die Formulierung der Fragen sowie der Aufbau des Fragebogens zentrale Themen einer Fragebogenkonstruktion“ (Bortz & Döring, 2006, S. 253) dar, deren Beachtung, unabhängig der Zielsetzung, ebenfalls hohe Bedeutung geschenkt werden muss und im folgenden Verlauf dieser Arbeit näher erarbeitet werden soll.

2.3 Gütekriterien als wesentliche Anforderungen

2.3.1 Objektivität

„Gütekriterien dienen als Zielvorgabe und zur Überprüfung von Forschungs­methoden“ (Mayer, 2008, S. 55). In der gängigen Fachliteratur werden diese oftmals in ‚Hauptgütekriterien’ und ‚Nebengütekriterien’ unterteilt, wobei der Schwerpunkt im Weiteren auf den Hauptgütekriterien ankern soll. Nach Lienert und Raatz (1998, S. 7) muss ein guter Test die Hauptgütekriterien ‚Objektivität’, ‚Reliabilität’ und ‚Validität’ erfüllen. Zu den Nebengütekriterien zählen sie ‚Normiertheit’, ‚Vergleich­barkeit’, ‚Ökonomie’ und ‚Nützlichkeit’, wobei sie diese nur als bedingte For­derungen deklarieren. Vor dem Kontext der Fragebogenkonstruktion sehen Mummendey und Grau (2008, S. 100) insbesondere die Gütekriterien Reliabilität und Validität als die wichtigsten an, die sich ihrerseits wieder in Teilaspekte unter­gliedern und in einer logischen Beziehung zueinanderstehen (Rost, 1996, S. 39). Nachfolgend werden die Hauptgütekriterien dargestellt und anschließend näher beleuchtet.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Zusammenfassung der Haupt- und Nebengütekriterien

Quelle: Bühner, 2006, S. 44

Ein Fragebogen oder Test kann als objektiv eingestuft werden, „wenn die gemessenen Merkmale, die das Ergebnis [...] darstellen, unabhängig von Unter­suchungs­leiter, von der auswertenden Person und der Ergebnisinterpretation sind“ (Pospeschill&Spinath, 2009, S. 57). Ein Test ist also genau dann objektiv, wenn verschiedene Testleiter bei dem entsprechenden Probanden zu gleichen Ergeb­nissen gelangen (Kubinger, 2009, S. 39). In diesem Zusammenhang wird oftmals auch von ‚interpersoneller Übereinstimmung’ der Testleiter gesprochen (Lienert &Raatz, 1998, S. 7).

Die Frage nach vollkommener Objektivität ist insbesondere bei Fragebögen ein vielfach diskutiertes Thema in der psychologischen Forschung und muss daher aus differenziertem Blickwinkel beurteilt und betrachtet werden. Auf der einen Seite, und dies trifft insbesondere bei Einstellungs- und Persönlichkeitsfragebögen zu, werden mit Fragebogenitems kognitive Zustände und Erlebnisweisen erfragt, die je nach Untersuchungsperson variieren und daher subjektiver, von außen schwer beobacht­barer Natur sind. Auf der anderen Seite „geschieht dies in einer standardisierten Form derart, dass die Frage oder Feststellung als stets in unveränderter Weise dargebotenen Reiz aufzufassen ist [...]“ (Mummendey& Grau, 2008, S. 16). Daher besteht in gewisser Weise ein Spannungsverhältnis, was dem Fragebogen eine Zwischenstellung zwischen objektiven und subjektiven Verfahren zukommen lässt. Einen formalen Konsens liefert Mittenecker (1971, S. 461), der subjektive Persön­lich­keits­tests als objektive Tests mit der Begründung klassifiziert, dass solche Verfahren eine hohe Objektivität aufweisen und mit Hilfe quantitativer Methoden entwickelt und interpretiert werden.

Der Vollständigkeit halber sei an dieser Stelle noch erwähnt, dass das Gütekriterium Objektivität in drei Aspekte unterschieden werden kann, nämlich Durchführungs-, Auswertungs- und Interpretationsobjektivität (Lienert &Raatz, 1998, S. 8). In Anbe­tracht der gewichtigeren Bedeutsamkeit folgender Gütekriterien sollen diese jedoch forcierter behandelt werden.

2.3.2 Reliabilität

„Unter Reliabilität versteht man den Grad der Genauigkeit, mit dem ein Test ein bestimmtes Merkmal misst, unabhängig davon, ob er dieses Merkmal auch zu messen beansprucht“ (Bühner, 2006, S. 35). Zur Reliabilitätsprüfung bei Fragebögen haben sich vor allen Dingen die Prinzipien der ‚inneren Konsistenz’ und der ‚zeitlichen Stabilität’ als bedeutsam erwiesen.Mit dem Prinzip der inneren Konsistenz werden die einzelnen Fragebogenteile einer genaueren Überprüfung unterzogen. Es wird also untersucht, ob die verschiedenen Fragenitems zur Messung eines Konstrukts dasselbe Ergebnis erbringen und schließt auf Grundlage dessen auf die Messgenauigkeit des Fragebogens. Sollten bspw. einzelne Fragenitems Unterschiedliches messen und damit eine geringe Korrelation zueinander aufweisen, deutet dies auf ungenaues Messen hin (Mummendey& Grau, 2008, S. 100). Eine in der Praxis gängige Methode stellt dabei die Halbierung des Fragebogens in zwei Hälften mit anschließender Berechnung der Korrelation beider Hälften dar, die sogenannte ‚Testhalbierungs-Reliabilität’ bzw. ‚Split-Half-Reliabilität’. Eine abgewandelte Form besteht in der ‚Paralleltest-Reliabilität’, wofür zwei parallele Test- bzw. Fragebogenformen auf­gestellt werden, deren jeweilige Fragenitems möglichst äquivalent hinsichtlich Inhalt, Trennschärfe und Schwierigkeit zueinander sind und nach Maßgabe einer fehlerfreien Messung eine hohe Korrelation zueinander aufweisen sollten (vgl. Mummendey& Grau, 2008, S. 100; Moosbrugger&Kelava, 2007b, S. 12).

Als die Standardmethode zur Schätzung bzw. Messung der inneren Konsistenz hat sich jedoch der ‚Koeffizient Alpha’ nach Cronbach – kurz Cronbachsa – etabliert, der in einer einzigen Maßzahl Aussagen über die mittlere Itembeziehung unter gleichzeitiger Berücksichtigung der Itemanzahl trifft (vgl. Bühner, 2006, S. 132; Schermelleh-Engel&Werner, 2007, S. 126; Mummendey& Grau, 2008, S. 101). Die Gebräuchlichkeit ist vor allen Dingen damit zu begründen, dass ein Fragebogen u. a. nicht wie bei der Split-Half-Methode aufgeteilt werden muss, „sondern in so viele, wie er Items hat“ (Mummendey& Grau, 2008, S. 101) und damit die Präzision der Messung erhöhen kann. Außerdem ist ein weiterer Vorteil darin begründet, dass der Test nur einmal durchgeführt werden muss und die Erstellung eines Paralleltests nicht von Nöten ist (Schermelleh-Engel&Werner, 2007, S. 126).

Nach Diekmann (2009, S. 253) sollte die Reliabilität eines Messinstruments einen Wert von a=0,80 nicht unterschreiten. Vor diesem Hintergrund sei jedoch erhöhte Vorsicht bei der Interpretation von Cronbachsa geboten, dessen normierter Werte­bereich zwischen 0 und 1 liegt (Langer, 1999, S. 1), da nicht nur eine hohe Item-Interkorrelation – die ja gerade die Höhe der internen Konsistenz beeinflusst – sondern auch die Anzahl der Items den a-Wert entscheidend beeinflussen kann (vgl. Bortz & Döring, 2006, S. 199; Schermelleh-Engel&Werner, 2007, S. 126). Es wäre also zu eng gefasst, den Schluss zu ziehen, dass die Items genau ein gemeinsames Merkmal erfassen würden, und damit eindimensional wären, wenn der a-Wert entsprechend hoch ist. Vielmehr könnte die hohe Anzahl an Items, die evtl. mehrdimensionale Merkmale, wie bspw. Depressivität und Ängstlichkeit, messen, und damit eine geringe Trennschärfe besitzen, dies bedingen (vgl. Bühner, 2006, S. 132; Schermelleh-Engel&Werner, 2007, S. 127). An diesem Punkt sei auf die Zuhilfenahme von gängigen Statistik-Programmen wie SPSS verwiesen, die detaillierte Angaben zum Einfluss einzelner Items auf den a-Wert liefern können (Bortz & Döring, 2006, S. 199).

Die Prüfung der zeitlichen Stabilität wird in der Regel durch einen ‚Retest’ vollzogen. Zur Ermittlung der ‚Retest-Reliabilität’ wird also ein Test bzw. Fragebogen zu zwei verschiedenen Zeitpunkten denselben Testpersonen vorgelegt und die Korrelation aus beiden Fragebogen-Gesamtwerten ermittelt (vgl. Mummendey& Grau, 2008, S. 101; Bühner, 2006, S. 36). Dabei ist der ‚Retest-Koeffizient’ vor der „Annahme einer relativen Konstanz des erfassten Persönlichkeitsmerkmals“ (Mummendey& Grau, 2008, S. 101) zu interpretieren. An dieser Stelle muss jedoch darauf hin­gewiesen werden, dass ein zu kurzes Zeitintervall zwischen Test und Retest die Ergebnisse, bspw. durch Erinnerungs- oder Übungseffekte, beträchtlich beein­flussen können. Grundsätzlich sollte die Ermittlung der Retest-Reliabilität nur dann durchgeführt werden, wenn Eigenschaftsstabilität unterstellt wird, da die Erfassung situationsabhängiger Merkmale, wie bspw. die aktuelle Stimmung, bereits im Retest zu ganz anderen Messergebnissen führen kann. Bei Einstellungsfragebögen sollte der Akzeptanzbereich des Reliabilitätskoeffizienten den Bereich unter 0,8, bzw. bei sehr kurzen Fragebögen0,7, nicht unterschreiten. Grundsätzlich gilt, dass ein hoher Retest-Korrelationskoeffizient sowohl auf hohe Merkmalsstabilität, als auch auf hohe Messreliabilität hindeutet (Mummendey& Grau, 2008, S. 101-102).

[...]

Ende der Leseprobe aus 45 Seiten

Details

Titel
Testmethodik und Fragebogenkonstruktion – messmethodische Grundlagen
Hochschule
Johannes Gutenberg-Universität Mainz
Veranstaltung
Aktuelle Forschungsfragen der Wirtschaftspädagogik
Note
1,7
Autoren
Jahr
2010
Seiten
45
Katalognummer
V161615
ISBN (eBook)
9783640750832
ISBN (Buch)
9783640751495
Dateigröße
1330 KB
Sprache
Deutsch
Anmerkungen
In Zusammenarbeit mit Co-Autor Christian Spring
Schlagworte
Fragebogenmethodik, Fragebogen, Fragebogenkonstruktion, Gütekriterien
Arbeit zitieren
Alex Sauer (Autor)Christian Spring (Autor), 2010, Testmethodik und Fragebogenkonstruktion – messmethodische Grundlagen, München, GRIN Verlag, https://www.grin.com/document/161615

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Testmethodik und Fragebogenkonstruktion – messmethodische Grundlagen


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden