Leseprobe
Inhaltsverzeichnis
1. Einleitung
2. Theorie
2.1 Persönlichkeitsfragebögen und das Problem der Selbstdarstellung
2.2 Antworttendenzen in der Persönlichkeitstestung
2.2.1 Formale Antworttendenzen
2.2.2 Inhaltliche Antworttendenzen
2.3 Das Konstrukt der Sozialen Erwünschtheit
2.4 Die soziale Erwünschtheit als Suppressorvariable
2.4 Forschungsfrage
3. Methoden
3.1 Literaturrecherche
3.2 Verwendete Schlüsselworte, Suchstrategien & Einträge in den Datenbanken
3.2.1 Literaturrecherche über Google Scholar
3.2.2 Literaturrecherche über JOST
3.2.3 Literaturrecherche in Fernlehrbriefen
3.2.4 Literaturrecherche in Lehrbüchern
4. Ergebnisse
4.1 Strategien im Umgang mit sozialer Erwünschtheit
4.2 Die Kontrollmechanismen des sozial erwünschten Antwortens
4.3.1 Kontrollmaßnahmen in der Testkonstruktion
4.3.2 Kontrollmaßnahmen in der Testadministration
4.3.3 Kontrollmaßnahmen in der Testauswertung
5. Diskussion und Fazit
5.1 Die Definition der sozialen Erwünschtheit und ihre Schwächen
5.2 Forschung im Feld der sozialen Erwünschtheit
5.3 Kontrollmechanismen und deren Wirkung
5.4 Fazit
6. Literaturverzeichnis
7. Eidesstattliche Erklärung
1. Einleitung
Sozial erwünschtes Antworten wird oft als Sonderform der Selbstdarstellung aufgefasst. Meist aus Furcht vor sozialer Verurteilung, neigen Befragte zu konformen Verhalten und orientieren sich in ihren Verhaltensäußerungen strikt an verbreiteten Normen und Erwartungen (Edwards, 1957). Doch was macht das psychologische Konzept sozial erwünschter Reaktionen tatsächlich aus? Gibt es eine einheitliche Herangehensweise für Testungen? Diese Arbeit soll einen Überblick über die Problematik der sozialen Erwünschtheit verschaffen und diese anhand von Konstrukten aus der Forschung verdeutlichen. Es sollen Strategien vorgestellt werden, um das sozial erwünschte Antworten in Personalfragebögen zu reduzieren, bzw. um Kontrollmechanismen für bessere Gütekriterien anzuwenden zu können.
2. Theorie
2.1 Persönlichkeitsfragebögen und das Problem der Selbstdarstellung
In Persönlichkeitsfragebögen, die die Erfassung von individuellen Ansichten und Verhaltensweisen einer Person zum Ziel haben, stellt die Auskunft des Befragten die am häufigsten verwendete Informationsquelle dar (Mummendey & Grau, 2016). So wird z.B. das Freiburger Persönlichkeitsinventar (FPI-R) für Jugendliche und Erwachsene eingesetzt, um allgemeine Persönlichkeitseigenschaften zu diagnostizieren. Die Persönlichkeitscharakteristika werden mit Hilfe von 12 Faktoren (z.B. Lebenszufriedenheit, Gehemmtheit, Aggressivität, Offenheit, Neurotizismus) ermittelt. So können die Ergebnisse des FPI - R etwa Aussagen bzw. Prognosen zum Erfolg einer stationären Verhaltenstherapie oder des Berufs machen (Fahrenberg, Hampel, & Selg, 2001). Anspruch einer Testung im Bereich der differentiellen Persönlichkeitspsychologie sowie Eignungsdiagnostik ist die Unverfälschbarkeit, die definiert, dass die zu testende Person keine konkreten Merkmale ihres Testwerts steuern bzw. karikieren kann (Moosbrugger & Kelava, 2013). Problematisch ist, nicht zuletzt hinsichtlich der Konstruktvalidität, dass häufig zahlreiche Korrelationen unter den Merkmalen der objektiv beobachteten Verhaltensweisen und den Testwerte existieren. Zudem können in den Ergebnissen unbemerkte bzw. unkontrollierte Verzerrungen gegenüber der Selbstbeobachtung oder Selbstdarstellung auf die Testbeantwortung durch die Testperson einwirken, um ein vermeintlich besseres Ergebnis zu erzielen (Bortz & Döring, 2006). Besonders bei Persönlichkeitstestungen wird häufig mit Besorgnis geäußert, dass antwortende Teilnehmer ihre Antworten mutwillig manipulieren, um sich positiver (faking good) oder schlechter (faking bad) darzustellen, welches nicht zweifellos der Wirklichkeit entspricht (Borkhoff & Schulz, 2013).
2.2 Antworttendenzen in der Persönlichkeitstestung
Personen, die einen Fragebogen beantworten, können diesen in verschiedener Art und Weise beeinflussen. Solche Antwortverzerrungen (response bias) stellen vielleicht eines der wichtigsten Probleme in Fragbögen dar (Helmes, 2000). So wird als response bias jede systematische Tendenz der Beantwortung von Items eines Fragebogens bezeichnet, die mit einer korrekten Selbstauskunft nicht übereinstimmt. Dabei können diese Tendenzen mannigfaltig verzerrt sein. Fragebögen können in jede Richtung manipuliert werden, um ein bestimmtes Bild von sich zu vermitteln, im Gegensatz zu Leistungs-, Fähigkeits-. und Intelligenztests (Herzberg, 2011). Antworttendenzen (response set) existieren in formaler und inhaltlicher Art.
2.2.1 Formale Antworttendenzen
Die formale Antworttendenz findet in einer bereits vorgegebenen Antwortstruktur, wie z.B. bei Multiple-Choice-Items, Rating- oder Likertskalen, statt. Ein bestimmtes Muster im Antwortformat wird gezielt genutzt, um die Testung zu modifizieren (Seiwald, 2003). Zum formalen response bias zählen:
- Die Akquieszenz oder Ja-sage-Tendenz. Hier wird Fragen oder Aussagen unabhängig vom Iteminhalt, tendenziell zugestimmt (Häcker & Stapf, 1998)
- Unter der Tendenz zur Mitte ist nach Krauth (1995) zu verstehen, dass Testpersonen eine Neigung entwickeln, entweder aus Unsicherheit oder Unkenntnis, extreme Antworten zu meiden und sich für eine mittlere Antwortkategorie entscheiden.
- Bei der Tendenz zu extremen Urteilen kommt es zu konträren Entscheidung im Bezug zur Tendenz zur Mitte. Hier neigt die Person eher die äußeren Kategorien der Skalen (z.B. einer Ratingskala) zu benutzen (Krauth, 1995).
- Durch Positionseffekte ist der Proband geneigt, das Item je nach ihrer Position im Fragebogen anders zu beantworten. Dieses Verhalten wird besonders am Anfang einer Testung (z.B. durch mangelndes Instruktionsverständnis) oder an dessen Ende (z.B. durch Ermüdung) beobachtet (Rost, 1996).
- Die Beantwortung eines Items weißt eine Dependenz bezüglich von zuvor bearbeiteten Items aus. Dieses Phänomen wird von Rost (1996) als Reihenfolgeeffekt beschrieben.
- Raten ist nicht nur in der Persönlichkeitsdiagnostik relevant. Hier nimmt die Leistungsdiagnostik (z.B. Intelligenztest) ebenfalls eine bedeutende Stellung bei der Beantwortung von Items ein. Je geringer die Antwortmöglichkeiten sind, desto höher ist die Wahrscheinlichkeit die Antwort zu erraten (Kubinger, 1996).
- „Zufällige“ Beantwortungen von Items weisen eine Systematik oder absolute Willkür auf, d.h. völlig autonom vom Iteminhalt. Dieses Verhalten wird besonders bei zeitintensiven Testungen beobachtet, wobei die Beantwortung entweder in „Blöcken“ gleich ist oder verschiedene Antwort-Rhythmen aufweist (Krauth, 1995).
2.2.2 Inhaltliche Antworttendenzen
Die inhaltlichen Antworttendenzen beschreiben die Neigung, eine manipulierte Antwort aufgrund des Iteminhalts oder auch des kompletten Fragebogens zu geben. Dabei wird zwischen Simulation, Dissimulation und der sozialen Erwünschtheit differenziert. Während sich die Simulation mit dem Vortäuschen von (Krankheits-) Symptomen befasst, wird bei der Dissimulation das Gegensätzliche von der Simulation (z.B. Verschweigen von körperlichen oder seelischen Erkrankungen, bzw. sonstiger Symptome) beschrieben (Seiwald, 2003). Die mit am häufigsten untersuchte Antworttendenz stellt das sozial erwünschte Antworten dar (Herzberg, 2011), welches im folgenden Abschnitt vorgestellt wird.
2.3 Das Konstrukt der Sozialen Erwünschtheit
Die soziale Erwünschtheit (social desirability; SE) lässt sich besonders bei sensiblen Fragestellungen erkennen, in der negative Konsequenzen bei einer wahrheitsgemäßen Beantwortung die Folge sein könnten. Hierbei weichen die Selbstauskünfte der Personen, die den Fragebogen ausfüllen, oft vom wahren Merkmalsstatus ab. Dementsprechend wird der Befragte sich betont positiv darstellen, bspw., um befürchtete soziale Ablehnung, Schamgefühle oder ggf. rechtliche Sanktionen zu vermeiden (Krumpal, 2013). Die soziale Norm spielt bei der sozialen Erwünschtheit eine entscheidende Rolle, da befragte Personen aller Voraussicht nach bei einer Gruppe oder einem einzelnen Gegenüber mehr oder weniger soziales Einverständnis für dessen Antwortverhalten zu finden vermögen. Somit findet eine Orientierung an kulturspezifischen Normen statt, die den Erwartungen von sozialen Gruppen entspricht, ob ein Verhalten als angemessen oder nicht angemessen angesehen wird (Mummendey & Grau, 2016). Doch wie lässt sich die soziale Erwünschtheit definieren? Herzberg (2011) postuliert, dass es nach über 50 Jahren Forschung mit über 5000 Einträgen in der Datenbank PsycINFO immer noch keine allgemein akzeptierte Definition oder eine einheitliche Sprachregelung gibt. Zudem ist noch nicht hinreichend geklärt, ob die soziale Erwünschtheit ein Merkmal der Items bzw. Skalen (Edwards & Edwards, 1992) oder ein autonomes Personenmerkmal darstellt (McCrae & Costa, 1983).
2.4 Die soziale Erwünschtheit als Suppressorvariable
Eine weitere Überlegung die SE zu erklären, liegt in der Individualität von zurechenbaren Reaktionen, die von besonderer Bedeutung in der differentiellen sowie diagnostischen Psychologie ist. Sozial erwünschtes Antwortverhalten wird in einer Testung von Persönlichkeitsfragebögen als Suppressorvariable charakterisiert, d.h. sie wird als ein Prädiktor, nicht aber mit einem dazugehörigen Kriterium einhergehenden Variable, angesehen (Mummendey, 1981). Demnach entspricht die humane Tendenz, im Sinne der sozialen Erwünschtheit zu handeln, um jedes verbale Statement bzw. bei der Beantwortung eines Fragebogens, nicht nur auf Basis des Inhaltes, sondern genauso hinsichtlich des eigenen Bewusstseins bzw. erwarteter sozialer Erwünschtheit adaptieren zu können (Kassebaum, 2004). Um kontrollieren zu können, inwieweit die soziale Erwünschtheit einem Fragebogen beeinflusst, wurden verschiedene Strategien zur Kompensation entwickelt.
2.4 Forschungsfrage
Auf Basis der dargestellten Erkenntnisse lässt sich also feststellen, dass die soziale Erwünschtheit einen großen Anteil der Selbstdarstellungen in Persönlichkeits-fragebögen repräsentiert. In dieser Arbeit versucht der Autor bestimmte Strategien im Bezug auf sozial erwünschtes Antworten vorzustellen. Insbesondere legt der Autor das Augenmerk auf die Reduktion bzw. der Kontrolle von SE, die im Anschluss kritisch diskutiert werden soll.
3. Methoden
3.1 Literaturrecherche
Diese Arbeit wurde anhand einer Literaturrecherche erfasst, wozu die öffentliche Datenbank Google Scholar genutzt wurde. Ebenfalls fand eine Anwendung auf die Datenbank der Universität in Osnabrück über das Discovery-System „ JOST-just one step “ statt. Mit „ JOST “ lassen sich nicht nur bibliographische Nachweise aus dem internen Online-Katalog der Universitätsbibliothek Osnabrück recherchieren, sondern ebenfalls Daten nahezu aller für die Universität lizenzierten und vieler frei verfügbarer Datenbanken (z.B. auch Psychindex und PsychINFO). Neben der ausführlichen Recherchen im Internet wurden zudem Lehrbücher wie z.B. „Forschungsmethoden und Evaluation“ von Bortz und Döring (2006) oder auch Fernlehrbriefe der privaten Hochschule in Göttingen (PFH) wie z.B. „Fragenbogen-Methode II“ (Mummendey & Grau, 2016) herangezogen.
3.2 Verwendete Schlüsselworte, Suchstrategien & Einträge in den Daten-banken
Anhand sehr vieler verwendeter Eingaben von Schlüsselwörtern dieser Arbeit, wird im kommenden Abschnitt jeweils ein Beispiel der Strategien der Suche in Google Scholar, JOST, in den Fernlehrbriefen und im Lehrbuch in Unterkapitel vorgestellt.
3.2.1 Literaturrecherche über Google Scholar
Ein sehr häufiger Begriff bei der Recherche war das Schlagwort „soziale Erwünschtheit“. So wurden bei Google Scholar zu dieser Thematik 59.800 und bei Google Scholar ca. 30.000 Ergebnisse angezeigt. Ein noch größeres Forschungsumfeld zeigte die englische Eingabe „social desirability“ bei Google Scholar mit ca. 1.370.000 und bei Google Scholar ungefähr 416.000 Einträgen. Für die Definitionsarbeit der Thematik „soziale Erwünschtheit“ wurden in den ersten 10 Ergebnisseiten recherchiert. Durch die Bearbeitung der Thematik wurden neue Themen aus der Literatur erschlossen, wie z.B. „Forschung der letzten 60 Jahre“ oder „Kontrollmechanismen der sozialen Erwünschtheit“, welche dann erneut via Eingabe bei Google Scholar konkretisiert wurden.
3.2.2 Literaturrecherche über JOST
Hier wurden, ähnlich wie bei Google Scholar, ein oder mehrere Begriffe wie z.B. „Balanced Inventory of Desirable Responding“ in das Suchfeld als „BIDR“ eingegeben. Zusätzlich, um die Suche zu präzisieren, wurde unter „erweiterte Suche“ der Punkt „Autor“ angeklickt und der Name „Paulhus“ eingegeben. Das Suchergebnis ergab 20 Treffer und ausgewählt wurde das zweite Ergebnis, welches den gleichen Suchtitel „BIDR“ anzeigte.
3.2.3 Literaturrecherche in Fernlehrbriefen
Über Fernlehrbriefe (hier Fragebogen-Methode II) konnte z.B. über das Inhaltsverzeichnis das Kapitel 3 „Antworttendenzen in Fragebogen: Das Problem der sozialen Erwünschtheit“ gefunden werden. Durch eine intensive Recherche des Kapitels konnten Definitionen für die soziale Erwünschtheit genutzt werden.
3.2.4 Literaturrecherche in Lehrbüchern
Zu einer erfolgreichen Suche in Lehrbüchern wurde sehr oft das Sachverzeichnis genutzt. So wurde z.B. im Lehrbuch „Forschungsmethoden und Evaluation“ von Bortz und Döring (2006) im Sachverzeichnis das Wort „Testverfälschung“ gesucht, was zu einer Bearbeitung des Textes der Seiten 231 bis 236 führte.
4. Ergebnisse
4.1 Strategien im Umgang mit sozialer Erwünschtheit
Über die bereits im Abschnitt 2.3 beschriebene Uneinigkeit hinsichtlich der Definition der sozialen Erwünschtheit besteht auch eine Diskrepanz in der Operationalisierung sowie auch der Interpretation der Konstrukte (DeMaio, 1984). Jedoch existiert eine Vielzahl an Forschung seit Ende der 1950er Jahre, welche sich stets weiterentwickelte.
(Edwards, 1957) unternahm den ersten Versuch, die soziale Erwünschtheit anhand einer Testung (social desirability) zu überprüfen und untersuchte, inwiefern Personen zu o.g. Tendenzen neigen und ihre Selbstbeschreibungen sozial anzupassen. Er entwickelte eine Fragebatterie, die auf Items der Minnesota Multiphasic Personality Invenory (MMPI) basiert, einem Persönlichkeitstest aus der klinischen Psychologie. Ziel war es, zwischen „normalen Personen“ und denen mit einer psychischen Störung adäquat differenzieren zu können (Zimbardo & Gerrig, 2008).
Nur drei Jahre später wurde von Crowne und Marlowe (1960) ein vollstandardisierter Fragebogen zur Selbstbeurteilung entwickelt, der einer Weiterentwicklung von Edwards (1957) entsprach. Um eine bessere Interpretationsmöglichkeiten der SE zu ermöglichen , wurde bei der Konstruktion der Items auf zwei Hauptmerkmale geachtet. Zum einen auf das Verhalten, welches im Alltag oft der sozialen Erwünschtheit entsprach, aber selten zu beobachten war (z.B. das Zugeben eines Fehlers). Zum anderen häufige Beobachtungen, welche nicht sozial erwünschtem Verhalten entsprachen (z.B. Verleugnung alltäglicher Themen). Beide Skalen wurden besonders im beruflichen Kontext, sowie in pädagogischen und psychologischen Testungen als Nachweis der Anfälligkeit für soziale Erwünschtheit in Persönlichkeitsfragebögen eingesetzt (Herzberg, 2011). Die erste deutsche Fassung wurde von Lück und Tomaeus (1969) übersetzt, hier wurden allerdings wegen mangelnder Trennschärfe zehn Items ausgeschlossen.
Voyce und Jackson (1977) entwickelten das Schwellenmodell und machten die Itembeantwortung in Bezug auf die soziale Erwünschtheit von zwei Faktoren abhängig. Erstens, von der Höhe der Sensibilität für sozial erwünschtes Antworten auf das Item für die Testperson und zweites von der Grenze zwischen sozial erwünschtem und unerwünschtem Antworten. So lässt sich mit dem Grad der Erwünschtheit des Items empirisch ermitteln, wie leicht eine Versuchsperson präferiert auf einen bestimmten Erwünschtheitsgrad zu reagieren, der auf einem sozial erwünschten Sinn beruht. So ist davon auszugehen, dass im Schwellenmodell eine Interdependenz zur Akquieszenz bezüglich des Grades der sozialen Erwünschtheit steht. Zum anderen ist anzunehmen, dass Personen mit niedrigen Schwellenwerten eine größere Tendenz zur Affirmation zeigen, als jene mit einem höheren Schwellenwert. Zusammengefasst findet eine Zustimmung von Urteilsgegenständen statt, die in Abhängigkeit mit sich selbst gegenüber der Antworttendenz der sozialen Erwünschtheit unterliegt, welche letztendlich eine individuelle Neigung der Zustimmung festlegt. So wird ein Item in der sozial erwünschten Richtung formuliert, wenn das Jasagen und das Antworten zu differenziellen sozial Erwünschten in Kongruenz steht (Mummendey & Grau, 2016).
Neben dem Schwellenmodell, entwickelte Paulhus (1984) ebenfalls eine zweidimensionale Testung, das Balanced Inventory of Desirable Responding (BIDR). Hierbei handelt es sich um die Faktoren Self-deception (SD) und Impression Management (IM). Der Faktor der Selbsttäuschung (SD) basiert auf der psychodynamischen Annahme, dass Selbsttäuschung dazu dient, psychologisch bedrohliche Gedanken und Gefühle als unwahr hinzustellen (Herzberg, 2011). Die Fremdtäuschungsskala (IM) liegt der Ansicht zugrunde, dass das Auftreten von Personen entweder übertrieben auf erwünschtes Verhalten oder konträr auf nicht gern gesehenes Verhalten untertrieben wahrgenommen wird. (Paulhus, 1991). Ein überarbeitetes Konzept des BIDR in deutscher Version haben Musch, Brockhaus und Bröder (2002) veröffentlicht, welches ein Modell mit zwei unterschiedlichen Faktoren, der Selbst- und der Fremdtäuschung, beschreibt.
[...]