Nonresponse bei einer Unternehmensbefragung


Seminararbeit, 2006

43 Seiten, Note: 2,3


Leseprobe


Gliederung

1. Einführung

2. Nonresponse -Definitionen und Differenzierung
2.1. Begriffsklärung: Nonresponse, Ausschöpfung, Rücklaufquote etc.
2.2. Verschiedene Formen der Nonresponse

3. Besonderheiten bei einer Unternehmensbefragung
3.1. Unternehmen sind Organisationen
3.2. Geschichtete Stichprobe als Standard

4. Wann wird Nonresponse zu einem Problem
4.1. Einfluss auf Effizienz der Befragung bei Verringerung der Nettostichprobe
4.2. Verzerrung der Ergebnisse bei systematischer Nonresponse -> „The Nonresponse-Bias“
4.3. Ergebnisse der Umfrageforschung zur Relevanz von Nonresponse bei Unternehmensbefragungen
4.4. Besonderheiten bei Panels

5. Gründe für (Unit-)Nonresponse
5.1. Noncontact, Inability to participate und Refusal bei Unternehmensbefragungen
5.2. Allgemeines Modell des Teilnahmeverhaltens: Leverage-Salience
5.3. Teilnahmeverhalten bei einer Unternehmensbefragung
5.3.1.Grundsätzliche Einflussgrößen
5.3.2.Teilnahmenentscheidung im Unternehmen - formale Modellierung
5.3.3.Einflussfaktoren des Teilnahmeverhaltens im Detail: Qualitative Befunde
5.3.3.1.Bei internationalen Unternehmungen und Konzernen
5.3.3.2.Bei kleinen bis mittelständischen Unternehmen

6. Systematische Nonresponse bei Unternehmensbefragungen - was ist signifikant - welche Hypothesen ergeben sich?
6.1. Welche Unternehmensmerkmale hängen mit den Einflussfaktoren der Teilnahmeentscheidung zusammen - Identifikation von wichtigen Verzerrungsquellen
6.2. Welche Formen der systematischen Nonresponse kann der Forscher kontrollieren - Einflüsse des Befragungsdesigns

7. Implikationen für die Umfragepraxis
7.1. Design-Tools
7.2. Postsurvey Adjustments

1. Einführung

Verwendung des Wortes „Unternehmensbefragung“

Mit Unternehmensbefragungen sind im folgenden Befragungen von Repräsentanten von an Märkten agierenden Organisationsformen gemeint. Die genaue Unterscheidung zwischen Betrieben, Firmen, Produzenten von bestimmten Produkten, Unternehmen und Konzernen sind zwar für die Konstruktion von Befragungen der empirischen Wirtschaftsforschung oder industriegeographischen Forschung sinnvoll um interpretierbare Ergebnisse zu erhalten. Wie in 3.1. erläutert, sind aber die Problemfelder für die Umfrageforschung dieselben. In der Literatur sind sowohl der Begriff der „Unternehmensbefragung“, als auch der „Betriebsbefragung“ gebräuchlich. Gernot Nerb verwendet (Goldrian 2004: Einleitung) den Begriff der „Unternehmensbefragung“ für ein Vielzahl von Befragungen zur empirischen Wirtschaftsforschung. Dieser etwas unpräzisen Wortwahl möchte ich mich zur Vereinfachung im folgenden anschließen. Wenn ich in dieser Hausarbeit von Unternehmens- oder Betriebsbefragungen spreche, lassen sich die Aussagen, falls ich keine dahingehende Einschränkung vornehme, auf die jeweils anderen Formen der „Organisationsbefragung“ übertragen. Entsprechendes gilt für die Abgrenzung von Unternehmens-, Firmen und Betriebpanel.

Unternehmensbefragungen - Erkenntnisquellen von Forschern für Forscher, Politik und Wirtschaft

Die Ergebnisse von Unternehmensbefragungen werden zu unterschiedlichen Zwecken genutzt. In Form aktueller, aggregierter Wirtschaftsdaten dienen Sie als Grundlage für Entscheidungen von Investoren, Unternehmen und der Politik. Die Entscheidungsfindung kann dann aufgrund einfacher Heuristiken oder komplizierter ökonomischer Modellen erfolgen.

Wissenschaftliche Modelle fußen auf unterschiedlichen Annahmen. Diese empirisch zu überprüfen ist in einem industrieökonomischen Kontext oft nur durch umfangreiche Unternehmensbefragungen möglich. Sollen dynamische Zusammenhänge erfasst oder verifiziert werden, sind sogar Längsschnittdaten notwendig. Entsprechend konstruierte Unternehmenspanel sind darauf angewiesen, regelmäßig von denselben Firmen Antworten zu erhalten. Bleibt ein Antwort dauerhaft aus, entsteht eine Lücke in der Längsschnitterhebung, die nur schwierig wieder adäquat zu füllen ist.

Mit dem IAB-Betriebspanel und dem Mannheimer Innovationspanel existieren in Deutschland 2 große Firmenpanel, die gerade in ihrer Entstehungsphase Anfang der 90er Jahre wesentlich mit Nonresponse bei Unternehmensbefragungen zu kämpfen hatten. Insbesondere aus den Bemühungen des Institut für Arbeitsmarkt- und Berufsforschung (IAB) ergeben sich viele empirische Erkenntnisse für das Teilnahmeverhalten von deutschen Unternehmen bei Befragungen.

In den USA haben sich Willimack et al. (in Groves 2002) sowohl quantitativ, wie auch qualitativ mit dem Thema „Nonresponse bei Unternehmensbefragungen“ auseinander gesetzt (vgl. insb. Abschnitt 5.3.3.)

Dagegen liefern Tomaskovic-Devey et al.(1994/1995), Schnabel (1997) sowie Groves et al. (2000/2002/2004) die theoretischen Grundlagen zur Auseinandersetzung mit dem komplexen Thema.

Welche wirtschaftliche und politische Bedeutung Unternehmensbefragungen haben, zeigen beispielhaft die großen deutschen und internationalen Konjunkturtests1, wie der Ifo-Geschäftsklimaindex, der vom Bundesverband für Material, Einkauf und Logistik e.V. unterstützte Einkaufsmanagerindex der NTC Research, sowie der weltweit beachtete Purchasing Manager Index des Institut for Supply Management . Sie beruhen alle auf der Auswertung sehr einfacher Fragebögen aus Paneln2. Gründe der Auswertungskomplexität dürften dafür nicht im Vordergrund stehen, da bei den relativ kleinen Stichproben der ISM- (n =500) , bzw. NTC-Befragung(n=400) auch die Auswertung komplexerer Fragebögen mit geringen Mehrkosten durchzuführen wäre. Aber eine Tiefe der Information ist offenbar nicht notwendig, um einen signifikanten Frühindikator zur Konjunkturentwicklung zu erhalten3.

Unerlässlich um bei einer Befragung ein zuverlässiges und möglichst genaues Abbild der wirtschaftlichen Entwicklung zu erhalten, ist aber eine möglichst zufällig gezogene Stichprobe, aus einem Datensatz, dessen Zusammensetzung möglichst den gesamten Wirtschaftsraum abdecken sollte. Schon diesem Ideal ist in der Realität nur schwer nahe zu kommen (Coverage-Problematik). Zusätzlich können im Laufe der Messung Verzerrungen entstehen. Wie wir weiter unten sehen werden, ist bei Unternehmensbefragungen eine wichtige Quelle von Verzerrungen die fehlende Teilnahme (Nonresponse). Insbesondere die fehlende Teilnahmebereitschaft von Unternehmen, als Ursache solcher Nonresponse, ist in diesem Zusammenhang zu nennen. Daher kommen bei erfolgreichen Unternehmensbefragungen der Vermeidung von Teilnahmeverweigerung durch geeignetes Umfragedesign, sowie ex post so genannten Postsurvey Adjustments eine große Bedeutung zu. Wie Probst (2000) allgemein für von großen Instituten durchgeführte Umfragen feststellt, werden die Befragungen zunehmend im Sinne eines (ganzheitlichen) Qualitätsmanagement auf das „Phänomen Nonresponse“ abgestimmt.

Ich werde im folgenden zunächst auf den Begriff Nonresponse (Kap.2.) eingehen, dann auf die Besonderheiten bei einer Unternehmensbefragung (Kap.3.). Schließlich stellt sich die Frage, ob und in wie weit Nonresponse überhaupt die Qualität von Daten einer (Unternehmens)befragung gefährdet (Kap. 4). Schließlich beschäftige ich mich mit den Gründen von Nonresponse bei einer Unternehmensbefragung (Kap.5.), ohne den Fokus von den zuvor erörterten Probleme zu lassen. Dann erörtere ich im Detail in Kapitel 6. welche Verzerrungsquellen entstehen und die daraus resultieren Implikationen in Kapitel 7.

2. Nonresponse - Definitionen und Differenzierung

2.1. Begriffsklärung: Ausschöpfungs-, Rücklaufquote, Nonresponsequote

Bezüglich der Praxis der Umfrageforschung fällt es nicht leicht einheitliche Definitionen auch für häufig verwendete Begriffe zu finden. Der Literaturbericht von Porst et al. (1998) zeigt, dass es dennoch einige Übereinstimmungen gibt, wenn auch die Abgrenzungen je nach Forscher und Befragung variieren können. Nachfolgend beziehe ich mich vorrangig auf Porst et al. (1998: 5 ff.).

Ausschöpfungs-, Rücklaufquote:

Diese beiden Begriffe meinen dasselbe. Allgemein geht es um das Verhältnis von Brutto-, zur Nettostichprobe. Die Bruttostichprobe steht dabei für die Menge möglicher Teilnehmer, z.B. ausgewählte Adressen aus dem Handelsregister, die man für eine Befragung verwenden möchte.

In der Umfrageforschung wird noch feiner unterschieden nach Brutto-Adressen und um stichprobenneutrale Ausfälle bereinigte Bruttostichprobe/adressen4. Stichprobenneutrale Ausfälle gehören nicht zur Grundgesamtheit. Bei einer Unternehmensbefragung können stichprobenneutrale Ausfälle z.B. durch nicht mehr existierende Unternehmen entstehen. Bei komplexeren Merkmalen der Grundgesamtheit kann es auch sein, dass man erst nach Kontaktaufnahme merkt, dass sie nicht zur Grundgesamtheit gehören. Dann spricht man ebenfalls von stichprobenneutralen Ausfällen.

Die Nettostichprobe besteht dagegen aus den Daten der Zielpersonen, bei denen ein Interview realisiert, bzw. ein Fragebogen bearbeitet und zurückgeschickt wurde. Der Quotient von Nettostichprobe und um stichprobenneutrale Ausfälle bereinigte Bruttostichprobe entspricht der Rücklaufquote, bzw. Ausschöpfungsquote.

Nonresponsequote

Man bezeichnet daher als Nonresponsequote die Differenz zwischen Ausschöpfungsquote und 100%. Also bei wie viel Prozent, im Verhältnis zur bereinigten Stichprobe, konnten Interviews nicht realisiert werden/ wurde ein Fragebogen nicht zurückgeschickt.

Die Nonresponsequote entspricht der Ausfallquote. Gemeint ist hier UnitNonresponse.

2.2. Verschiedene Formen der Nonresponse

Liegen Ausfälle vor, handelt es sich um Unit-Nonresponse. Davon unterschieden wird die so genannte Item-Nonresponse, daher es werden nur einzelne Frage nicht bearbeitet, eine Antwortverweigerung betrifft nur Teile des Fragebogens. Unit- Nonresponse entspricht einer Nonresponse bei allen Items eines Fragebogens. Die Probleme, die sich für die Effizienz und Erwartungstreue der Befragung ergeben5, sind im Prinzip dieselben. Auch bei den Ursachen gibt es Überschneidungen. Im folgenden spreche ich daher allgemein von Nonresponse, um im Einzelfall wieder genauer zu differenzieren.

Groves (2004: 180) unterscheidet zwischen „ignorable nonresponse“ und „nonignorable nonresponse“. Die „nonignorable nonresponse“ lässt sich auch bei großen Befragungsbudgets nicht vermeiden, obwohl die Ursache an und für sich bekannt ist. Die „Last“ einer Antwort ist bei der nicht antwortenden Teilgruppe so hoch, dass sie sich nicht oder nur teilweise durch geschicktes Design und Modus überwinden lässt. „Postsurvey Adjustments“ erweisen sich dann als schwierig, weil man nichts oder wenig über die Gruppe der Nicht-Antwortenden erfahren kann (vgl. 4.2. und 7.2).

3. Besonderheiten bei Unternehmensbefragungen

3.1. Unternehmen sind Organisationen

Wer ein Unternehmen befragt, möchte etwas über die Lage, Handlungen des Unternehmens oder Betriebes in der Vergangenheit, Gegenwart oder Zukunft erfahren. Dem Forscher geht es nicht um die Meinung einzelner Mitarbeiter, sondern um das Unternehmen als Organisation und juristischen Person, bzw. als Akteur auf Märkten. Eine möglichst hohe Verbindlichkeit der Antworten von Repräsentanten eines Unternehmens sollte Instrumentalziel sein, um möglichst eine gleich hohe Güte der gegebenen Aussagen der unterschiedlichen Unternehmen zu erreichen6.

Daher ist „der zentrale Unterschied zwischen der Befragung von Akteuren nach ihren Meinungen oder Einstellungen und einer Unternehmensbefragung „[..],dass die Befragten als Repräsentanten ihres Unternehmens antworten sollen. Sie sind innerhalb ihres Unternehmens eingebettet in arbeitsteilige und hierarchisch gegliederte Organisationsprozesse“ (Schnabel 1997). Wobei es in manchen Fällen durchaus Zwischenstellungen geben kann zwischen Befragungen von Personen in Unternehmen und einer Unternehmensbefragung. So verlangt der Fragebogen der europäischen Einkaufsmanagerindices nicht explizit die Antwort als Repräsentant des jeweiligen Unternehmens. Hier ist durch die Klammer „Einkaufsleiter werden befragt“ dennoch eine gewisse Aussagekraft gegeben. Die Einschätzungen der Einkäufer sollten vergleichbar sein, da sie aus derselben Perspektive erfolgen.7

Dennoch: Es reicht nicht, irgendjemanden aus einem Unternehmen nach seiner Meinung über das Unternehmen zu befragen, sondern man benötigt8 möglichst die offizielle Antwort von einem offiziellen Repräsentanten. Wie wir in 5.3. sehen werden, erschwert dies den Teilnahmeprozess.

3.2. Geschichtete Stichproben als Standard

Unternehmensbefragungen verwenden regelmäßig geschichtete Stichproben. Unternehmen werden in Größenklassen, z.B. bezogen auf Beschäftigtenzahl, Branche oder Umsatz unterteilt. Von jeder Größenklasse wird dann eine Zufallsstichprobe gezogen: So z.B. beim Report on Business© der ISM (ISM 2006), dem IAB-Betreibspanel (Hartmann/Kohaut 2000), oder dem Pilotpanel 1990-1992 des IQW Hannover, IAW Tübingen und Infratest Sozialforschung München (Schmidt 1994).

Die Schichtung hat theoretisch den Vorteil, dass die Unternehmen entsprechend ihrer Bedeutung z.B. für die Wirtschaftsentwicklung oder den Arbeitsmarkt in die Stichprobe gelangen.

Die Sinnhaftigkeit diese Vorgehens auch in der Praxis9 wird augenscheinlich, wenn dem Umsatzwachstum eines kleinen Unternehmens, wie z.B. einem unabhängigen Friseursalon, dieselbe Bedeutung zukommen lassen würde, wie einem Großkonzern, z.B. Siemens. Die hier völlig unterschiedlichen Formen von Wirtschaftssubjekten sind zwar beide wichtige „Repräsentanten“ des Wirtschaftsstandorts und sollten deswegen für allgemeine Wirtschaftsbefragungen beide mit einbezogen werden. Sie haben aber für sich genommen natürlich einen ganz anderen Stellenwert. Viele Aussagen würden verfälscht, wenn man sie gleich gewichten würde. Da man bei einer einfachen Zufallsstichprobe aus der Gesamtheit deutscher Unternehmen bei kleineren Auswahlsätzen in der Regel nur wenige oder gar keine Großunternehmen ziehen würde (es existieren nur 30 DAX-Unternehmen), ist der Sinn einer Schichtung bei Unternehmensbefragungen offensichtlich.

Eine Alternative ist die nachträgliche Gewichtung. So das Vorgehen bei den ifo-Indices. Die Antworten werden nachträglich zunächst nach der Zahl der Beschäftigten und dann nach der Bedeutung für bestimmte übergeordnete Produktgruppen und schließlich dieser Produktgruppen für die Wirtschaftsstruktur gewichtet10 und aggregiert.

Sowohl bei der geschichteten Unternehmensbefragung als auch bei nachträglichen Gewichtungen sind einfache Nonresponsequoten weniger aussagekräftig. Bei der geschichteten Zufallsstichprobe können Nonresponsequoten für die einzelnen Schichten, daher Branchen, Größenklassen etc. berechnet werden. Beim nachträglichen Gewichten ist die „weighted response rate“ eine weitere Möglichkeit ein Maß über das Ausmaß der Antwortausfälle zu erhalten, übersetzt „Gewichtete Rücklaufquote“ (Groves 2002: 214):

Abbildung in dieser Leseprobe nicht enthalten

Hieran lässt sich aber leider nicht erkennen, in wie weit sich das Antwortverhalten in den „Subgruppen“ einer Stichprobe unterscheidet.

4. Wann wird Nonresponse zu einem Problem

Einleitung11 zu Kapitel 4.

Eine Ausschöpfungsquote kann kein Selbstzweck sein. Vielmehr sollen Umfragen und ihr Datenrücklauf der empirischen Forschung dienen.

Die Realität gilt es dabei möglichst genau abzubilden. Nur dann können vorhandene Theorien, Modelle oder auch nur einzelne Hypothesen empirisch verifiziert werden. In der Öffentlichkeit wird als Maßstab für die Qualität von Umfrageergebnissen und der Aussagekraft darauf bauender Erkenntnisse, oft die „Repräsentativität“ einer Befragung gefordert.

„Eine repräsentative Stichprobe hätte zu sein „ein verkleinertes Abbild der Grundgesamtheit hinsichtlich der Heterogenität der Elemente und hinsichtlich der Repräsentativität der für die Hypothesenprüfung relevanten Variablen“ ( Porst 2000: 107). In Wahrheit ist die Forderung nach einer 100%igen Repräsentativität also nicht zu erfüllen, da weder die genaue Abgrenzung der Grundgesamtheit noch die Verteilung aller „relevanten Variablen“ bekannt sein kann. Porst (2000) reduziert daher die hohe Forderung nach der „repräsentativen“ Umfrage auf die Forderung nach einer Gleichheit der Chancen. Jedes Element einer vom Forscher möglichst exakt definierten Grundgesamtheit muss mit derselben Wahrscheinlichkeit in die Stichprobe gelangen können. Nur dann handelt es sich um eine Zufallsstichprobe, und nur dann kann mit einer gewissen Sicherheit (z.B. 99%) und einer bestimmbaren Genauigkeit auf die aggregierte Grundgesamtheit geschlossen werden. Die Aussagekraft der Merkmalsausprägungen einer Zufallsstichprobe ist negativ abhängig von der Zahl der Merkmalsträger einer Grundgesamtheit (verliert bei großen Grundgesamtheiten an Bedeutung) sowie der Heterogenität der Grundgesamtheit und positiv abhängig von der Größe der Stichprobe, vgl. 4.1.. Gleichzeitig kann der zufällige Auswahlprozess von der Brutto-, zur Nettostichprobe insbesondere durch das Phänomenen „Teilnahmeverweigerung“ gestört werden, vgl. Kapitel 5. und 6. Um so stärker die Ausprägungen dieses Phänomen mit den untersuchten Merkmalen zusammenhängen, desto deutlicher werden die Ergebnisse einer Umfrage verzerrt. Die Qualität ihrer Aussagen nimmt damit ab, vgl. 4.2. und 6.1..

4.1. Einfluss auf Effizienz der Befragung bei Verringerung der Nettostichprobe

Unter der Bedingung der Erwartungstreue (vgl. 4.2.) bezeichnet man die12 Schätzfunktion mit der kleinsten Varianz als die effizienteste aller gezogenen. Schätzfunktionen bezeichnet man auch als Stichprobenfunktionen oder kurz als Schätzer. So ist z.B. das arithmetische Mittel einer Stichprobe der Schätzer für den Erwartungswert einer zufällig aus der Grundgesamtheit gezogenen Einheit. Die Varianz eines Schätzers misst also, in wie weit die Ergebnisse von einer zufällig gezogenen Stichprobe um die wahre Verteilung der Grundgesamtheit streuen. Die Schätzfunktion für einen bestimmten Wert sollte eine möglichst kleine Varianz haben. Eine erwartungstreue Stichprobe ist umso effizienter, je geringer diese Streuung ist. Man bräuchte weniger Stichproben, um sich in der Summe wieder den „wahren“ Werten anzunähren. Der Vorteil von Zufallsstichproben ist, dass die Effizienz von Schätzfunktionen, bzw. die Präzision von Stichproben (approximativ) berechenbar ist. Zufällige Abweichungen von der wahren Verteilung sind zwar möglich, aber diese sind quantifizierbar.

Wichtig für die Praxis der empirischen Sozialforschung: Sowohl bei Punktschätzern, als auch bei Intervallschätzungen ist die Größe der Stichprobe die zentrale Determinante der Präzision13. Maßstab bei Punktschätzern ist üblicherweise der Standardfehler O, definiert als Quotient des Standardfehlers des

Untersuchungsmerkmals σ und der 2ten Wurzel des Stichprobenumfangs14 n: [Abbildung in dieser Leseprobe nicht enthalten]

Da bei der empirischen Forschung die Verteilung des Merkmals in der Grundgesamtheit üblicherweise nicht bekannt ist, verwendet man vereinfacht die Standardabweichung s der Stichprobe.

Abbildung in dieser Leseprobe nicht enthalten

Mittels des Standardfehlers und bestimmter Verteilungsannahmen bezüglich des abgefragten Merkmals lässt sich ein Konfidenzintervall berechnen. Das Intervall zeigt, mit welcher Genauigkeit man von den in einer Befragung realisierten Werten xi auf die Werte einer abzubildenden Grundgesamtheit schließen kann.

Es ergibt sich für X = Punktschätzer, z.B. Erwartungswert der Stichprobe; µ = hier arithmetisches Mittel der Grundgesamtheit und σ geschätzt über die Standardabweichung in der Stichprobe ein Konfidenzintervall für µ zum Niveau 1-α :

Abbildung in dieser Leseprobe nicht enthalten

Mittels der Statistik lässt sich nun schon im Vorfeld ein bestimmtes Konfidenzniveau als Maß für die „Richtigkeitswahrscheinlichkeit“ einer Aussage festlegen. Und als Maß für die Präzision analog die Breite des Konfidenzintervalls. Wie die folgende Formel zeigt15, benötigt man mit zunehmender Genauigkeit eines Konfidenzintervalls mit der Breite 2b und Konfidenzniveaus1-α größere Zufallsstichproben16:

Abbildung in dieser Leseprobe nicht enthalten

Da Ausfälle einer Umfrage nicht auswertbare Merkmalsträger darstellen, reduziert sich dadurch zu gegebenem Konfidenzniveau 1 - α die Genauigkeit von Aussagen. Das Maß dieses „Effiziensverlustes“ lässt sich aber berechnen. Ja, zu gegebenem Anforderungen an die Effizienz lässt sich bei Nonresponse durch wiederholte Befragung in der Regel das gewünschte Maß an Effizienz erzielen. Kann man im Vorfeld das ungefähre Ausmaß der Nonresponse abschätzen, lässt sich im Vorfeld die Bruttostichprobe entsprechend so vergrößern, dass ein Erfüllen des gesetzten „Effienzniveaus“ unter Abzug der Ausfälle gewährleistet, bzw. sehr wahrscheinlich ist.

Daher sind das eigentliche Problem des Phänomen „Nonresponse“ nicht die zufälligen Ausfälle, die zur Reduktion der Nettostichprobe im Verhältnis zu Bruttostichprobe führen. Diese können, je nach Ausmaß, zwar Kosten verursachen, wenn man eine bestimmte Präzision der Schätzfunktionen erreichen will. Sie verändern aber in keiner Weise die Erwartungstreue einer Befragung. Wären unsystematische Ausfälle in der Umfragepraxis klar von den unten erklärten systematischen Ausfällen zu unterscheiden, entspräche die Entscheidung, ob diese durch eine größere Bruttostichprobe auszugleichen oder durch ausschöpfungs- steigernde Design-Tools zu verhindern sind, einem einfachen Kosten-Nutzen-Kalkül des Forschers.

4.2. Verzerrung der Ergebnisse bei systematischer Nonresponse -> „The Nonresponse-Bias“

„Ein Schätzer π [...] heißt unverzerrt (auch: erwartungstreu, englisch: unbiased), wenn sein Erwartungswert in jedem Fall gleich dem unbekannten Parameter θ ist“ (Mosler/Schmid 2004).

„Die Differenz zwischen Erwartungswert des Schätzers und des Parameters nennt man Verzerrung (englisch: bias).“ Schätzer ergeben sich aus Ergebnissen einer Befragung, Parameter sind die „wahren" Daten der Unternehmen der Grundgesamtheit. Die Verzerrung misst man mit der Größe „mittlerer quadratischer Fehler“ MSE(π): Es gilt:

Abbildung in dieser Leseprobe nicht enthalten

Daher würde man unendlich viele Stichproben ziehen, würde man bei erwartungstreuen Stichproben, am Ende genau die Werte der Grundgesamtheit erhalten.

Das Problem ist, dass Nonresponse in vielen Fällen nicht zufällig ist. Sie kann sytematisch mit Eigenschaften der Umfrage oder aber mit Eigenschaften des Befragten zusammenhängen. Man kann von systematischer Nonresponse sprechen. Die Ergebnisse einer Umfrage werden aber nur dann verzerrt, wenn sich die von Antwortenden(Respondents) und Nicht-Antwortenden (Nonrespondents) abgegebenen Antworten unterscheiden (deterministische Betrachtung), bzw. wenn die Ausprägung eines interessierenden Parameters und die Teilnahmewahrscheinlichkeit miteinander korrelieren (probabilistische Betrachtung). Die folgenden Ausführungen beziehen sich auf Groves et al. (2004: 181 ff. ): Über alle Stichproben (bei unendlich vielen Ziehungen) wäre der Nonresponse-bias in einer deterministischen Betrachtung:

Abbildung in dieser Leseprobe nicht enthalten

mit

Abbildung in dieser Leseprobe nicht enthalten

Die Werte der Nicht-Antwortenden lassen sich nicht schätzen, da ex definitionem über diese aus der Stichprobe zunächst keine Informationen zu erhalten sind, daher ist die Verzerrung ohne weitere Information nicht zu quantifizieren.

Die probabilistische Darstellung des Problems zeigt noch deutlicher, wo die eigentliche Krux im Falle systematischer Nonreponse liegen kann:

Abbildung in dieser Leseprobe nicht enthalten

Der mittlere Nonresponse-Fehler ergibt sich dann aus dem Zusammenhang zwischen der Antwortwahrscheinlichkeit r i und den Werten der erfragten Variable Xi und dem Produkt der erwarteten Nonresponsequote und des erwarteten Fehlers [Abbildung in dieser Leseprobe nicht enthalten].

Die Nonresponsequote lässt sich möglicherweise durch einfache Tools wie Fragebogenoptimierung verringern, jedoch darf man davon keine lineare Reduktion des Nonresponse-Bias erwarten. Bei heterogenen Nonresponse-(Unter)Gruppen wird das Problem noch vielschichtiger. Reagieren die bislang nicht-teilnehmenden Elemente unterschiedlich, muss sich der Nonresponse-Bias nicht mal verringern. Verringert man vor allen Dingen die Nonresponse, die nicht mit den Itemwerten korreliert, beispielsweise durch hohe Incentives, könnte man das Ergebnis sogar weiter verzerren. Denn die oben beschriebene „non-ignorable“-Nonresponse bliebe erhalten. Man würde E (ms / n s) reduzieren, gleichzeitig aber Cov(ri, Xi) und E (r - ) erhöhen.

Leider lässt sich das genaue Ausmaß des Nonresponse-Fehlers nie zu hundert Prozent quantifizieren, da man a) die Werte der Ausfälle und b) die „wahren“ Werte der Grundgesamtheit nicht kennt. [Abbildung in dieser Leseprobe nicht enthalten] und [Abbildung in dieser Leseprobe nicht enthalten]lassen sich allenfalls anhand anderer Stichproben schätzen. Versucht man [Abbildung in dieser Leseprobe nicht enthalten] nur anhand bestimmter Merkmale, die möglicherweise durch Angaben in der Kartei der Bruttoadressen bekannt sind, zu bestimmen, setzt man implizit voraus, dass sich die Werte der Nichtantwortenen nur aus diesen Merkmalen erklären lassen. Diese Annahme erscheint in der Regel sehr heroisch (vgl. 7.2.).

Die Umfrageforschung kann daher keine allgemein gültigen Regeln für das Problem der Nonresponse herleiten. Dem Forscher ist zu empfehlen, differenziert zu betrachten, welche möglichen Quellen der Nonresponse bei einer spezifischen Umfrage zu identifizieren sind. Hängen die Ursachen mit einem Untersuchungsgegenstand zusammen, sollte die Stärke des Zusammenhangs wenigstens grob abgeschätzt werden. Darauf aufbauend gilt es zu analysieren, welche Tools welche Quellen der Nonresponse eliminieren oder in ihren Auswirkungen schwächen können. Soweit in ihren Ursachen unterscheidbar, sollten natürlich vorrangig die Nonresponse-Ursachen reduziert werden, die mit den interessierenden Variablen korrelieren. Auf Einflussfaktoren, die das Maß der Ausschöpfung determinieren, komme ich in Kapitel 5.3.3. und 6.2. zurück.

[...]


1 Als Alternative zu Unternehmensbefragungen zur Erforschung und Prognose der Konjunkturentwicklung haben sich Expertenbefragungen des ZEW bewährt. Obwohl es auch hier methodische Überschneidungen gibt, sind Befragungen nach Einschätzungen und Erwartungen von Experten und Entscheidern (in Unternehmen) streng genommen keine Unternehmensbefragungen.

2 Einkaufsmanagerindecs fragen explizit nach den Einschätzungen von Einkäufern in Bezug auf ihr Unternehmen und haben damit eine interessante Sonderstellung mit großen Parallelen zu klassischen Unternehmensbefragung.

3 Die Überprüfung der Signifikanz kann hier nicht Thema sein, wurde aber insbesondere für die IfoGeschäftserwartungen, die ZEW-Konjunkturerwartungen und den ISM-Einkaufsmanager-Index belegt, vgl. z.B. Hüfner/ Schröder (2001), Homepage des ISM.

4 (z.B. auch Schmidt 1994: 201 ff.)

5 vgl. Kapitel 4

6 und somit Verzerrungen zu vermeiden.

7 ergibt sich aus einer telefonischen Befragung der NTC Research in einem anderen Zusammenhang, sowie Anlage 1.

8 bei Betriebsinterna schon aus Gründen des Datenschutzes

9 auch wenn hier natürlich immer nur das Annähern der empirischen Projektion an die Wirklichkeit, Ziel sein kann ( dazu ausführlich: Porst 2000: 106 ff.)

10 es handelt sich zunächst um eine Art von Design-Gewichtung. Wobei nur von ihrer Zahl ausgehend kleine Unternehmen bei der Ziehung möglicherweise sogar unterrepräsentiert sind, jedoch nicht gemessen an ihrer Bedeutung für die Wirtschaft, so beim ifo Konjunkturtest (Goldrian 2004: 26 f.). Daher findet hier auch nur eine „logarithmierte Gewichtung“ zu Bevölkerungszahl statt.

11 Die Überlegungen zur Einleitung beruhen auf Porst (2000: S. 101 ff.)

12 soweit nicht anders angegeben beruhen die folgenden Überlegungen auf Groves et al. (2004) und Mosler/Schmid (2004) sowie Porst (2000: 97 f.)

13 und damit natürlich auch der Aussagekraft des statistischen Schließens auf eine Grundgesamtheit.

14 Bei im Verhältnis zur Grundgesamtheit kleinen Stichproben verändert man nur geringfügig die Ergebnisse, wenn man vereinfacht davon ausgeht, dass es sich um eine Stichprobenziehung „ mit Zurücklegen“ handelt. Die Formel für ohne Zurücklegen, o = Wurzel( N-n/ N-1) * s/Wurzel(n) zeigt dies beispielhaft für Auswahlsatz n/N -> 0

15 Allerdings zur Vereinfachung für bekanntes Sigma

16 bei fehlender Information über die Verteilung ergibt sich aus dem zentralen Grenzwertsatz die meist weniger restriktive Forderung nach einem Mindeststichprobenumfang von n> 40.

Ende der Leseprobe aus 43 Seiten

Details

Titel
Nonresponse bei einer Unternehmensbefragung
Hochschule
Universität zu Köln
Veranstaltung
Praxis der Umfrageforschung
Note
2,3
Autor
Jahr
2006
Seiten
43
Katalognummer
V79064
ISBN (eBook)
9783638856454
Dateigröße
966 KB
Sprache
Deutsch
Anmerkungen
Abzüge gab es bezüglich Übersichtlichkeit und Formalien - u.a. Seitenzahl erheblich überschritten 43 statt 30 - Inhalt entsprechend "sehr gut".
Schlagworte
Nonresponse, Unternehmensbefragung, Praxis, Umfrageforschung
Arbeit zitieren
Hans-Günter Herrmann (Autor:in), 2006, Nonresponse bei einer Unternehmensbefragung, München, GRIN Verlag, https://www.grin.com/document/79064

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Nonresponse bei einer Unternehmensbefragung



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden