Deskriptive (beschreibende) Statistik im öffentlichen Dienst

Grundkurs mit vielen Beispielen und Übungen


Fachbuch, 2014
131 Seiten

Leseprobe

Inhalt

Vorwort

1. Wozu Statistik?

2. Statistik und empirische Untersuchung

3. Merkmalsart und Skalentyp

4. Arithmetischer Mittelwert

5. Kennwerte der Streuung

6. Klassenbildung

7. Der Median

8. Quantil

9. Modalwert

10. Das geometrische Mittel

11. Grafische Darstellung von Daten

12. Häufigkeitsverteilung

13. Einschub: Konzentrationsmessung und Lorenzkurve

14. Mehrdimensionale Häufigkeitsverteilung

15. Lineare Regression

16. Bestimmung der Regressionskonstanten a und b

17. Kontrollrechnung für den Korrelationskoeffizienten r:

18. Bestimmtheitsmaß: Standardfehler

19. Zeitreihenanalyse und Trendermittlung

20. Gleitender Durchschnitt

21. Trendfunktion

22. Einfache Prognosetechniken

23. Trendextrapolation auf Basis eines Zeitreihenmodells

24. Die Welt ist nicht nur metrisch

25. Der Rangkorrelationskoeffizient R nach Spearman

26. Nominale Werte

27. Kontingenzkoeffizient nach Pearson

28. Der Signifikanztest

29. Die Benford-Analyse und der Chi-Quadrat-Test

30. Bestimmung des Stichprobenumfangs

31. Der Bericht

32. Anhang

Register

Ich danke meiner Frau und meinen Kindern, dass sie mir Zeit gegeben haben, dieses Buch zu vollenden. Ganz besonders bedanke ich mich bei Herrn Dieter Daniel, der trotz schwerer Erkrankung dieses Skript Korrektur gelesen hat.

Vorwort

Warum darf man aus Schulnoten keinen Mittelwert bilden? Weil man Schulnoten nicht addieren darf! Fehler wie diese (und weit schlimmere) passieren dauernd, auch im öffentlichen Dienst. Überall werden statisti- sche Grundkenntnisse benötigt. Meistens aus Unwissenheit, häufig aber auch bewusst, werden Daten falsch aufbereitet, missverständlich darge- stellt und falsch interpretiert. Ob es sich um die Wettervorhersage handelt, um Vorschläge zum Aktienerwerb oder -verkauf oder einfach nur darum, wer den „Goldenen Engel des ADAC“ verdient hat, überall werden wir getäuscht, manipuliert und hinters Licht geführt. „Traue keiner Statistik, die du nicht selber gefälscht hast“. Dieser Spruch hat eine traurige Rele- vanz zum Alltag. Dabei kann „Statistik“ durchaus etwas Positives sein, vergleichbar einem guten Küchenmesser, das zum Schneiden von Gemüse und Obst verwendet werden sollte, aber natürlich auch zweckentfremdet werden kann. Mittels statistischer Methoden können wir aus einer unüber- sehbaren Datenflut, gut vor- und aufbereitet, Informationen herausfiltern, Kennzahlen definieren und Grafiken erstellen, die uns auf einen Blick re- levante Informationen vermitteln. Ich finde es beeindruckend, dass aus Milliarden Datensätzen, wie sie bei Facebook, Google oder der NSA (um nur einige zu nennen) vorliegen, blitzschnell aussagefähige Zahlen über den „User“ gewonnen werden. Deskriptive Statistik hat das Potential, je- dem verständlich zu machen, wie das geht.

Dieses Buch richtet sich an alle Menschen und ist für alle Menschen ge- eignet, die mindestens die vier Grundrechenarten beherrschen. Sollten, wie an wenigen Stellen gefordert, tatsächlich mal mehr Kenntnisse für das Verständnis (nicht für die Anwendung!) des Stoffes benötigt werden, kann diese Stelle getrost übersprungen werden.

Das Angebot statistischer Literatur ist ungeheuer groß. Das ist einerseits gut, denn aus der Vielfalt kann sich jeder ein Werk wählen, das ihm be- sonders gut liegt. Andererseits kommen gerade bei Übersetzungen von Fachbegriffen häufig Ungenauigkeiten vor. In der DIN wird verbindlich festgelegt, was unter dem jeweiligen Begriff zu verstehen ist. Zugehörig zum Kontext habe ich die entsprechenden Erläuterungen nach DIN in den Text eingepflegt. Bei einem ersten Lesen können diese Stellen übersprun- gen werden.

Als ich im Jahre 2005 gefragt wurde, ob ich eine Vorlesung „Deskriptive Statistik“ spontan halten könnte, weil der bis dato Lehrende erkrankt sei, fühlte ich mich sehr geehrt, aber auch ziemlich gefordert. Zwar bin ich von „Haus aus“ Physiker, und damit durchaus mathematik-phob, eine eigen- ständige Vorlesung in Mathe hatte ich aber noch nicht gehalten. Hilfreich war, dass mir das rudimentäre Skript des bislang Lehrenden sowie einige Übungsaufgaben zur Verfügung standen. Die ersten beiden Unterrichtstage waren in „trockenen Tüchern“. Danach war mir klar, dass ich ein eigenes Skript verfassen musste.

Das vorliegende Buch entspricht diesem Skript, das ich seither, natürlich jedes Jahr den veränderten Anforderungen neu angepasst, für meine Vorlesung an der „Hessischen Hochschule für Polizei und Verwaltung“, kurz HfPV, verwende.

Kassel, 25.02.2014 Uwe Sliwczuk

1. Wozu Statistik?

Kenntnisse aus dem Bereich der Statistik können sowohl für private als auch für berufliche Zwecke nützlich sein.

- Im privaten Bereich werden Kenntnisse der Statistik häufig für das wirtschaftliche Handeln genutzt, zum Beispiel bei der Vermögens- bildung.
- Im beruflichen Bereich können statistische Erhebungen und Analysen für Planungs- und Entscheidungsprozesse genutzt werden, zum Beispiel ebenfalls im Rahmen des wirtschaftlichen Handelns oder der Arbeitsorganisation.
- Ein weiterer bekannter Anwendungsbereich ist die politische Meinungsbildung.

Sie sollen:

- Zweck und Notwendigkeit der Statistik für den Planungs-, Entscheidungs- und Steuerungsprozess erläutern und begründen,
- die Methoden der Datenerhebung und statistischen Datenanalyse kennen, anwenden und bewerten und
- statistische Untersuchungen computergestützt auswerten können.

Sie sollen ferner:

- Probleme selbstständig lösen und eigenverantwortlich ausführen,
- Arbeitsschritte strukturieren, vorausschauend und zielgerichtet planen und ausführen,
- in kleinen Gruppen arbeiten und entscheiden,
- auf Vorschläge aufbauen, zuhören, Konflikte ansprechen können.

Einfache statistische Verfahren, insbesondere zur beschreibenden Statistik, kann sich jeder problemlos aneignen. Bei komplizierteren Verfahren ist mindestens ein grober Überblick erforderlich, um die Leistungsfähigkeit und die Leistungsgrenzen der Verfahren beurteilen zu können. Professionelle Erhebungen werden maschinell ausgewertet. Hierfür stehen leistungsfähige Programme zur Verfügung, zum Beispiel SPSS (Statistical Package for the Social Sciences). Für einfache Auswertungen enthält die Büro-Standardsoftware, zum Beispiel MS Excel, viele Funktionen. Begriffe und Verfahren der Statistik sind zu einem großen Teil genormt. Um unnötige Missverständnisse zu vermeiden, ist es zweckmäßig, die Normen zu beachten. In den nachstehenden Erläuterungen sind gängige Normen angegeben, aus Gründen der Verständlichkeit allerdings nicht immer wörtlich, sondern bisweilen sinngemäß oder vereinfacht.

Wichtiger Hinweis : Inübungsaufgaben wird - abweichend von der Praxis - aus Gründen derübersichtlichkeit meistens von einer sehr geringen Fallzahl ausgegangen. Eventuell daraus resultierende Probleme bezüglich der Anwendbarkeit bestimmter Verfahren werden vernachlässigt.

2. Statistik und empirische Untersuchung

Statistische Auswertungen stehen in der öffentlichen Verwaltung häufig im Zusammenhang mit empirischen Untersuchungen, die entweder selbst vorgenommen werden oder bereits vorliegen. Häufig handelt es sich dabei um kleinere Erhebungen auf örtlicher oder regionaler Ebene. Über die möglichen statistischen Auswertungen wird meistens schon in der Planungsphase entschieden: bewusst oder unbewusst.

Planung einer empirischen Untersuchung

Eine empirische Untersuchung beginnt mit der Auswahl und der Formulie- rung des zu untersuchenden Problems. Die Formulierung muss eindeutig sein und das Ziel des Vorhabens präzise beschreiben. Sie darf nicht un- vollständig, mehrdeutig oder inkonsistent sein. Neben der klaren Formulie- rung des Problems und den sich daraus ergebenden Fragen ist eine Be- gründung für die Auswahl genau dieses Problems erforderlich. Möglich sind zum Beispiel technische, ökonomische, juristische oder sozialwissen- schaftliche Begründungen, die sich inhaltlich auf eine Verbesserung der Produkte oder der Verfahren in der Berufspraxis beziehen. Es erscheint wenig sinnvoll, sich Problemen zuzuwenden, deren Bedeutung erkennbar gering ist oder die mit den gegebenen Möglichkeiten nicht lösbar sind.

Mit der Bedeutung des zu bearbeitenden Problems unmittelbar verbunden ist die Notwendigkeit zur Ermittlung des vorhandenen Wissens, das als Basis für die Bearbeitung der Aufgabe benutzt werden kann. Hierzu ist eine systematische Auswertung der aktuellen Fachliteratur sowie der ein- schlägigen Normen und Vorschriften erforderlich. Eine derartige Auswer- tung ermöglicht auch die erforderliche Einordnung des Problems in die fachlichen Zusammenhänge.

Falls mit der Untersuchung bestimmte Vermutungen (Hypothesen) geprüft werden sollen, sind in diesem Stadium der Bearbeitung die Hypothesen zu formulieren und zu begründen.

Auf der Grundlage dieses Begründungszusammenhanges lässt sich die beabsichtigte empirische Untersuchung entwerfen. Es muss eindeutig ge- klärt werden, wie der Untersuchungsbereich abgegrenzt wird und welche Subjekte und Objekte in die Untersuchung einbezogen werden. Die ge- wählte Methode (zum Beispiel Befragung, Beobachtung, Experiment) muss begründet werden. Insbesondere ist zu erläutern, warum genau diese Methode dem Problem angemessen ist. Sofern eine Stichprobe gezogen werden soll, muss genau angegeben werden, aus welcher Grundgesamtheit diese gezogen wird und nach welchem Verfahren die Auswahl erfolgt.

Nur bei Kenntnis des genauen Auswahlverfahrens ist es möglich, Aussa- gen über eine eventuelle Übertragbarkeit der gewonnenen Ergebnisse zu treffen (einschließlich Fehlerquellen). Die messtechnische Erfassung (Operationalisierung) aller Variablen (Merkmale von Einheiten) sowie der Kategorien (zur Aufnahme der Merkmalswerte), die zu den einzelnen Va- riablen eingerichtet werden, sind darzustellen und zu begründen.

Die nachfolgend immer wieder präsentierten DIN-Einträge sollten dazu verwendet werden, gleich die korrekte Bezeichnung zu erlernen.

DIN

Abbildung in dieser Leseprobe nicht enthalten

Der Ablauf der Untersuchung muss ebenfalls dokumentiert werden, da sich aus der Untersuchungsdurchführung wiederum Fehlerquellen für die Interpretation der Ergebnisse ergeben können (zum Beispiel unbeabsichtigte Beeinflussungen).

Insgesamt muss eine professionelle Untersuchung den Gütekriterien der Objektivität, Validität und Reliabilität so weit wie möglich entsprechen.

Objektivität bedeutet, dass verschiedene Personen bei der Anwendung des gleichen Verfahrens zu demselben Ergebnis kommen (Beispiel: Bewertung einer Prüfungsaufgabe)

Validität bedeutet, dass das Verfahren tatsächlich den vorgesehenen Zweck erfüllt (Beispiel: Das Ergebnis einer Klausurarbeit gibt tatsächlich ein zutreffendes Bild von der Leistungsfähigkeit eines Klausurteilnehmers in dem jeweiligen Themengebiet).

Reliabilität bedeutet, dass die wiederholte Anwendung des gleichen Verfahrens auf den gleichen Gegenstand zu identischen Ergebnissen führt (Beispiel: die wiederholte Bewertung des gleichen Prüfungsteiles führt immer zu demselben Ergebnis).

Die Auswertung der Daten beginnt mit der Feststellung der Nennungen (Häufigkeiten) aller Kategorien der Variablen (Grundauszählung).

Abbildung in dieser Leseprobe nicht enthalten

Das Ergebnis dieser Grundauszählung wird zweckmäßigerweise in ein Exemplar des Erhebungsinstruments, zum Beispiel eines Fragebogens, eingetragen und als Anlage dem Bericht beigefügt. Für die Berechnung von Mittelwerten und Streuungsmaßen, für das Aufzeigen von Zusam- menhängen zwischen mehreren Variablen (Kreuztabellen) sowie für die evtl. Berechnung von Maßzahlen über die Stärke des Zusammenhanges (Kontingenzkoeffizienten, Korrelationskoeffizienten) sind unbedingt das jeweilige Skalenniveau sowie die sonstigen Voraussetzungen, zum Beispiel Verteilung und Besetzungszahlen, zu beachten. Soweit zwei- oder mehrdimensionale Analysen vorgenommen werden, sind diese inhaltlich zu begründen. Es ist wenig sinnvoll, Analysen nur deswegen durchzuführen, weil das benutzte Rechenprogramm sie erlaubt. Dies führt zwar in der Regel zu einer beachtlichen Menge an Kennzahlen, Tabellen und Grafiken, jedoch ist der inhaltliche Ertrag zumeist gering.

Ausgehend von dieser Zielsetzung bietet sich in den meisten Fällen ein schriftlicher Bericht an. Dazu aber später.

Aufgabe: Wie beurteilen Sie das folgende Vorhaben?

- Der für Germanistik zuständige StOR G. einer Schule in der zentral in Deutschland gelegenen Großstadt K. möchte die kulturelle Aufge- schlossenheit der Deutschen einwandfrei ermitteln. Zu diesem Zweck hat er kurz vor der Tagesschau einen Fragebogen entworfen (je 3 geschlossene und 3 offene Fragen). Der Fragebogen soll am folgenden Tag von seinen Schülern kopiert und zu Interviewzwecken genutzt werden. 20 Schüler sollen in der Innenstadt von K. ab 10 Uhr je 20 Passanten befragen. Für den Nachmittag ist die Auswertung vorgesehen. Jeder Interviewer soll seine Ergebnisse in schriftlicher Form kurz darstellen. Am folgenden Tag soll daraus unter Leitung des Klassensprechers in der Funktion des Projektleiters ein Ab- schlussbericht erstellt werden.

3. Merkmalsart und Skalentyp

Abbildung in dieser Leseprobe nicht enthalten

Die nachfolgende Tabelle fasst sehr kompakt die wesentlichen Aussagen der in der DIN getroffenen Festlegungen zusammen:

Tabelle: Merkmalsarten

Abbildung in dieser Leseprobe nicht enthalten

Aufgaben:

- Erläutern Sie am Beispiel der Ziehung der Lottozahlen die Bezeichnungen „Grundgesamtheit“ und „Stichprobe“!
- Eine Person ist 25 Jahre alt. Erläutern Sie an diesem Beispiel die Be- zeichnungen „Einheit“, „Merkmal“ und „Merkmalswert“.
- Erläutern Sie anhand der Beispiele Farbe, Körpergröße, dienstliche Beurteilung die Bezeichnungen „Quantitatives Merkmal“, „Qualita- tives Merkmal“, „Nominalskala“, „Ordinalskala“, „Intervallskala“, „Verhältnisskala“.
- Warum wird für die meisten Untersuchungen eine Stichprobe aus der Grundgesamtheit gezogen?
- Was versteht man unter einer „Zufallsstichprobe“?
- Eine Behörde hat 2000 Mitarbeiter. Sie möchten eine Befragung zur Arbeitssituation und zur Arbeitszufriedenheit durchführen. Möglich ist entweder eine Totalerhebung oder eine StichprobenUntersuchung. Vergleichen Sie beide Möglichkeiten und treffen Sie eine begründete Entscheidung.

4. Arithmetischer Mittelwert

Der bekannteste und einfachste Durchschnitt ist das arithmetische Mittel. Darunter versteht man die Summe der Werte, deren Mittelwert wir suchen, geteilt durch die Anzahl dieser Werte.

Ein typisches Beispiel ist die mittlere Tagestemperatur, gemessen an einem lauen Frühlingstag in Kassel:

Abbildung in dieser Leseprobe nicht enthalten

Das arithmetische Mittel ist die Summe der Merkmalswerte geteilt durch die Anzahl der Merkmalswerte. Es balanciert die Merkmalswerte gerade aus. Darum wird der Mittelwert auch als „Kennwert der Lage“ bezeichnet.

Abbildung in dieser Leseprobe nicht enthalten

In Verallgemeinerung des Beispiels folgt die mathematische Darstellung (Formel) für den arithmetischen Mittelwert:

Abbildung in dieser Leseprobe nicht enthalten

Durch Vergleich mit dem obigen Beispiel ergibt sich unmittelbar:

[Abbildung in dieser Leseprobe nicht enthalten]entspricht dem Faktor [Abbildung in dieser Leseprobe nicht enthalten], wobei n = 6 die Anzahl der Merkmals- werte beziffert.

[Abbildung in dieser Leseprobe nicht enthalten]entspricht dem Klammerausdruck:

(10°C+ 13°C + 16°C + 13°C +13°C +10°C),

Das Summenzeichen ∑ (ausgesprochen: „Sigma“) symbolisiert die ma- thematische Anweisung, alle Zahlen hinter dem Summenzeichen zu addie- ren.

[Abbildung in dieser Leseprobe nicht enthalten] (ausgesprochen: x-quer) ist der arithmetische Mittelwert, in diesem Beispiel = 12,5.

Der Mittelwert dient zur Analyse großer Datenmengen und ist das wichtigste, nicht das einzige, Werkzeug, das uns hilft, die Übersicht nicht zu verlieren. Beispiele für den täglichen Einsatz dieses Werkzeuges begegnen uns überall: ob im durchschnittlichen Einkommen, bei Aktienkursen und Klimatabellen, von Krankenständen bis hin zur durchschnittlichen Frequenz des Sexualverkehrs. Für viele praktische Probleme reicht dieses gewöhnliche arithmetische Mittel völlig aus.

Vorteil ist, dass die Einzelwerte im Prinzip gar nicht gebraucht werden. Die Kenntnis der Summe und Anzahl der Werte reicht. Ein unschätzbarer Vorteil insbesondere dann, wenn man die Einzelwerte gar nicht kennt (durchschnittliches Gehalt eines Mitarbeiters der Fa. XY).

Abbildung in dieser Leseprobe nicht enthalten

Die wichtigste Alternative zum gewöhnlichen arithmetische Mittel stellt das „gewogene“ oder „gewichtete“ arithmetische Mittel dar.

Betrachten wir wieder unser Beispiel:

Abbildung in dieser Leseprobe nicht enthalten

Die gemessenen Temperaturwerte können auch wie folgt dargestellt wer- den:

Abbildung in dieser Leseprobe nicht enthalten

Daraus folgt eine mittlere Temperatur von:

Abbildung in dieser Leseprobe nicht enthalten

Oder allgemein:

Abbildung in dieser Leseprobe nicht enthalten

Hierbei wird mit [Abbildung in dieser Leseprobe nicht enthalten] die „absolute Häufigkeit“ eines Merkmalswertes

bezeichnet, m gibt an, wie viele Häufigkeiten bzw. Produkte aus Häufigkeit und Merkmalswert beteiligt sind.

Abbildung in dieser Leseprobe nicht enthalten

Häufig wird anstelle der „absoluten Häufigkeit“ auch die „relative Häu- figkeit“[Abbildung in dieser Leseprobe nicht enthalten] verwendet:

Abbildung in dieser Leseprobe nicht enthalten

Der Vorteil besteht darin, dass nicht mehr durch die zweite Summe aus Formel (2) geteilt werden muss und die Formel etwas einfacher aussieht:

Abbildung in dieser Leseprobe nicht enthalten

Zu beachten ist, dass die Summe aller (4)

[Abbildung in dieser Leseprobe nicht enthalten]genau 1 ergeben muss.

Das „gewogene“ Mittel wird immer dann vorteilhaft verwendet, wenn die einzelnen Merkmalswerte unterschiedlich stark „ins Gewicht fallen“.

Beispiel:

- Berechnung der mittleren Teuerungskosten für einen PKW. Annah- me: die Kosten für Motoröl steigen um 10 %, der von Benzin um 50 %. Der arithmetisch mittlere Anstieg der Kosten um 30 % würde hier ein falsches Bild der Kostenzunahme geben, da in der Regel mehr Benzin als Öl verbraucht wird und daher die Erhöhung der Benzin- kosten stärker ins Gewicht fällt. Bei einem Ausgabenanteil von 8/10 für Benzin und 2/10 für Öl bietet sich statt dessen an, das gewogene Mittel zu berechnen:

Abbildung in dieser Leseprobe nicht enthalten

Durch die „Betonung“ der Benzinkosten kommt die „mittlere“ Teuerung der Wahrheit weit näher.

Auch wenn der Mittelwert gut geeignet ist, eine Reihe von Merkmalswerten zu charakterisieren, reicht die alleinige Kenntnis des Mittelwertes in der Regel nicht aus. Zum Beispiel wird im Mittelwert keine Aussage darüber getroffen, ob es morgens vielleicht extrem kalt, dafür tagsüber viel zu heiß gewesen ist, um sich wohlzufühlen.

Beispiel:

Über Tag gemessene Temperaturen in Grad Celsius, jeweils im Ein- Stunden-Abstand, von 8.00 - 20.00 Uhr, am Montag, d. 6. Oktober: 1, 2, 5, 10, 30, 50, 70, 50, 30, 10, 5, 1, 1 (Reihe: Dubai); x = 20,38 °C

15, 17, 17, 19, 20, 20, 21, 22, 23, 22, 23, 23, 23 (Reihe: Kassel); x = 20,38 °C

Obwohl die mittleren Temperaturen in Dubai und in Kassel jeweils 20,38 °C betrugen, unterschlägt uns der arithmetische Mittelwert, dass der Aufenthalt in Kassel, bezogen auf die Temperatur, für Menschen deutlich angenehmer ist.

Fazit: Wir benötigen weitere Kennwerte, um eine Reihe eindeutig zu charakterisieren. Betrachten wir zum Beispiel die Streuung.

5. Kennwerte der Streuung

Der einfachste Kennwert der Streuung ist die Spannweite w. Die Spannweite w eines Merkmals X ist definiert als Differenz zwischen größtem und kleinstem Merkmalswertes.

Abbildung in dieser Leseprobe nicht enthalten

Oder auch:

Abbildung in dieser Leseprobe nicht enthalten

Im Falle der Reihe „Dubai“ ergibt sich der Wert: w X = 70 °C - 1 °C = 69 °C

Im Falle „Kassel“ ergibt sich der Wert: w X = 23 °C - 15 °C = 8 °C

Der Unterschied ist groß. Obwohl die Mittelwerte identisch sind, erkennt man anhand der Spannweiten sofort, ohne Einzelwerte zu kennen, dass in „Dubai“ extremere Temperaturunterschiede gemessen wurden als in „Kas- sel“.

Allerdings reicht auch die Spannweite zur eindeutigen Charakterisierung häufig nicht aus.

Beispiel: Addiere zur Reihe „Dubai“ zu jedem Merkmalswert einen systematischen Fehler von 5°C. Es ergibt sich eine neue Reihe, die jedoch die gleiche Spannweite aufweist:

w X (1’)= 75 °C - 6 °C = 69 °C

Auch wenn jeder Wert doppelt gemessen würde, änderte sich nichts an dem arithmetischen Mittelwert oder der Spannweite, obwohl die Reihen unterschiedlich sind:

Abbildung in dieser Leseprobe nicht enthalten

Das weitaus bekannteste Maßfür die Streuung ist die Standardabwei chung „ s “ bzw. die eng damit verbundene Varianzs 2 “

Die Varianz drückt den mittleren Abstand von dem arithmetischen Mittel aus oder, um wie viel die Merkmalswerte um einen geeigneten mittleren Wert variieren.

Da die Differenz zwischen Merkmalswert und zugehörigem Mittelwert sowohl positiv wie negativ sein kann, daher eine Aufsummierung aller Differenzen gleich Null sein kann, obwohl in der Regel Differenzen un- gleich Null vorkommen, werden die Differenzen jeweils quadriert. Damit wird sichergestellt, dass alle Summanden positiv sind und sich nicht zu Null addieren können:

Abbildung in dieser Leseprobe nicht enthalten

Beispiel:

Wir betrachten wieder Reihe: Dubai:

(1, 2, 5, 10, 30, 50, 70, 50, 30, 10, 5, 1, 1)°C

Der arithmetische Mittelwert beträgt 20,38°C. Die Varianz beträgt:

Abbildung in dieser Leseprobe nicht enthalten

Entsprechend gilt für Reihe: Kassel:

(15, 17, 17, 19, 20, 20, 21, 22, 23, 22, 23, 23, 23)°C Der arithmetische Mittelwert beträgt 20,38°C . Aber:

Abbildung in dieser Leseprobe nicht enthalten

Alle Varianzen bleiben bei Addition einer Konstanten zu den Ausgangsdaten gleich, was vernünftig ist, da wir statt der Celsius-Skala auch die absolute oder Kelvin -Skala hätten verwenden können. Deshalb sollten die Messwerte nicht ungenauer werden.

Leider ergibt sich, dass sich die Varianz bei der Multiplikation mit einer Konstanten nicht so ordentlich verhält.

Angenommen, wir hätten die Temperaturen in Grad Celsius gemessen und würden sie in Grad Fahrenheit umrechnen (mit dem Faktor 9/5 multiplizie- ren und 32 hinzuaddieren). Wie leicht nachzurechnen ist, sind die Varian- zen unterschiedlich groß. Allerdings ist zu beobachten, dass sich die Vari- anzen der beiden Temperaturreihen genau um 2x den Faktor 9/5 unter- scheiden, das heißt, um das Quadrat des Umrechnungsfaktors. Daher wird oftmals statt der Varianz s2 die Standardabweichung s verwendet:

Abbildung in dieser Leseprobe nicht enthalten

Standard- Positive Quadratwurzel aus der Varianz

Abbildung in dieser Leseprobe nicht enthalten

Damit bleibt die Standardabweichung wie bei der Varianz bei Addition oder Subtraktion einer Konstanten unverändert. Bei Multiplikation oder Division mit einer positiven Konstanten a multipliziert sich auch die Standardabweichung mit dem gleichen Faktor a.

Eine große Hilfe bei der Charakterisierung stark unterschiedlicher Reihen ist, die Standardabweichung auf den zugehörigen Mittelwert zu beziehen. Wir erhalten eine Aussage über die „relative“ Streuung um einen Mittelwert. Diese Kennzahl wird Variationskoeffizient genannt.

Abbildung in dieser Leseprobe nicht enthalten

Ein weiterer „relativer“ Koeffizient ist der tungswert.

Abbildung in dieser Leseprobe nicht enthalten

Aufgaben:

- Wozu dienen Kenngrößen der Lage und der Streuung?
- Finden Sie ein Beispiel für einen „Standardisierten Beobachtungs- wert“

6. Klassenbildung

Häufig ist die Erfassung und Auszählung aller einzelnen Merkmalsausprägungen (Beobachtungswerte) nicht sinnvoll oder nicht möglich. Sei es, weil die Anzahl der Beobachtungswerte zu groß ist oder schlicht die Übersichtlichkeit bei Darstellung und Aufbereitung verloren geht.

In den Fällen, in denen nicht alle möglichen Beobachtungswerte einzeln erfasst werden, werden benachbarte Beobachtungswerte zu einer Klasse zusammengefasst. Die Zusammenfassung von Beobachtungswerten nennt man Klassierung.

Abbildung in dieser Leseprobe nicht enthalten

Eine Klasse wird in der Regel durch zwei Grenzen bestimmt, die untere

Klassengrenze [Abbildung in dieser Leseprobe nicht enthalten]und die obere Klassengrenze x *. Da alle Beobachtungs-[Abbildung in dieser Leseprobe nicht enthalten]werte eindeutig einer Klasse zugerechnet werden müssen ist es üblich, jeweils eine Klassengrenze der betreffenden Klasse zuzurechnen, während die jeweils andere zur entsprechenden Nachbarklasse gehört.

Abbildung in dieser Leseprobe nicht enthalten

Die Differenz zweier aufeinander folgender Klassengrenzen heißt Klas- senbreite wk. Für die Ermittlung der Klassenbreite gilt folgende „Faustfor- mel“:

Abbildung in dieser Leseprobe nicht enthalten

Wobei n die Anzahl der Beobachtungswerte und k = Klassen angibt

Für k sind auch folgende Ausdrücke üblich: [Abbildung in dieser Leseprobe nicht enthalten]

Abbildung in dieser Leseprobe nicht enthalten

Eine Klassierung wird ab n ≥ 30 empfohlen. Für n > 400 wird der Wurzel-

ausdruck durch eine feste Zahl ersetzt und es gilt:

Abbildung in dieser Leseprobe nicht enthalten

[...]

Ende der Leseprobe aus 131 Seiten

Details

Titel
Deskriptive (beschreibende) Statistik im öffentlichen Dienst
Untertitel
Grundkurs mit vielen Beispielen und Übungen
Autor
Jahr
2014
Seiten
131
Katalognummer
V270088
ISBN (eBook)
9783656613145
ISBN (Buch)
9783656613121
Dateigröße
1847 KB
Sprache
Deutsch
Schlagworte
Öffentlich, Beamte, Statistik, Beispiele, Aufgaben mit Lösungen, Jedermann, Benford, Skalentypen, Mittelwerte, Median, Modalwert, Kaisermodus, Kontingenzkoeffizient, Korrelationskoeffizient, Kennwert, Stichprobe, deskriptiv, Regresion, Regression
Arbeit zitieren
Dr. Uwe Sliwczuk (Autor), 2014, Deskriptive (beschreibende) Statistik im öffentlichen Dienst, München, GRIN Verlag, https://www.grin.com/document/270088

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Deskriptive (beschreibende) Statistik im öffentlichen Dienst


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden