Grundbegriffe der Statistik
Notwendigkeit: 1.) Einsicht und Verständnis in die Spezifisch statistische Arbeits- und Untersuchungsweise
2.) bei konkreten Untersuchungsaufgaben - Beurteilung der Angemessenheit des Statistischen Vorgehens
- begründete, sachkundige Auswahl geeigneter
Verfahren
statistische Element: = kleinste statistische Einheit, deren Eigenschaften ( Merkmale ) erfaßt und untersucht werden sollen
Merkmalsträger
statistische Gesamtheit: = Zusammenfassung einer Anzahl statistischer Elemente, die gleichartig sind bezüglich bestimmter, genau
festgelegter (definierter ) Merkmale.
Wenige Merkmale sind festgelegt, andere sind variabel. Die variablen Merkmale bilden den Gegenstand
der statistischen Analyse.
Abgrenzung ist Ermessensentscheidung, bestimmt durch Untersuchungsziel.
Abgrenzung ausgehend von ökon.- theoretischen Überlegungen sichert Vermeidung von Fehlschlüssen aus
statistischen Ergebnissen.
Abgrenzungsprobleme : - statistische Untersuchungsmerkmale variieren von Element zu Element.
Kennzeichen stat. Arbeitsweise: - Ermittlung charakteristischer, zahlenmäßiger Informationen zur Masse aus der Variabilität der
beobachteten Untersuchungsmerkmale.
Umfang der Gesaamtheit = Anzahl der in der Gesamtheit enthaltenen Elemente ( n )
Teilgesamtheit: - Grundgesamtheiten (GG) werden geteilt, indem in der GG variabel angesetzten Merkmale zusätzlich festgelegt
werden.
Statistische Merkmale:
Differenzierung in konstante und variable Merkmale mit Definition der Gesamtheit
Variable Merkmale: = Eigenschaften der stat. Elemente, die für die stat. Analyse von Interesse sind
( Schwerpunkt der stat. Analyse)
verschiedene Arten / Typen sachlicher Merkmale, Unterscheidung bzgl. Meßniveau und damit Informationsgehalt.
1.)Klassifikatorische ( qualitative, begrifflich sachliche ) Merkmale
= Merkmalsausprägungen artmäßig, auf Nominalskala erfaßt
- zur Klassifizierung von Elementen ( Systematiken in der Wirtschaftsstatistik )
- dabei Identifikation von Klassen durch Kodierung (den begriffl. Ausprägungen werden Zahlen zugeordnet )
Beachtung: Hinter Zahlen stehen nur Begriffe, keine quantitativen Größen. Deshalb keine math.- arithmet. Operationen (Add., Subtr. )
ausführbar, auch Ungleichungen bedeutungslos.
Nominalskala ist niedrigstes Meßniveau
2.) Komparative ( ordinalskalierte ) Merkmale
- rangmaßig geordnete, intensitätsmäßig abgestufte Merkmalsausprägungen
- Rangzahlen
- Darstellung auf Ordinalskala
- Zwischen Zahlen - Ordnungsbeziehungen
- wegen Ordnungsbeziehung Ungleichungen definierbar ( 1 besser als 3 )
- aber : Intervalle ( Abstände der Elemente auf Ordinalskala nicht einschätzbar ) ungleich
wie auf Nominalskala auch auf
Ordinalskala keine arithm. Operationen ausführbar
3.) metrische ( quantitative, zahlenmäßige ) Merkmale
- Merkmalsausprägung gemessen oder gezählt
- Kardinalskala: Intervallskala und Verhältnisskala ( hier stetig variierende Merkmale )
- Absolutskala diskret variierende Merkmale
3.1. Intervallskala
- neben Eigenschaften der Ordnungsbeziehung auch Eigenschaft gleicher Intervalle: gleichgroße Intervalle auf der Intervallskala
repräsentieren gleichgroße Differenzen der gemessenen Merkmalswerte
- Addition und Subtraktion möglich, da Nullpunkt willkürlich
- keine Berechnung von Verhältnissen zwischen Zahlen
- Division, Multiplikation nicht erlaubt
3.2. Verhältnisskala
= - Intervallskala mit absolutem Nullpunkt
- Rangfolge, Abstand und Verhältnis zweier Merkmalswerte definiert
- Zahl 0 repräsentiert vollständige Abwesenheit der Eigenschaft
- Verhältnis zwischen zwei Zahlen auf Skala unabhängig von Einheiten der Messungen
- alle arithmetischen Operationen möglich
- am häufigsten verwendete Skala
Die Merkmale auf Intervall- und Verhältnisskala sind stetige, kontinuierliche Merkmale, die überall abzählbar, alle beliebigen Werte
annehmen können ( meßbare Variation ).
3.3. absolute Skala
- neben Rangfolge, Abstand und Verhältniswert zweier Merkmalswerte ist nat. Einheit gegeben
- Merkmale auf Absolutskala sind diskrete Mertkmale = Merkmale, die abzählbar viele Merkmalswerte bei endlichem Wertebereich
annehmen können ( ganzzahlige Variation )
Ein Merkmal läßt sich durch verschiedene Skalen ausdrüken, z.B. Temperatur
Ordinalskala Intervallsk. Verhälnissk.
Heiß
°
C Kelvin
warm
kühl
kalt
sehr kalt
Problem der Wahl einer geeigneten Skala in der praktischen Arbeit
Grundsatz: möglichst höherwertige Skala verwenden ( höchste Wertigkeit, Genauigkeit metrische Skalen )
Verschiedene Gründe für die Verwendung geringwertiger Skalen ( Meßgeräteverfügbarkeit, Geheimhaltung, Aufwand )
Außerdem bestimmte Anforderungen zgl. Skalentyp ausgehend von zu verwendender Methode
Praktisch oft die Notwendigkeit der Transformation einer Skala in eine andere ( Umwandlung höherwertiger Skalen in
geringwertigere kein Problem, umgekehrt ja
Eindimensionale Nominalskala oft nur durch mehrdimensionale metrische Skalen zu ersetzen
- ein- und mehrdimensionale Merkmale
- k-dimensionales Merkmal ist die Kombination der Merkmalsvariationen von k Merkmalen der Elemente eine Gesamtheit
k=2 ... Wertepaare , k=3 ... Wertetripel
( notwendig für Kausalforschung )
Anstelle des Merkmalsbegriffs in der Statistik auch Variable
Insbesonders in der induktiven Statistik Arbeitmit Zufallsvariablen X,Y,Z, deren Realisation stetige und diskrete Verteilungen sind
Verhältnisgrößen
= Originalgrößen in sinnvoller Beziehung, Quotienten
3 Arten sind in der Ökonomie von Bedeutung: Gliederungszahlen, Beziehungszahlen, Meßzahlen
Gliederungszahl ( Quote, Anteilszahl )
= Quotient aus dem Umfang eine statistischen Teilmasse zum Umfang der Gesamtmasse ( 100 % prozentuale Interpretation )
- Vergleich der Gliederungszahl versch. Zeitpunkte / Zeitintervalle nur im Zusammenhang mit den absoluten Werten zulässig
Beziehungszahl b
i
( Dichtezahl )
= Verhältnis der Werte zweier verschiedenartiger, in sachlich sinnvoller Beziehung stehender Merkmale für ein Element b
i
= x
i
y
i
Die Beziehungszahl ist umso aussagefähiger, je stärker der sachlogische Zusammenhang der verwendeten Größen ist.
Meßzahl m: im engeren Sinne für den zeitl. Vergleich
= Quotient zweier Merkmalswerte für zwei Zeitpunkte / Zeitintervalle
y
t
Zeitreihe ; y
1
, y
2
,...,y
T
; m
T
= y
t+1
y
t
im weiteren Sinne für den räumlichen Vergleich
= Quotient zweier Merkmalswerte für zwei verschiedene Territorien zum selben Zeitpunkt / Zeitintervall
statistische Reihe = Ordnung der Merkmalswerte nach dem zeitliche, örtlichen oder sachlichen Merkmal
Zeitreihe = dynamische Reihe = Ordnung der Merkmalswerte nach der Zeit
- Bestandsgrößen als Zeitpunktreihen erfaßt
- Bewegungsgrößen als Zeitintervallreihen erfaßt
Zeitreihenanalyse = Erarbeitung von Aussagen zur zeitl. Entwicklung von ökon. Größen mit Ziel der Vorausschau
Eindimensionale Verfahren = Analyse und Prognose des Merkmals in Abhängigkeit von der Zeit, durch Modellierung der
vorhandenensystematischen Komponenten
Mehrdimensionale Verfahren = Analyse und Prognose mehrerer Zeutreihen auf der Grundlage ökon.-theoreth. Und anderen
Hypothesen zum Zusammenhang der Merkmale Regressionsmodelle und ökonometrische Modelle
Zeitbezug: Stunde, Tag, Dekade, Manat, Quartal, Jahr, mehrere Jahre
Querschnittsreihen = statistische Reihen
Örtliche und sachliche Reihe
Örtliche Reihe spezielle örtliche Reihe in der Regionalanalyse
Regionalreihen = wirtschaftstatistische Reihen mit regional einfeschränkter Aussage
Mondialreihe = statistische Reihen zur Weltwirtschaft / Konjunkturforschung
Zeitreihe: Umsatz je Beschäftigter ( DM ) im Bergbau und im verarbeitendem Gewerbe in Sachsen
1991 Jan 3607
Februar 3254
März 3531
April 3554
Mai 3376
Juni 3604
Juli 4004
August 4045
September 4393
Oktober 4883
November 5223
Dezember 5808
1992 Januar 5977
Februar 6001
März 7216
Örtliche Reihe: Rohölförderung in der Welt, 1988
Region Mill t
Westeuropa 195,8
Afrika 246,3
Naher Osten 712,5
Nordamerika 548,0
Mittel- und Südamerika 337,1
Ferner Osten 160,8
Ostblock 778,2
3025,2
sachliche Reihen = Ordnung nach der qualitativen oder quantitativen Merkmalsausprägung
Analyse von Querschnittsreihen eindimensional mit Mittelwerten, Streuungsmaßen, Quantilen
Mehrdimensionale Verfahren zur Übersicht der Abhängigkeitsanalyse ( Korelations- und Regressionsanalyse,
Varianzanalyse, Clusteranalyse u.a.)
Sachliche Reihen: Bevölkerung nach Altersklassen, BRD 1987
Alter ( in Jahren ) Personen ( Mill )
Von ... bis unter
0 15 8,9
15 21 5,43
21 40 17,72
40 60 16,36
60 u. mehr 12,67
61,08
Erwerbstätige nach der Stellung im Beruf 1988, BRD
1000 Pers
Selbständige 2422
Mithelfende Familienangehörige 639
Beamte 2370
Angestellte 11516
Arbeiter 10419
Teilzeitbeschäftigte 3305
27366
Häufigkeitsdichtefunktion / Verteilungsfunktion
Gegeben sei stat. eine Gesamtheit von n Elementen, die bzgl. Eines Merkmals untersucht werden soll.
X , x
i
; n
i
... absolute Häufigkeiten ; n
i
0 ;
n
i
= n
n
i
= f
i
... relative Häufigkeiten ; 0
f
i
1 ;
f
i
= 1
n
Häufigkeitsdichtefunktion = Zuordnung der Anzahl der Elemente n
i
oder der Elementenanteile f
i
einer gegebenen Gesamtheit zu den
auftretenden Merkmalsvariationen
Frage: Wieviele Elemente oder welcher Elementenanteil an der Gesamtheit weist einen best. Merkmalswert auf?
Häufigkeitstabelle / Häufigkeitsdiagramm
Weitere wichtige Frage: Wieviele Elemente oder welcher Elementenanteil der Gesamtheit besitzen einen Merkmalswert, der kleiner
oder gleich X ist?
Antwort: Häufigkeitssummenfunktion ( kumulierte absolute Häufigkeit ) S (X)
S(x) =
n
i
i mit
x
i
x
empirische Verteilungsfunktion F (x)
F(x) =
f
i
= S(x)
i mit n
x
i
x
(Kumulierte relative Häufigkeit)
0
F(x)
1
2.2. Etappen der statistischen Arbeit
Vorbereitung
3 Aspekte: theoretisch, methodisch, organisatorisch
theoretischer Aspekt: = inhaltliche Bestimmung der stat. Aufgabe bzgl. Der zu untersuchenden Massenerscheinung, theoret.
Ausgangspunkt
methodischer Aspekt: Klärung wichtiger stat.-meth. Fragen bzgl. Der zu untersuchenden Merkmale
- Definition der statistischen Gesamtheit, Verwendung geeigneter Skalen
- Auswahl angemessener Verfahren der Erfassung, Darstellung, Aufbereitung und Analyse
Organisatorischer Aspekt:Planung des Ablaufes der Arbeitsetappen ( Zeit, Arbeitskräfte- und Materialbedarf, Kosten )
Erfassung = Gewinnung der Variationen der Untersuchungsmerkmale der Elemente der stat. Gesamtheit, Erhebung, Zählung,
Messung ( induktive und passive Experimente )
Befragung ( mündlich [Interview], schriftlich [Fragebogen] )
Erfassungsarten Unterscheidung nach Umfang, Häufigkeit und Herkunft
Totalerfassung ( Vollerhebung )
= Erfassung der Variationen der Untersuchungsmerkmale für sämtliche Elemente der Gesamtheit
- überwiegend bei sozioökonomischen Erscheinungen und Prozessen
- notwendig, wenn hohe Genauigkeit der Aussagen erforderlich ist
- hoher Aufwand
Teilerfassung: ( bewußte, gezielte Auswahl )
= Auswahl vorherbestimmter Elemente durch subjektive Entscheidung
- typische Auswahl: wesentliche Elemente systematischer Auswahl
( Ordnung der Elemente, Auswahl in konstantem Abstand, z.B. f=0,05
jedes 20. Element wird ausgewählt )
Zufallsauswahl
Einfache Zufallsauswahl
= jedes Element der Gesamtheit besitzt gleiche Chance, ausgewählt zu werden (Urnenmethode,
Zufallszahlengenerator)
- für homogene Gesamtheiten ( nicht zu starke Streuung bzgl. Des zu untersuchenden Merkmals )
- selten in Wirtschfts- und Sozialstatistik
geschichtete Auswahl
- inhomogene ( heterogene ) Grundgesamtheit in Teilgesamtheiten oder Schichten geteilt
- einfache Zufallsauswahl sus Schichten ( jede Schicht wird einbezogen )
- unterschiedlicher Auswahlsatz je Schicht möglich
- Ziel: günstiger Schichtungseffekt
- natürliche Schichtung durch territoriale Gesichtspunkte ( regionale Schicht )
- sachliche Schichtung ( Größenklassen, Klassifizierung )
- bessere Ergebnisse als reine Zufallsauswahl
Klumpenauswahl
- Teilung der Grundgesamtheit in Teilgesamtheit oder Klumpen
- zufällige Auswahl von Klumpen und Totaleinbezug der Elemente der Klumpen ( Zeit- und Kostenersparnis )
- Spezialfall Flächenstichprobe: Klumpen sind regionale Verwaltungseinheiten
mehrstufige Stichprobenverfahren = mehrere nacheinander durchgeführte Zufallsauswahlen auf verschiedenen Ebenen
- Umfang der Teilgesamtheit fällt von Stufe auf Stufe
- Auswahl der Elemente auf der letzten Stufe
- erhöhter methodischer Aufwand
Häufigkeit der Erfassung
- zeitlicher Veränderungsgrad der Grundgesamtheit hinsichtlich der Untersuchungsmerkmale bestimmt die
Häufigkeit der Elemente
einmalige Erfassung
- geringer zeitlicher Veränderungsgrad von Massenerscheinungen
- einmaliges Auftreten ( Katastrophe )
- bei umfangreicher und komplexer Zusammensetzung der Massenerscheinung ( Aufwand )
periodisch - relativ große Abstände zwischen den Erfassungen ( mehrere Jahre )
- kleinere Abstände
permanente Erfassung
- hoher zeitlicher Veränderungsgrad
- vierteljährlich, monatlich, dekadisch, täglich, je nach Herkunft / Zweck der Erfassung
Primärerfassung = erstmalige Zählung / Messung der werte der Untersuchungsmerkmale, unmittelbar und ausschließlich für das
angestrebte statistische Ziel
Sekundärerfassung
- automatische Speicherung von Daten bei Steuerung und Regelung technologischer Prozesse
- Daten der amtlichen Statistik für Kreise / kreisfreie Städte ( jährlich bei stat. Landesämtern )
- versch. Datenbanken bei stat. Amt der EU ( Umwelt, makroökon. Daten, soziale Indikatoren, Landwirtschaft )
Aufbereitung = Verdichtung der erfaßten Daten in Tabellen, Graphiken, Einzelinformationen zu Gruppeninformationen wichtige
Verfahrensschritte
1.) Prüfen des Urmaterials auf Vollständigkeit, Widerspruchsfreiheit, Glaubwürdigkeit
2.) Verschlüsselung klassifikatorischer Merkmalsprägungen: Signieren mehrstelliger Schlüsselnummern
3.) Übertragung der Informationen auf Datenträger ( Disketten )
4.) Sortieren nach Merkmalsausprägungen
- Rationalisierung der Aufbereitung auf betriebliche / überbetriebliche Ebenen durch modernen Datenbankbetrieb
- Arbeitsplatzrechner und Workstations
- automatische Kontrolle der Daten auf ,, Ausreißer ,, und Erfassungsfehler
- komplexe, durchgehend rechnergestützte Datenerfassung, -aufbereitung und analyse in zwei Schritten erreicht:
1.) Aufbau betrieblicher Datenbanken, Prüfung, Speicherung und Verarbeitung der Informationen zu Kennziffern
und Übersichten, die über BS / Drucker verfügbar sind )
2.) Datenfernübertragung der Kennziffern der Berichterstattung an Datenbank der stat. Ämter Länder und Stat.
Bundesland
Ausbau der Hardware und Nutzung leistungsfähiger Software
Darstellung - Tabelle als Grundform der Datenübersicht
- geordnete Datenzusammenstellung
Grundsätze: - Übersichtlichkeit, Aussagefähigkeit
- Überschrift
Kurzinformation zum Inhalt
- Textteil: Tabellenkopf mit Kopfzeile zum Inhalt der Spalten / Vorspalte zum Inhalt der Zeilen
Kopf
Kopf
1
2
3
4
5
Spalte
Vorspalte
Summenspalte
Summenzeile
Aufkommen wichtiger Steuern (Ausschnitt)
1980
1990
1980 1990
Mrd. DM
%
Steuereinahmen insgesamt
365
536,7 100
100
Direkte Steuern insgesamt
213,7 308,6 58,5
57,5
Darunter: Einkommens- u. Körperschaftssteuer 173,9 247,1 47,6
46
Vermögenssteuer
4,7
6,0
1,3
1,1
Gewerbesteuer
27,1
38,5
7,4
7,2
Indirekte Steuern
151,3 228,1 41,5
42,5
Davon Erzeugnisse des
Insgesamt
Grundstoff- und
Prod.-
gütergewerbe
Investgüter
gewerbe
Verbrauchsgüter
gewerbe
Nahrungs- und
Genußmittelgewerbe
1985 100
100
100
100
100
1986 97,6
89,1
102,1
101
99,1
1987 97,2
86,3
103,8
101,9
96,8
1988 98,8
87,9
105,5
103,8
98
1989 102,2
93,4
107,8
106,5
100,4
Aufgliederung = Angabe aller möglichen Unterteilungen mit ,, davon ,,
Zahlenteil: - Matrix aus Zeilen und Spalten mit Tabellenfeldern oder Tabellenfächern, kein Feld darf leerbleiben
- Konvention zu Sonderzeichen
- Summenzeile, Summenspalte
- Anmerkungen zur Definition und Abgrenzung in Fußnoten
Arten von Tabellen
- Arbeitstabellen ( Häufigkeitstabellen )
- Ergebnistabellen, Spezialtabellen
Sonderformen: Konten = Erfassung der Bewegung eines ökon. Prozesses durch Zuflüsse ( Haben ) und Abflüsse
(Soll )
Bilanzen = Gegenüberstellung von Aufkommen und Verwendung ökon. Größen nach Umfang und Zusammensetzung
- stofflich in Naturalform
- monetär, in Geldform
Graphische Darstellung ( Diagramm ) zur Ergänzung der tabellarischen Darstellung ( Tabelleninhalt in anschaulicher Form )
Geometrische Darstellung ( Verwendung geometrischer Formen )
- Punkte in Streudiagramm ( Scatterplot ) zur Darstellung der Beziehung
- Striche Liniendiagramm für Niveau, Entwicklung
- Säulendiagramm, Flächendiagramm für Niveau, Struktur, Entwicklung
- versch. Spezielle Symbole ( Bilddiagramm )
- Kartogramm = geometrische Darstellung in Verbindung mit geographischer Karte
Sonderformen ( Aufspaltung des Säulendiagramms )
- Flußbild = graphische Darstellung der Bilanz ( Stoff-, Energieflußbild, Finanzierung )
- Bevölkerungpyramide =m Graphische Darstellung der Bevölkerung eines Landes nach Geschlecht und Lebensalter
- gibt allgemeinen Eindruck vom Zustand und Entwicklung der Bevölkerung in Altersstruktur
- Einschnürungen
geschichtliche Einflüsse
- Sockel
Hinweis auf zukünftige Bevölkerung
- Form Zahl der Geborenen
Pyramide jährlich zunehmend
Glocke annähernd konstant
Urne jährlich abnehmend
Kurvendarstellung
- Häufigkeitskurve ( -diagramm )
Ordinate: Merkmal
Abszisse: Merkmal
Aussage: Häufigkeit des Auftretens der Merkmalswerte
- Entwicklungskurve ( -diagramm )
Ordinate: Merkmal
Abszisse: Zeit
Aussage: zeitliche Veränderung des Merkmals
- Abhängigkeitskurve
Ordinate: Merkmal Y
Abszisse: Merkmal X
Aussage: Form und Stärke der Abhängigkeit des Merkmals Y vom Merkmal X
Analyse = Nutzung math.-stat. verfahren, des aufbereiteten Datenmaterials gemäß dem Ziel der Untersuchung
- Vergleich ( statistisch, dynamisch, Soll Ist Vergleich )
Verfahren: - Maßzahlen eindimensionaler und mehrdimensionaler empirischer Häufigkeitsverteilungen
- Regressionsmodelle
- Zeitreihenmodelle
0 comments