Bei GRIN registrieren oder einloggen

Your e-mail-address or password is wrong
Jetzt registrieren
Für neue Autoren: kostenlos, einfach und schnell
Dies wird Ihr Benutzername, bitte geben Sie eine gültige E-Mail-Adresse an

Passwort vergessen

Your e-mail-address or password is wrong

Neues Passwort anfordern
Grundbegriffe Statistik close

Bitte warten

Bitte installieren Sie den Flash Player, wenn kein E-Book erscheint.

Grundbegriffe Statistik

Skript, 1998, 8 Seiten
Autor: Daniel Strauß
Fach: Statistik

Details

Kategorie: Skript
Jahr: 1998
Seiten: 8
Sprache: Deutsch
Archivnummer: V97258
ISBN (E-Book): 978-3-638-09933-2

Dateigröße: 75 KB
Anmerkungen :
Diese Zusammenstellung dient als Überblick über Fachtermini.



Volltext (computergeneriert)

Grundbegriffe der Statistik

Notwendigkeit: 1.) Einsicht und Verständnis in die Spezifisch statistische Arbeits- und Untersuchungsweise

2.) bei konkreten Untersuchungsaufgaben - Beurteilung der Angemessenheit des Statistischen Vorgehens

- begründete, sachkundige Auswahl geeigneter

Verfahren

statistische Element: = kleinste statistische Einheit, deren Eigenschaften ( Merkmale ) erfaßt und untersucht werden sollen

Merkmalsträger

statistische Gesamtheit: = Zusammenfassung einer Anzahl statistischer Elemente, die gleichartig sind bezüglich bestimmter, genau

festgelegter (definierter ) Merkmale.

Wenige Merkmale sind festgelegt, andere sind variabel. Die variablen Merkmale bilden den Gegenstand

der statistischen Analyse.

Abgrenzung ist Ermessensentscheidung, bestimmt durch Untersuchungsziel.

Abgrenzung ausgehend von ökon.- theoretischen Überlegungen sichert Vermeidung von Fehlschlüssen aus

statistischen Ergebnissen.

Abgrenzungsprobleme : - statistische Untersuchungsmerkmale variieren von Element zu Element.

Kennzeichen stat. Arbeitsweise: - Ermittlung charakteristischer, zahlenmäßiger Informationen zur Masse aus der Variabilität der

beobachteten Untersuchungsmerkmale.

Umfang der Gesaamtheit = Anzahl der in der Gesamtheit enthaltenen Elemente ( n )

Teilgesamtheit: - Grundgesamtheiten (GG) werden geteilt, indem in der GG variabel angesetzten Merkmale zusätzlich festgelegt

werden.

Statistische Merkmale:

Differenzierung in konstante und variable Merkmale mit Definition der Gesamtheit

Variable Merkmale: = Eigenschaften der stat. Elemente, die für die stat. Analyse von Interesse sind

( Schwerpunkt der stat. Analyse)

verschiedene Arten / Typen sachlicher Merkmale, Unterscheidung bzgl. Meßniveau und damit Informationsgehalt.

1.)Klassifikatorische ( qualitative, begrifflich sachliche ) Merkmale

= Merkmalsausprägungen artmäßig, auf Nominalskala erfaßt

- zur Klassifizierung von Elementen ( Systematiken in der Wirtschaftsstatistik )

- dabei Identifikation von Klassen durch Kodierung (den begriffl. Ausprägungen werden Zahlen zugeordnet )

Beachtung: Hinter Zahlen stehen nur Begriffe, keine quantitativen Größen. Deshalb keine math.- arithmet. Operationen (Add., Subtr. )

ausführbar, auch Ungleichungen bedeutungslos.

Nominalskala ist niedrigstes Meßniveau

2.) Komparative ( ordinalskalierte ) Merkmale

- rangmaßig geordnete, intensitätsmäßig abgestufte Merkmalsausprägungen

- Rangzahlen

- Darstellung auf Ordinalskala

- Zwischen Zahlen - Ordnungsbeziehungen

- wegen Ordnungsbeziehung Ungleichungen definierbar ( 1 besser als 3 )

- aber : Intervalle ( Abstände der Elemente auf Ordinalskala nicht einschätzbar ) ungleich wie auf Nominalskala auch auf

Ordinalskala keine arithm. Operationen ausführbar

3.) metrische ( quantitative, zahlenmäßige ) Merkmale

- Merkmalsausprägung gemessen oder gezählt

- Kardinalskala: Intervallskala und Verhältnisskala ( hier stetig variierende Merkmale )

- Absolutskala ­ diskret variierende Merkmale

3.1. Intervallskala

- neben Eigenschaften der Ordnungsbeziehung auch Eigenschaft gleicher Intervalle: gleichgroße Intervalle auf der Intervallskala

repräsentieren gleichgroße Differenzen der gemessenen Merkmalswerte

- Addition und Subtraktion möglich, da Nullpunkt willkürlich

- keine Berechnung von Verhältnissen zwischen Zahlen

- Division, Multiplikation nicht erlaubt


3.2. Verhältnisskala

= - Intervallskala mit absolutem Nullpunkt

- Rangfolge, Abstand und Verhältnis zweier Merkmalswerte definiert

- Zahl 0 repräsentiert vollständige Abwesenheit der Eigenschaft

- Verhältnis zwischen zwei Zahlen auf Skala unabhängig von Einheiten der Messungen

- alle arithmetischen Operationen möglich

- am häufigsten verwendete Skala

Die Merkmale auf Intervall- und Verhältnisskala sind stetige, kontinuierliche Merkmale, die überall abzählbar, alle beliebigen Werte

annehmen können ( meßbare Variation ).

3.3. absolute Skala

- neben Rangfolge, Abstand und Verhältniswert zweier Merkmalswerte ist nat. Einheit gegeben

- Merkmale auf Absolutskala sind diskrete Mertkmale = Merkmale, die abzählbar viele Merkmalswerte bei endlichem Wertebereich

annehmen können ( ganzzahlige Variation )

Ein Merkmal läßt sich durch verschiedene Skalen ausdrüken, z.B. Temperatur

Ordinalskala Intervallsk. Verhälnissk.

Heiß °C Kelvin

warm

kühl

kalt

sehr kalt

Problem der Wahl einer geeigneten Skala in der praktischen Arbeit

Grundsatz: möglichst höherwertige Skala verwenden ( höchste Wertigkeit, Genauigkeit ­ metrische Skalen )

Verschiedene Gründe für die Verwendung geringwertiger Skalen ( Meßgeräteverfügbarkeit, Geheimhaltung, Aufwand )

Außerdem bestimmte Anforderungen zgl. Skalentyp ausgehend von zu verwendender Methode

Praktisch oft die Notwendigkeit der Transformation einer Skala in eine andere ( Umwandlung höherwertiger Skalen in

geringwertigere kein Problem, umgekehrt ja

Eindimensionale Nominalskala oft nur durch mehrdimensionale metrische Skalen zu ersetzen

- ein- und mehrdimensionale Merkmale

- k-dimensionales Merkmal ist die Kombination der Merkmalsvariationen von k Merkmalen der Elemente eine Gesamtheit

k=2 ... Wertepaare , k=3 ... Wertetripel

( notwendig für Kausalforschung )

Anstelle des Merkmalsbegriffs in der Statistik auch Variable

Insbesonders in der induktiven Statistik ­ Arbeitmit Zufallsvariablen X,Y,Z, deren Realisation stetige und diskrete Verteilungen sind

Verhältnisgrößen

= Originalgrößen in sinnvoller Beziehung, Quotienten

3 Arten sind in der Ökonomie von Bedeutung: Gliederungszahlen, Beziehungszahlen, Meßzahlen

Gliederungszahl ( Quote, Anteilszahl )

= Quotient aus dem Umfang eine statistischen Teilmasse zum Umfang der Gesamtmasse ( 100 % prozentuale Interpretation )

- Vergleich der Gliederungszahl versch. Zeitpunkte / Zeitintervalle nur im Zusammenhang mit den absoluten Werten zulässig

Beziehungszahl bi ( Dichtezahl )

= Verhältnis der Werte zweier verschiedenartiger, in sachlich sinnvoller Beziehung stehender Merkmale für ein Element bi = xi

yi

Die Beziehungszahl ist umso aussagefähiger, je stärker der sachlogische Zusammenhang der verwendeten Größen ist.


Meßzahl m: im engeren Sinne für den zeitl. Vergleich

= Quotient zweier Merkmalswerte für zwei Zeitpunkte / Zeitintervalle

yt Zeitreihe ; y1, y2,...,yT ; mT = yt+1

yt

im weiteren Sinne für den räumlichen Vergleich

= Quotient zweier Merkmalswerte für zwei verschiedene Territorien zum selben Zeitpunkt / Zeitintervall

statistische Reihe = Ordnung der Merkmalswerte nach dem zeitliche, örtlichen oder sachlichen Merkmal

Zeitreihe = dynamische Reihe = Ordnung der Merkmalswerte nach der Zeit

- Bestandsgrößen als Zeitpunktreihen erfaßt

- Bewegungsgrößen als Zeitintervallreihen erfaßt

Zeitreihenanalyse = Erarbeitung von Aussagen zur zeitl. Entwicklung von ökon. Größen mit Ziel der Vorausschau

Eindimensionale Verfahren = Analyse und Prognose des Merkmals in Abhängigkeit von der Zeit, durch Modellierung der

vorhandenensystematischen Komponenten

Mehrdimensionale Verfahren = Analyse und Prognose mehrerer Zeutreihen auf der Grundlage ökon.-theoreth. Und anderen

Hypothesen zum Zusammenhang der Merkmale Regressionsmodelle und ökonometrische Modelle

Zeitbezug: Stunde, Tag, Dekade, Manat, Quartal, Jahr, mehrere Jahre

Querschnittsreihen = statistische Reihen

Örtliche und sachliche Reihe

Örtliche Reihe spezielle örtliche Reihe in der Regionalanalyse

Regionalreihen = wirtschaftstatistische Reihen mit regional einfeschränkter Aussage

Mondialreihe = statistische Reihen zur Weltwirtschaft / Konjunkturforschung

Zeitreihe: Umsatz je Beschäftigter ( DM ) im Bergbau und im verarbeitendem Gewerbe in Sachsen

1991 Jan 3607

Februar 3254

März 3531

April 3554

Mai 3376

Juni 3604

Juli 4004

August 4045

September 4393

Oktober 4883

November 5223

Dezember 5808

1992 Januar 5977

Februar 6001

März 7216

Örtliche Reihe: Rohölförderung in der Welt, 1988

Region Mill t

Westeuropa 195,8

Afrika 246,3

Naher Osten 712,5

Nordamerika 548,0

Mittel- und Südamerika 337,1

Ferner Osten 160,8

Ostblock 778,2

3025,2

sachliche Reihen = Ordnung nach der qualitativen oder quantitativen Merkmalsausprägung

Analyse von Querschnittsreihen eindimensional mit Mittelwerten, Streuungsmaßen, Quantilen

Mehrdimensionale Verfahren zur Übersicht der Abhängigkeitsanalyse ( Korelations- und Regressionsanalyse,

Varianzanalyse, Clusteranalyse u.a.)


Sachliche Reihen: Bevölkerung nach Altersklassen, BRD 1987

Alter ( in Jahren ) Personen ( Mill )

Von ... bis unter

0 ­ 15 8,9

15 ­ 21 5,43

21 ­ 40 17,72

40 ­ 60 16,36

60 u. mehr 12,67

61,08

Erwerbstätige nach der Stellung im Beruf 1988, BRD

1000 Pers

Selbständige 2422

Mithelfende Familienangehörige 639

Beamte 2370

Angestellte 11516

Arbeiter 10419

Teilzeitbeschäftigte 3305

27366

Häufigkeitsdichtefunktion / Verteilungsfunktion

Gegeben sei stat. eine Gesamtheit von n Elementen, die bzgl. Eines Merkmals untersucht werden soll.

X , xi ; ni ... absolute Häufigkeiten ; ni 0 ; ni = n

ni = fi ... relative Häufigkeiten ; 0 fi 1 ; fi = 1

n

Häufigkeitsdichtefunktion = Zuordnung der Anzahl der Elemente ni oder der Elementenanteile fi einer gegebenen Gesamtheit zu den

auftretenden Merkmalsvariationen

Frage: Wieviele Elemente oder welcher Elementenanteil an der Gesamtheit weist einen best. Merkmalswert auf?

Häufigkeitstabelle / Häufigkeitsdiagramm

Weitere wichtige Frage: Wieviele Elemente oder welcher Elementenanteil der Gesamtheit besitzen einen Merkmalswert, der kleiner

oder gleich X ist?

Antwort: Häufigkeitssummenfunktion ( kumulierte absolute Häufigkeit ) S (X)

S(x) = ni

i mit

x

i x

empirische Verteilungsfunktion F (x)

F(x) = fi = S(x)

i mit n

x

i x

(Kumulierte relative Häufigkeit)

0 F(x) 1

2.2. Etappen der statistischen Arbeit

Vorbereitung

3 Aspekte: theoretisch, methodisch, organisatorisch

theoretischer Aspekt: = inhaltliche Bestimmung der stat. Aufgabe bzgl. Der zu untersuchenden Massenerscheinung, theoret.

Ausgangspunkt

methodischer Aspekt: Klärung wichtiger stat.-meth. Fragen bzgl. Der zu untersuchenden Merkmale

- Definition der statistischen Gesamtheit, Verwendung geeigneter Skalen

- Auswahl angemessener Verfahren der Erfassung, Darstellung, Aufbereitung und Analyse


Organisatorischer Aspekt:Planung des Ablaufes der Arbeitsetappen ( Zeit, Arbeitskräfte- und Materialbedarf, Kosten )

Erfassung = Gewinnung der Variationen der Untersuchungsmerkmale der Elemente der stat. Gesamtheit, Erhebung, Zählung,

Messung ( induktive und passive Experimente )

Befragung ( mündlich [Interview], schriftlich [Fragebogen] )

Erfassungsarten Unterscheidung nach Umfang, Häufigkeit und Herkunft

Totalerfassung ( Vollerhebung )

= Erfassung der Variationen der Untersuchungsmerkmale für sämtliche Elemente der Gesamtheit

- überwiegend bei sozioökonomischen Erscheinungen und Prozessen

- notwendig, wenn hohe Genauigkeit der Aussagen erforderlich ist

- hoher Aufwand

Teilerfassung: ( bewußte, gezielte Auswahl )

= Auswahl vorherbestimmter Elemente durch subjektive Entscheidung

- typische Auswahl: wesentliche Elemente systematischer Auswahl

( Ordnung der Elemente, Auswahl in konstantem Abstand, z.B. f=0,05 jedes 20. Element wird ausgewählt )

Zufallsauswahl

Einfache Zufallsauswahl

= jedes Element der Gesamtheit besitzt gleiche Chance, ausgewählt zu werden (Urnenmethode,

Zufallszahlengenerator)

- für homogene Gesamtheiten ( nicht zu starke Streuung bzgl. Des zu untersuchenden Merkmals )

- selten in Wirtschfts- und Sozialstatistik

geschichtete Auswahl

- inhomogene ( heterogene ) Grundgesamtheit in Teilgesamtheiten oder Schichten geteilt

- einfache Zufallsauswahl sus Schichten ( jede Schicht wird einbezogen )

- unterschiedlicher Auswahlsatz je Schicht möglich

- Ziel: günstiger Schichtungseffekt

- natürliche Schichtung durch territoriale Gesichtspunkte ( regionale Schicht )

- sachliche Schichtung ( Größenklassen, Klassifizierung )

- bessere Ergebnisse als reine Zufallsauswahl

Klumpenauswahl

- Teilung der Grundgesamtheit in Teilgesamtheit oder Klumpen

- zufällige Auswahl von Klumpen und Totaleinbezug der Elemente der Klumpen ( Zeit- und Kostenersparnis )

- Spezialfall ­ Flächenstichprobe: Klumpen sind regionale Verwaltungseinheiten

mehrstufige Stichprobenverfahren = mehrere nacheinander durchgeführte Zufallsauswahlen auf verschiedenen Ebenen

- Umfang der Teilgesamtheit fällt von Stufe auf Stufe

- Auswahl der Elemente auf der letzten Stufe

- erhöhter methodischer Aufwand

Häufigkeit der Erfassung

- zeitlicher Veränderungsgrad der Grundgesamtheit hinsichtlich der Untersuchungsmerkmale bestimmt die

Häufigkeit der Elemente

einmalige Erfassung

- geringer zeitlicher Veränderungsgrad von Massenerscheinungen

- einmaliges Auftreten ( Katastrophe )

- bei umfangreicher und komplexer Zusammensetzung der Massenerscheinung ( Aufwand )

periodisch - relativ große Abstände zwischen den Erfassungen ( mehrere Jahre )

- kleinere Abstände

permanente Erfassung

- hoher zeitlicher Veränderungsgrad

- vierteljährlich, monatlich, dekadisch, täglich, je nach Herkunft / Zweck der Erfassung

Primärerfassung = erstmalige Zählung / Messung der werte der Untersuchungsmerkmale, unmittelbar und ausschließlich für das

angestrebte statistische Ziel

Sekundärerfassung

- automatische Speicherung von Daten bei Steuerung und Regelung technologischer Prozesse


- Daten der amtlichen Statistik für Kreise / kreisfreie Städte ( jährlich bei stat. Landesämtern )

- versch. Datenbanken bei stat. Amt der EU ( Umwelt, makroökon. Daten, soziale Indikatoren, Landwirtschaft )

Aufbereitung = Verdichtung der erfaßten Daten in Tabellen, Graphiken, Einzelinformationen zu Gruppeninformationen ­ wichtige

Verfahrensschritte

1.) Prüfen des Urmaterials auf Vollständigkeit, Widerspruchsfreiheit, Glaubwürdigkeit

2.) Verschlüsselung klassifikatorischer Merkmalsprägungen: Signieren mehrstelliger Schlüsselnummern

3.) Übertragung der Informationen auf Datenträger ( Disketten )

4.) Sortieren nach Merkmalsausprägungen

- Rationalisierung der Aufbereitung auf betriebliche / überbetriebliche Ebenen durch modernen Datenbankbetrieb

- Arbeitsplatzrechner und Workstations

- automatische Kontrolle der Daten auf ,, Ausreißer ,, und Erfassungsfehler

- komplexe, durchgehend rechnergestützte Datenerfassung, -aufbereitung und ­analyse in zwei Schritten erreicht:

1.) Aufbau betrieblicher Datenbanken, Prüfung, Speicherung und Verarbeitung der Informationen zu Kennziffern

und Übersichten, die über BS / Drucker verfügbar sind )

2.) Datenfernübertragung der Kennziffern der Berichterstattung an Datenbank der stat. Ämter Länder und Stat.

Bundesland

Ausbau der Hardware und Nutzung leistungsfähiger Software

Darstellung - Tabelle als Grundform der Datenübersicht

- geordnete Datenzusammenstellung

Grundsätze: - Übersichtlichkeit, Aussagefähigkeit

- Überschrift Kurzinformation zum Inhalt

- Textteil: Tabellenkopf mit Kopfzeile zum Inhalt der Spalten / Vorspalte zum Inhalt der Zeilen

Kopf

Kopf

1

2

3

4

5

Vorspalte

Summenspalte

Spalte

Summenzeile

Aufkommen wichtiger Steuern (Ausschnitt)

1980

1990

1980 1990

Mrd. DM

%

Steuereinahmen insgesamt

365

536,7 100

100

Direkte Steuern insgesamt

213,7 308,6 58,5

57,5

Darunter: Einkommens- u. Körperschaftssteuer 173,9 247,1 47,6

46

Vermögenssteuer

4,7

6,0

1,3

1,1

Gewerbesteuer

27,1

38,5

7,4

7,2

Indirekte Steuern

151,3 228,1 41,5

42,5

Insgesamt Davon Erzeugnisse des

Grundstoff- und Investgüter

Verbrauchsgüter

Nahrungs- und

Prod.-

gewerbe

gewerbe

Genußmittelgewerbe

gütergewerbe

1985 100

100

100

100

100

1986 97,6

89,1

102,1

101

99,1

1987 97,2

86,3

103,8

101,9

96,8

1988 98,8

87,9

105,5

103,8

98

1989 102,2

93,4

107,8

106,5

100,4

Aufgliederung = Angabe aller möglichen Unterteilungen mit ,, davon ,,

Zahlenteil: - Matrix aus Zeilen und Spalten mit Tabellenfeldern oder Tabellenfächern, kein Feld darf leerbleiben

- Konvention zu Sonderzeichen

- Summenzeile, Summenspalte


- Anmerkungen zur Definition und Abgrenzung in Fußnoten

Arten von Tabellen

- Arbeitstabellen ( Häufigkeitstabellen )

- Ergebnistabellen, Spezialtabellen

Sonderformen: Konten = Erfassung der Bewegung eines ökon. Prozesses durch Zuflüsse ( Haben ) und Abflüsse

(Soll )

Bilanzen = Gegenüberstellung von Aufkommen und Verwendung ökon. Größen nach Umfang und Zusammensetzung

- stofflich in Naturalform

- monetär, in Geldform

Graphische Darstellung ( Diagramm ) ­ zur Ergänzung der tabellarischen Darstellung ( Tabelleninhalt in anschaulicher Form )

Geometrische Darstellung ( Verwendung geometrischer Formen )

- Punkte in Streudiagramm ( Scatterplot ) zur Darstellung der Beziehung

- Striche ­ Liniendiagramm für Niveau, Entwicklung

- Säulendiagramm, Flächendiagramm für Niveau, Struktur, Entwicklung

- versch. Spezielle Symbole ( Bilddiagramm )

- Kartogramm = geometrische Darstellung in Verbindung mit geographischer Karte

Sonderformen ( Aufspaltung des Säulendiagramms )

- Flußbild = graphische Darstellung der Bilanz ( Stoff-, Energieflußbild, Finanzierung )

- Bevölkerungpyramide =m Graphische Darstellung der Bevölkerung eines Landes nach Geschlecht und Lebensalter

- gibt allgemeinen Eindruck vom Zustand und Entwicklung der Bevölkerung in Altersstruktur

- Einschnürungen geschichtliche Einflüsse

- Sockel Hinweis auf zukünftige Bevölkerung

- Form Zahl der Geborenen

Pyramide jährlich zunehmend

Glocke annähernd konstant

Urne jährlich abnehmend

Kurvendarstellung

- Häufigkeitskurve ( -diagramm )

Ordinate: Merkmal

Abszisse: Merkmal

Aussage: Häufigkeit des Auftretens der Merkmalswerte

- Entwicklungskurve ( -diagramm )

Ordinate: Merkmal

Abszisse: Zeit

Aussage: zeitliche Veränderung des Merkmals

- Abhängigkeitskurve

Ordinate: Merkmal Y

Abszisse: Merkmal X

Aussage: Form und Stärke der Abhängigkeit des Merkmals Y vom Merkmal X

Analyse = Nutzung math.-stat. verfahren, des aufbereiteten Datenmaterials gemäß dem Ziel der Untersuchung

- Vergleich ( statistisch, dynamisch, Soll ­ Ist ­ Vergleich )

Verfahren: - Maßzahlen eindimensionaler und mehrdimensionaler empirischer Häufigkeitsverteilungen

- Regressionsmodelle

- Zeitreihenmodelle



Kommentare

Bisher keine Kommentare

Kommentar hinzufügen
Ihr Kommentar wird redaktionell geprüft und dann freigeschaltet

Andere Nutzer haben sich auch für folgende Titel interessiert:


Dieser Text kann über folgende URL aufgerufen und zitiert werden:

http://www.grin.com/e-book/97258/grundbegriffe-statistik
please wait Bitte warten