Die vorliegende Arbeit beschäftigt sich mit Determinanten der Fertilität anhand des zugrunde liegenden Datensatzes „swiss2.dta“. Dieser enthält sozio-ökonomische Indikatoren für 47 Regionen in der Schweiz aus dem Jahr 1888. Die abhängige Variable „Fertility“ steht für ein standardisiertes Fertilitätsmaß der Region i. Da der Datensatz in einem zeitlichen Querschnitt erfasst wurde, handelt es sich um eine Untersuchung der Periodenfertilität des Jahres 1888 in unterschiedlichen Regionen i. Das standardisierte Fertilitätsmaß setzt sich aus der abgeschlossenen Kinderanzahl des Geburtenjahrgangs 1888 und der Einwohneranzahl der beobachteten Region i zusammen. Aufgrund dessen kann es bei der Datenerhebung der abhängigen Variable „Fertility“ zu Angaben mit und ohne Bruchanteilen kommen. Die Fertilität ist ein wichtiger Indikator für demografische Betrachtungen. Daher berücksichtigt der Datensatz, um über die Fertilität genaue Aussagen treffen zu können, die Variable „InfMortality“. Diese beschreibt die relative Säuglingssterblichkeit der beobachteten Regionen. Zudem werden die möglichen Einflussvariablen „Agriculture“, „Education“, und „Catholic“ betrachtet. Die Hausarbeit soll untersuchen, inwiefern sich diese drei Determinanten auf das standardisierte Fertilitätsmaß einer Region i auswirken. Um einen deskriptiven Überblick zu erhalten, sind im Anhang in Tabelle 1 aussagekräftige deskriptive Verteilungsmaße dargestellt.
Inhaltsverzeichnis
1. Einleitung (Aufgabe 1)
2. Multivariate Modellschätzung unter Log-Log Spezifikation (Aufgabe 2)
3. Lineare multivariate Analyse (Aufgabe 3)
4. Grafische Überprüfung auf Heteroskedastie (Aufgabe 4)
a. Grafische Analyse multivariates logarithmiertes Modell
b. Grafische Analyse lineares multivariates Modell
5. Breusch-Pagan Test und White Test bei Lin-Lin-Spezifikation (Aufgabe 5)
6. Breusch-Pagan Test und White Test bei Log-Log-Spezifikation (Aufgabe 5)
7. Zusammenfassung (Aufgabe 6)
Zielsetzung & Themen
Die Arbeit untersucht die sozio-ökonomischen Determinanten der Fertilität in der Schweiz im Jahr 1888 anhand eines Datensatzes mit 47 Regionen, um statistisch signifikante Einflussfaktoren zu identifizieren und die Modellgüte verschiedener Spezifikationen zu prüfen.
- Analyse des Einflusses von Agrarwirtschaft, Bildung und Konfession auf die Fertilität.
- Vergleich zwischen Log-Log- und Lin-Lin-Regressionsmodellen.
- Überprüfung der Gauß-Markow-Annahmen, insbesondere hinsichtlich Heteroskedastie.
- Durchführung und Interpretation von Breusch-Pagan- und White-Tests.
- Deskriptive Datenanalyse der vorliegenden sozio-ökonomischen Indikatoren.
Auszug aus dem Buch
1. Einleitung (Aufgabe 1)
Die vorliegende Arbeit beschäftigt sich mit Determinanten der Fertilität anhand des zugrunde liegenden Datensatzes „swiss2.dta“. Dieser enthält sozio-ökonomische Indikatoren für 47 Regionen in der Schweiz aus dem Jahr 1888. Die abhängige Variable „Fertility“ steht für ein standardisiertes Fertilitätsmaß der Region i. Da der Datensatz in einem zeitlichen Querschnitt erfasst wurde, handelt es sich um eine Untersuchung der Periodenfertilität des Jahres 1888 in unterschiedlichen Regionen i. Das standardisierte Fertilitätsmaß setzt sich aus der abgeschlossenen Kinderanzahl des Geburtenjahrgangs 1888 und der Einwohneranzahl der beobachteten Region i zusammen. Aufgrund dessen kann es bei der Datenerhebung der abhängigen Variable „Fertility“ zu Angaben mit und ohne Bruchanteilen kommen. Die Fertilität ist ein wichtiger Indikator für demografische Betrachtungen. Daher berücksichtigt der Datensatz, um über die Fertilität genaue Aussagen treffen zu können, die Variable „InfMortality“. Diese beschreibt die relative Säuglingssterblichkeit der beobachteten Regionen. Zudem werden die möglichen Einflussvariablen „Agriculture“, „Education“, und „Catholic“ betrachtet. Die Hausarbeit soll untersuchen, inwiefern sich diese drei Determinanten auf das standardisierte Fertilitätsmaß einer Region i auswirken. Um einen deskriptiven Überblick zu erhalten, sind im Anhang in Tabelle 1 aussagekräftige deskriptive Verteilungsmaße dargestellt.
Zusammenfassung der Kapitel
1. Einleitung (Aufgabe 1): Vorstellung der Datengrundlage und der untersuchten Variablen zur Analyse der Fertilität im Jahr 1888.
2. Multivariate Modellschätzung unter Log-Log Spezifikation (Aufgabe 2): Durchführung einer Regressionsanalyse unter Verwendung von Log-Log-Spezifikationen zur Ermittlung von Elastizitäten.
3. Lineare multivariate Analyse (Aufgabe 3): Gegenüberstellung der Ergebnisse durch eine lineare Regressionsanalyse und Vergleich der statistischen Signifikanz der Einflussfaktoren.
4. Grafische Überprüfung auf Heteroskedastie (Aufgabe 4): Visuelle Analyse der Residuen zur Identifizierung potenzieller Heteroskedastie-Probleme in den verschiedenen Modellen.
5. Breusch-Pagan Test und White Test bei Lin-Lin-Spezifikation (Aufgabe 5): Statistische Überprüfung der Homoskedastie-Annahme für das lineare Modell.
6. Breusch-Pagan Test und White Test bei Log-Log-Spezifikation (Aufgabe 5): Statistische Überprüfung der Homoskedastie-Annahme für das logarithmierte Modell, mit Nachweis einer Verletzung der Gauß-Markow-Annahmen.
7. Zusammenfassung (Aufgabe 6): Fazit der Untersuchung mit der Empfehlung für das lineare Modell aufgrund der gegebenen Homoskedastie.
Schlüsselwörter
Fertilität, Regressionsanalyse, Schweiz 1888, Log-Log-Spezifikation, Lin-Lin-Spezifikation, Heteroskedastie, Breusch-Pagan-Test, White-Test, Gauß-Markow-Annahmen, BLUE, sozio-ökonomische Indikatoren, Datensatz swiss2.dta, Säuglingssterblichkeit, Agrarwirtschaft, Modellgüte.
Häufig gestellte Fragen
Worum geht es in der vorliegenden Arbeit grundsätzlich?
Die Arbeit analysiert sozio-ökonomische Determinanten, die das Fertilitätsmaß in Schweizer Regionen im Jahr 1888 beeinflusst haben.
Welche zentralen Themenfelder werden bearbeitet?
Im Zentrum stehen die Einflüsse von Agrarwirtschaft (Agriculture), Bildungsstand (Education) und konfessioneller Zugehörigkeit (Catholic) auf die Geburtenrate.
Was ist das primäre Ziel der Untersuchung?
Ziel ist es, signifikante Einflussfaktoren zu bestimmen und die ökonometrische Modellgüte anhand von zwei verschiedenen Spezifikationen zu bewerten.
Welche wissenschaftliche Methode kommt zum Einsatz?
Es werden multivariate Regressionsanalysen (KQ-Methode) sowie diagnostische Tests auf Heteroskedastie durchgeführt.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil umfasst die Modellschätzung, die grafische Residuenauswertung und die Durchführung statistischer Tests wie den Breusch-Pagan- und den White-Test.
Welche Schlüsselbegriffe charakterisieren die Arbeit?
Die wichtigsten Begriffe sind Fertilität, Heteroskedastie, BLUE-Eigenschaften und ökonometrische Modellspezifikation.
Warum wird im Modell mit Log-Log-Spezifikation von Heteroskedastie ausgegangen?
Sowohl die grafische RVP-Analyse als auch die signifikanten Ergebnisse des Breusch-Pagan- und White-Tests deuten auf eine Verletzung der Gauß-Markow-Annahme 3 hin.
Welches Modell wird letztlich bevorzugt und warum?
Das lineare Modell (Lin-Lin) wird bevorzugt, da hier im Gegensatz zum Log-Log-Modell kein Problem mit Heteroskedastie vorliegt.
- Citar trabajo
- Simone Merkle (Autor), 2018, Statistische Analyse eines Datensatzes, Múnich, GRIN Verlag, https://www.grin.com/document/495180