In dieser Arbeit wird die einfache lineare Regression zur Merkmalsvorhersage bearbeitet. Hierfür wir der Inhalt in drei Kapitel aufgeteilt. Das erste Kapitel beschäftigt sich mit der Regressionsanalyse, das zweite mit der statistischen Absicherung und zum Schluss werden nicht-lineare Zusammenhänge geklärt.

Excerpt

Inhaltsverzeichnis

A. Einleitung

B. Regressionsanalyse

1. Deterministische und stochastische Beziehungen

2. Regressionsgerade

3. Interpretation und Regressionskoeffizienten

4. Residuen

5. Standartschätzfehler

6. Determinationskoeffizient

C. Statistische Absicherung

1. Modell der linearen Regression

2. Signifikanztest für β

3. Konfidenzintervall für β

4. Konfidenzintervall für den Erwartungswert

5. Residuenanalyse

D. Nicht-lineare Zusammenhänge

1. Polynomiale Regression

2. Linearisierende Transformation

Zielsetzung und thematische Schwerpunkte

Die vorliegende Arbeit befasst sich mit der methodischen Anwendung der einfachen linearen Regression zur Merkmalsvorhersage. Ziel ist es, die theoretischen Grundlagen der Regressionsanalyse, die statistische Absicherung der Ergebnisse sowie den Umgang mit nicht-linearen Zusammenhängen wissenschaftlich darzulegen und anhand von Beispielen zu veranschaulichen.

Grundlagen der Regressionsanalyse und Abgrenzung deterministischer von stochastischen Modellen.
Berechnung und Interpretation von Regressionsgeraden sowie Regressionskoeffizienten.
Methoden der statistischen Absicherung mittels Signifikanztests und Konfidenzintervallen.
Analyse von Residuen zur Überprüfung von Modellvoraussetzungen.
Strategien zur Behandlung nicht-linearer Zusammenhänge durch Transformation oder polynomiale Ansätze.

Auszug aus dem Buch

1. Deterministische und stochastische Beziehungen

Deterministische Modelle sind Entscheidungsmodelle, d.h. es sind Modelle, in denen Beziehungen eindeutig bestimmt sind. Es existieren im Gegensatz zum stochastischen Modell keine Zufallsvariablen und dadurch auch keine wahrscheinlichkeitstheoretischen Bezüge. Alle Informationen, die dem Modell zugrunde liegen sind mit Sicherheit bekannt, d.h. sie sind deterministisch.

Deterministische Prädiktoren kommen nur in bestimmten Ausprägungen vor, z.B. „unterschiedliche Dosierung eines Medikaments, systematisch variierte Bedingungen in psychologischen Lernexperimenten etc.“ . Ein stochastisches Modell liegt vor, wenn verschiedene Wahlmöglichkeiten zur Entscheidung stehen und diese Wahlmöglichkeiten verschiedene Konsequenzen haben. Es lassen sich zahlenmäßige Angaben über die Wahrscheinlichkeit der Konsequenzen machen. Im Gegensatz zum deterministischen Modell enthält das stochastische Modell ein oder mehrere Zufallsvariablen und somit auch wahrscheinlichkeitstheoretische Bezüge. Ein Beispiel für stochastische Prädiktoren wäre z.B. Leistungen im Schulreifetest. „Stochastische Prädiktoren sind […] Variablen, die zusammen mit der Kriteriumsvariablen an einer Zufallsstichprobe von Individuen erhoben werden, sodass jedem Individuum ein Messwertpaar als Realisierung der gemessenen Zufallsvariablen zugeordnet werden kann.“

Es seien die Leistungen von Versuchspersonen in zwei äquivalenten Tests x und y durch die Beziehung y = 1,5x + 20 miteinander verbunden. Anhand dieser Gleichungen lassen sich Vorhersagen machen. Eine Person mit einer Leistung von x = 30 erzielt im Test y den Wert y = 1,5 · 30 + 20 = 65. Alle x-Werte müssen für eine Transformation zunächst mit dem Steigungsfaktor 1,5 multipliziert werden. Daraus lässt sich schließen, dass die y-Werte eine geringere Streuung als x-Werte aufweisen. Bei der Umrechnung von x-Werten in y-Werte schreibt die additive Konstante von 20 vor, dass zusätzlich zu jedem Wert 20 Testpunkte hinzuaddiert werden müssen. Dabei ist egal, welche Leistung die Versuchsperson im Test x erzielt hat. Das könnte bedeuten, dass Test y leichter ist als Test x, weil Personen, die im Test x 0 Punkte erzielt haben, in Test y immerhin noch 20 Punkte hinzuaddiert bekommen haben. Eine Gerade ist z.B. durch zwei Punkte eindeutig festgelegt. Wenn zwei Punkte der Geraden bekannt sind, kennt man die Koordinaten aller Punkte der Geraden.

Zusammenfassung der Kapitel

A. Einleitung: Diese Einleitung definiert den Begriff der Regression als Bindeglied zwischen diskreten Messwerten und stetigen Funktionen und beschreibt das Ziel der Merkmalsvorhersage.

B. Regressionsanalyse: Dieses Kapitel erläutert die Berechnung der Regressionsgeraden mittels der Methode der kleinsten Quadrate sowie die Interpretation von Steigung und y-Achsenabschnitt.

C. Statistische Absicherung: Hier werden die Voraussetzungen des linearen Regressionsmodells sowie Verfahren zur statistischen Absicherung, wie Signifikanztests und Konfidenzintervalle, thematisiert.

D. Nicht-lineare Zusammenhänge: Dieses Kapitel behandelt Ansätze zur Modellierung nicht-linearer Kurvenverläufe durch polynomiale Regression oder durch linearisierende Transformationen.

Schlüsselwörter

Einfache lineare Regression, Merkmalsvorhersage, Regressionsgerade, Regressionskoeffizienten, Residuenanalyse, Determinationskoeffizient, Methode der kleinsten Quadrate, Signifikanztest, Konfidenzintervall, Stochastik, Prädiktorvariable, Kriteriumsvariable, Normalverteilung, Variabilität, Modellannahmen

Häufig gestellte Fragen

Worum geht es in der vorliegenden Arbeit grundsätzlich?

Die Hausarbeit befasst sich mit der mathematischen und statistischen Methode der einfachen linearen Regression, um Kriteriumsvariablen durch Prädiktorvariablen vorherzusagen.

Was sind die zentralen Themenfelder der Arbeit?

Die Schwerpunkte liegen auf der Berechnung von Regressionsgeraden, der statistischen Absicherung von Modellen sowie der Erweiterung auf nicht-lineare Zusammenhänge.

Was ist das primäre Ziel der Untersuchung?

Das Ziel ist die Vermittlung eines fundierten Verständnisses dafür, wie man durch Regressionsgleichungen Vorhersagen über Merkmalsausprägungen trifft und wie diese Ergebnisse statistisch abgesichert werden.

Welche wissenschaftliche Methode kommt primär zur Anwendung?

Es wird primär die Methode der kleinsten Quadrate zur Ermittlung der optimalen Regressionsgeraden verwendet.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil gliedert sich in die Regressionsanalyse, die statistische Absicherung mittels Inferenzstatistik sowie die Behandlung von nicht-linearen Kurvenverläufen.

Welche Schlüsselbegriffe charakterisieren die Arbeit?

Wichtige Begriffe sind Regressionsgerade, Residuum, Determinationskoeffizient, Prädiktorvariable, statistische Signifikanz und Standardfehler.

Warum ist die Residuenanalyse für die Qualität der Vorhersage wichtig?

Die Residuenanalyse ermöglicht es, zu prüfen, ob die Modellvoraussetzungen wie Normalverteilung erfüllt sind und liefert Informationen über Merkmale, die durch das Prädiktormodell nicht abgedeckt werden.

Was unterscheidet ein deterministisches von einem stochastischen Modell in der Regression?

In deterministischen Modellen sind die Beziehungen exakt und ohne Zufallsvariablen definiert, während stochastische Modelle Zufallseinflüsse berücksichtigen und probabilistische Bezüge herstellen.

Wann ist eine linearisierende Transformation sinnvoll?

Eine Transformation ist dann sinnvoll, wenn kein linearer, sondern beispielsweise ein exponentieller Zusammenhang vorliegt, der sich durch Logarithmierung in eine lineare Form überführen lässt.

Excerpt out of 18 pages - scroll top

Details

Title: Die einfache lineare Regression zur Merkmalsvorhersage
College: Friedrich-Alexander University Erlangen-Nuremberg (Pädagogik)
Course: Quantitative Forschungsmethoden
Grade: 1,3
Author: Isabella Schmid (Author)
Publication Year: 2017
Pages: 18
Catalog Number: V375003
ISBN (eBook): 9783668549807
ISBN (Book): 9783668549814
Language: German
Tags: Regression Forchungsmethode Methodenlehre quantitativ Regressionsanalyse
Product Safety: GRIN Publishing GmbH

Quote paper: Isabella Schmid (Author), 2017, Die einfache lineare Regression zur Merkmalsvorhersage, Munich, GRIN Verlag, https://www.grin.com/document/375003

Die einfache lineare Regression zur Merkmalsvorhersage