Verfahren statistischer Datenanalyse. Eine Fallaufgabe


Ausarbeitung, 2014

12 Seiten, Note: 1,0


Leseprobe

Inhaltsverzeichnis

Inhaltsverzeichnis

Abkürzungsverzeichnis

Formel- und Tabellenverzeichnis

1 Patienten aus dem schizophrenen Formenkreis: Vergleich von Modell- und Kontrollregion
1.1 Erkrankungsdauer der Patienten der Kontrollgruppe: Mittelwert, Varianz und Standardabweichung
1.2 Vergleich der Erkrankungsdauern in der Interventionsgruppe und der Kontrollgruppe
1.3 Testzuordnung und Interpretation der Tabelle
1.4 Berechnung des Standardfehlers der Differenz
1.5 Berechnung von Kovarianz und Pearson-Korrelationskoeffizient für die Patienten in der Modellregion
1.6 Interpretation von Kovarianz und Korrelationskoeffizienten
1.7 Alternativer Korrelationskoeffizient

2 Analyse von Veränderungen in der Gruppe der Modellregion Integrierte Versorgung
2.1 McNemar - Statistik
2.2 Vergleich zwischen Modellregion und Kontrollregion

3 Auswahl von Testverfahren
3.1 Zusammenhang Geschlecht und Krankenhausaufenthalt
3.2 Signifikanz von Veränderungen der Krankenhaustage bei Messwerten ohne Normalverteilung

Literaturverzeichnis

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Formel- und Tabellenverzeichnis

Formel 1: Mittelwert

Formel 2: Varianz

Formel 3: Standardabweichung

Formel 4: t-Wert

Formel 5: Freiheitsgrade

Formel 6: Standardfehler der Differenz

Formel 7: Kovarianz

Formel 8: Pearson-Korrelationskoeffizient

Formel 9: McNemar-Statistik

Formel 10: Chi-Quadrat-Test im Beispiel

Tabelle 1: Vergleich zwischen Modell- und Kontrollregion

1 Patienten aus dem schizophrenen Formenkreis: Vergleich von Modell- und Kontrollregion

1.1 Erkrankungsdauer der Patienten der Kontrollgruppe: Mittelwert, Varianz und Standardabweichung

Der Mittelwert (arithmetisches Mittel, Erwartungswert) ist ein Maß der mittleren Tendenz. Dieser errechnet sich als Summe der einzelnen Beobachtungswerte (xi) dividiert durch die Summe der Fälle n [vgl. Meyer 2011, S. 18]. Die nachfolgende Formel 1 zeigt die Berechnung an.

Abbildung in dieser Leseprobe nicht enthalten

Formel 1: Mittelwert

In der Kontrollgruppe ergibt sich für die Erkrankungsdauer der Kontrollgruppe der Mittelwert:

Abbildung in dieser Leseprobe nicht enthalten

Bei der Varianz handelt es sich um ein Streuungsmaß eines Merkmals, das als mittlere quadratische Abweichung vom Erwartungswert nach der berechnet wird. Es ergeben sich aufgrund der Bildung von Quadraten stets positive Werte für die Varianz [vgl. Meyer 2011, S. 18].

Formel 2: Varianz

Im Beispiel errechnet sich die Varianz der Erkrankungsdauer wie folg (verkürzte Darstellung):

Abbildung in dieser Leseprobe nicht enthalten

Die Standardabweichung ist ebenfalls ein Streuungsmaß, welche eine Aussage über die Abweichung der einzelnen Messwerte bezogen auf den Mittelwert macht. Sie ergibt sich als Quadratwurzel aus der Varianz [vgl. Bühner 2004, S. 26]. Im Beispiel ist die Standardabweichung:

Abbildung in dieser Leseprobe nicht enthalten

Formel 3: Standardabweichung

In den verwendeten Formeln bedeutet xi ein Einzelmesswert, n meint die Anzahl aller Messwerte (Stichprobenumfang), Mx ist der Mittelwert, Vx ist die Varianz und Sx ist die Standardabweichung.

1.2 Vergleich der Erkrankungsdauern in der Interventionsgruppe und der Kontrollgruppe

Bei der Betrachtung und Analyse von statistischen Daten muss deren Verteilung beachtet werden. Diese ist durch Mittelwert und Standardabweichung gegeben. Bei den gegebenen Daten liegt der Mittelwert der Erkrankungsdauern in der Gruppe Modellregion Integrierte Versorgung bei 15,5 Jahren bei einer Standardabweichung von 12,45 Jahren. In der Kontrollgruppe (vgl. Abschnitt 1.1) beträgt der Mittelwert 15 Jahre, die Standardabweichung liegt bei 11,55 Jahren.

Bisher unbeachtet blieb der Stichprobenumfang. In beiden Datenreihen liegt dieser bei n=10 Patienten, also bei einer sehr niedrigen Zahl. Die Zuverlässigkeit von Mittelwert und Standardabweichung korreliert mit dem Stichprobenumfang. Bei den obigen Daten wird bereits unmittelbar ersichtlich, dass eine jeweils große Streuung der Einzelmesswerte um die betreffenden Mittelwerte vorliegt. Die Vergleichbarkeit von Lage- und Streuungsmaß erscheint dennoch zufällig. Statistisch signifikante Unterschiede [vgl. Hoem 2008] auf einer üblichen Signifikanz-niveauschwelle von 5% steht nicht zu erwarten [vgl. Meyer 2012, S. 3 ff].

1.3 Testzuordnung und Interpretation der Tabelle

Bei dem aufgrund der Daten in der vorgestellten Ergebnistabelle handelt es sich um den Zwei-Stichproben-t-Test für unabhängige Stichproben („two-sample t-test“), der zu den parametrischen Testverfahren zählt. Mit diesem lässt eine Aussage dahingehend treffen, ob sich zwei Stichproben bzw. Gruppen (hier: Gruppe Modellregion Integrierte Versorgung und Kontrollgruppe) hinsichtlich ihrer empirischen gefundenen Mittelwerte systematisch unterscheiden. Voraussetzung ist eine Intervallskalierung der unter-suchten Variablen und eine unabhängige Werteausprägung zwischen den Gruppen. Außerdem ist eine Normalverteilung in den Grundgesamtheiten zu fordern [vgl. Meyer 2011, S. 40 ff; Student 1908].

Im vorliegenden Beispiel kann Unabhängigkeit der beiden Gruppen angenommen und Normalverteilung hinsichtlich der Erkrankungsdauer bei Erkrankungen des schizophrenen Formenkreises postuliert werden.

In der Tabelle ist zunächst der t-Wert mit t = 0,093 aufgeführt. Unter diesem versteht man die standardisierten Differenzen der Stichprobenmittelwerte, der sich folgendermaßen errechnet:

Abbildung in dieser Leseprobe nicht enthalten

Formel 4: t-Wert

Im Zähler befindet sich als Stichprobenkennwert die mittlere Differenz der beiden Gruppen, die in der Tabelle korrekterweise mit 15,5 – 15 = 0,5 angegeben ist. Im Nennen findet sich der Standardfehler (standard error) der Differenz, der im Abschnitt 1.4 berechnet wird. Das dortige Ergebnis wird hier bereits verwendet. Der t-Wert errechnet sich damit wie in der Ergebnistabelle angegeben zu:

In Spalte 2 wird mit df die Anzahl der Freiheitsgrade angegeben. Diese errechnen sich aus den Stichprobenumfängen als:

Abbildung in dieser Leseprobe nicht enthalten

Formel 5: Freiheitsgrade

Die Spalte 3 zeigt die Signifikanz (2-seitig), die gleichbedeutend dem p-Wert ist. Der angegebene p-Wert liegt bei 0,927. Dies bedeutet, dass mit einer 92,7 %-igen Wahrscheinlichkeit der Unterschied von 0,5 Jahren zwischen den Mittelwerten der Erkrankungsdauern zwischen der Modellregion- und der Kontrollgruppe als zufällig angesehen werden kann. Vor dem Hintergrund der Kenntnis der kleinen Stichproben und der großen Streuungen ist dies absolut nachvollziehbar. Eine Signifikanz-niveauschwelle von 5% wird definitiv nicht eingehalten, so dass nicht von einem statistisch signifikanten Ergebnis ausgegangen werden kann. Umgekehrt kann logisch gefolgert werden, dass die Ähnlichkeit der Mittelwerte in den beiden Gruppen mit hoher Wahrscheinlichkeit zufällig entstanden ist und bei größeren Stichprobenumfängen durchaus Abweichungen in beiden Gruppen apparent werden könnten.

1.4 Berechnung des Standardfehlers der Differenz

Der Standardfehler (se=standard error) der Differenz kann mithilfe der nachfolgenden Formel [vgl. Meyer 2011, S. 42, Formel 3.2] unter Einsetzung der vorgegebenen bzw. in Abschnitt 1.1 errechneten Standardabweichungen aus der Gruppe Modellregion und der Kontrollgruppe des Fallbeispiels errechnet werden:

Abbildung in dieser Leseprobe nicht enthalten

Formel 6: Standardfehler der Differenz

Das Ergebnis für den Standardwert der Differenz ( ) wird in Abschnitt 1.3 zur Errechnung des t-Wertes weiter verwendet.

1.5 Berechnung von Kovarianz und Pearson-Korrelationskoeffizient für die Patienten in der Modellregion

Unter Berücksichtigung der einschränkenden Annahmen der Aufgabenstellung (Intervallskalierung und Normalverteilung) lassen sich die Kovarianz (Kov) und Pearson-Korrelationskoeffizient (r) errechnen. Die Kovarianz stellt dabei ein Maß für den Zusammenhang zwischen zwei intervallskalierten und normalverteilten Variablen dar. Diese sind in der Gruppe Modellregion Integrierte Versorgung die Erkrankungsdauer (x) sowie der Anzahl der Krankenhausaufenthalte (letzte 12 Monate).

Abbildung in dieser Leseprobe nicht enthalten

Formel 7: Kovarianz

Im Fallbeispiel errechnet sich die Kovarianz zu einem Wert von -21,22 nach folgender Berechnung:

Abbildung in dieser Leseprobe nicht enthalten

Eine Standardisierung hinsichtlich der Skalierung erfolgt bei der Berechnung des Pearson-Korrelationskoeffizienten. Hierbei werden die Standardabweichungen der Variablen einbezogen [vgl. Meyer 2011, S. 22]:

Abbildung in dieser Leseprobe nicht enthalten

Formel 8: Pearson-Korrelationskoeffizient

1.6 Interpretation von Kovarianz und Korrelationskoeffizienten

In Abschnitt 1.5 wird für die Kovarianz ein negativer Wert errechnet. Hieraus kann auf einen negativen Zusammenhang zwischen Erkrankungsdauer und Krankenhaus-aufenthalten für die betrachtete Gruppe geschlossen werden. Über das Ausmaß der Korrelation sagt der Wert der Kovarianz zunächst nichts aus.

Mit dem Korrelationskoeffizienten wird eine Standardisierung vorgenommen. Dieser kann Werte Intervall -1 bis +1 annehmen. Ein Wert von 0 besagt, dass keine Korrelation zwischen den Variablen besteht. Bei r=-1 besteht ein streng negativer Zusammenhang zwischen den Variablen, bei r=+1 ein streng positiver Zusammenhang (je größer Variable 1, desto größer Variable 2). Ein Korrelationskoeffizient um r= verweist auf einen milden Zusammenhang. Ab r= besteht ein mittlerer und ab r= 0,5 ein großer Zusammenhang der Variablen [vgl. Meyer 2011, S. 24]. Übertragen auf unser Beispiel bedeutet ein Korrelationskoeffizient von r=-0,77 einen negativen starken Zusammenhang zwischen Erkrankungsdauer in Jahren und der Anzahl der Krankenhausaufenthalte. Aufgrund des Korrelationskoeffizienten würde man zu der Auffassung gelangen, dass bei schizophrenen Störungen (in der Modellregion) lange Krankheitsdauer mit reduzierter Inanspruchnahme von Krankenhausaufenthalten korreliert ist.

1.7 Alternativer Korrelationskoeffizient

In der genannten Konstellation einer fehlenden Normalverteilung oder ungeeigneten Skalenniveaus (keine Intervallskala oder Ordinalskala) bei mindestens einer Variablen kann alternativ der sogenannte Spearman-Korrelationskoeffizient errechnet werden [vgl. Meyer 2011, S. 25].

[...]

Ende der Leseprobe aus 12 Seiten

Details

Titel
Verfahren statistischer Datenanalyse. Eine Fallaufgabe
Hochschule
APOLLON Hochschule der Gesundheitswirtschaft in Bremen
Veranstaltung
Modul Verfahren statistischer Datenanalyse
Note
1,0
Autor
Jahr
2014
Seiten
12
Katalognummer
V497191
ISBN (eBook)
9783346048301
ISBN (Buch)
9783346048318
Sprache
Deutsch
Schlagworte
verfahren, datenanalyse, eine, fallaufgabe
Arbeit zitieren
Manuel Anhold (Autor), 2014, Verfahren statistischer Datenanalyse. Eine Fallaufgabe, München, GRIN Verlag, https://www.grin.com/document/497191

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Verfahren statistischer Datenanalyse. Eine Fallaufgabe



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden