Kohler, Steffen: Nichtparametrische Dichteschätzung
1. Einleitung
1.1 Inhalt und Struktur dieser Arbeit
Diese Arbeit hat zum Ziel einem Leser mit Grundkenntnissen der Statistik einen Überblick über die wichtigsten Methoden der nichtparametrischen Dichteschätzung zu geben. Es werden verschiedene Glättungsverfahren für die Schätzung von Dichtefunktionen erläutert. Dabei wird vor allem auf eine klare, übersichtliche und verständnisfördernde Darstellung Wert gelegt. Es wird versucht die Verwendung von mathematischen Formeln auf das Nötigste zu begrenzen. Der Schwerpunkt dieser Arbeit liegt auf Histogrammschätzern und Kerndichteschätzern und die damit verbundene Problematik der Bandbreitenwahl. Andere Verfahren der Dichteschätzung sowie Anwendungen werden nur am Rande behandelt. Es wird nicht auf die Dichteschätzung im mehrdimensionalen Bereich eingegangen.
In der Einleitung wird zuerst eine Abgrenzung von parametrischen und nichtparametrischen Methoden in der Statistik vorgenommen und deren Vor- und Nachteile diskutiert. Dann wird auf die Bedeutung der nichtparametrischen Dichteschätzung im Speziellen eingegangen. Im zweiten Kapitel wird das Histogramm als einfachste Form der Dichteschätzung behandelt. Es wird die Herleitung und Konstruktion des Histogramms beschrieben sowie der Einfluss der zwei Parameter Ursprung und Klassenbreite erläutert. Anschließend wird über eine Erweiterung des Histogramms zu den Kerndichteschätzern im dritten Kapitel übergeleitet. Dieses befasst sich neben der Konstruktion von Kerndichteschätzern mit den Einflüssen der Kernfunktion sowie der Bandbreite. Das Hauptaugenmerk wird dann auf die Wahl der Bandbreite gelegt. Dazu werden geeignete Optimalitätskriterien diskutiert und im Anschluss gängige Verfahren der Bandbreitenwahl erläutert. Es wird auch noch kurz auf Kerndichteschätzer mit variabler Bandbreite eingegangen. Im vierten Kapitel werden andere Verfahren der Kerndichteschätzung angeschnitten, die aber nicht ausführlich behandelt werden. Kapitel fünf gibt noch einmal einen Überblick und Ausblick über mögliche Anwendungen der Dichteschätzung.
Kohler, Steffen: Nichtparametrische Dichteschätzung
1.2 Nichtparametrische Methoden in der Statistik
Eines der Grundprobleme der inferentiellen Statistik ist die Bestimmung der Verteilung einer gegebenen Zufallsvariable. Empirisch werden zu diesem Zweck in der Regel parametrische Modelle benutzt, in welchen die Verteilung der Zufallsvariable durch eine endlich-dimensionale Menge numerischer Parameter ausgedrückt wird. Dabei wird gefordert, dass diese Parametrisierung stetig und differenzierbar sei. Die Unterstellung einer Zufallsverteilung auf diese Weise hat den Vorteil der einfachen Berechnung und Interpretierbarkeit der Parameter. Problematisch ist allerdings, dass auch schon geringe Verletzungen der Annahme der Verteilung die Aussagekräftigkeit der Modelle einschränken können. Dies kann insbesondere bei Anwendungen zu großen Problemen führen.
Nichtparametrische Modelle hingegen treffen keine Annahmen über die Verteilungen von Daten. Sie gehen von den Daten an sich aus und lassen diese für sich selbst sprechen. Dadurch werden die Modelle flexibler und eine Misspezifikation des Modells wird vermieden. Der nichtparametrische Ansatz eignet sich deshalb auch besonders für Ökonomische Modelle, in denen Verteilungen normalerweise nicht zwingend festgelegt sind.
1.3 Die Bedeutung der nichtparametrischen Dichteschätzung
Im folgenden wird davon ausgegangen, dass eine Zufallsstichprobe X 1 , ..., X n aus einer stetigen Verteilung X gegeben sei, deren unbekannte Dichte ƒ geschätzt werden soll. Das Ziel der Dichteschätzung ist es hierbei die Struktur der Daten wie Modalität, Symmetrie oder Schiefe zu beurteilen, als Grundlage für die Formulierung von parametrischen Modellen zu dienen oder aber die Anwendung in komplexeren statistischen Verfahren wie der Regression, der Diskriminanzanalyse oder der Clusteranalyse auf die in Kapitel 5 noch kurz eingegangen wird (vgl. Thadewald, 1998, S. III).
Kohler, Steffen: Nichtparametrische Dichteschätzung
2. Histogramme
2.1 Konstruktion und Herleitung
Der einfachste und älteste Dichteschätzer ist das Histogramm. Nach Bohley (1991, S. 90) ist „Ein Histogramm (ist) die graphische Darstellung einer nach einem quantitativ-stetigen Merkmal gegliederten Tabelle“. Thadewald (1998, S.1) definiert das Histogramm als „die Darstellung der Häufigkeiten klassierter Daten einer stetigen Zufallsvariablen.“ Die Idee der Histogrammdarstellung ist die Zerlegung des Variationsintervalls [X min , ... , X max ] der Daten X = (X 1 , ... , X n ) in k disjunkte, aneinander angrenzende Teilintervalle, auch Klassen oder Bins genannt. Die Daten werden also diskretisiert. Es wird im folgenden der Einfachheit halber davon ausgegangen dass diese Klassen jeweils die selbe Klassenbreite (Binweite) h besitzen. Formal kann man das Histogramm am Dichteschätzer folgendermaßen schreiben:
(Quelle: Thadewald, 1998)
Hierbei ist I i (x) eine Indikatorfunktion, die den Wert 1 annimmt, wenn x in der i- tenKlasse liegt und sonst den Wert 0.
Grafisch wird nichts anderes gemacht als für jede Beobachtung ein Block mit der Fläche 1/n und der Breite h auf der Klassenmitte gestapelt, in der die Beobachtung fällt (vgl. Abbildung 1). Die Kreuze an der Abszisse der Schaubilder in Abbildung 1 stellen die Beobachtungen dar. Die Fläche der Rechtecke der einzelnen Klassen, die sich als die Summe der Flächen der übereinandergestapelten Blöcke ergeben, repräsentieren dann die Klassenhäufigkeit (vgl. Schaich, 1990, S.17).
Kohler, Steffen: Nichtparametrische Dichteschätzung
Abbildung 1: Das Histogramm als Summe gestapelter Blöcke auf den Klassenmitten der Klassen der jeweiligen Beobachtungen (Quelle: Thadewald, 1998, S. 2)
2.2 Eigenschaften von Histogrammen
Histogramme hängen von der Wahl zweier Parameter ab: Der Klassenbreite h und dem Ursprung x 0 . Je kleiner die Klassenbreite gewählt wird umso größer ist der Einfluss der einzelnen Beobachtung auf die Glätte der geschätzten Dichtefunktion (vgl. Abbildung 2).
Abbildung 2: Einfluss der Bandbreite: Histogramme für den Selben Datensatz (n = 109) mit h = 40, 60, 80, 120 (Quelle: Thadewald, 1998, S. 4)
Kohler, Steffen: Nichtparametrische Dichteschätzung
Auf Verfahren zur optimalen Bandbreitenwahl wird im Abschnitt 3.5, allerdings für Kerndichteschätzer, noch eingegangen werden.
Auch die Wahl des Ursprungs x 0 , also der untersten Intervallgrenze auf der Abszisse, spielt eine nicht zu unterschätzende Rolle bei der Darstellung des Histogramms (vgl. Härdle/Müller, 1993, S. 10). In der Regel wird x 0 = 0 oder x 0 = x min gesetzt. Wie in Abbildung 3 zu sehen ist können durch verschiedene x 0 -Werte bei Verwendung der gleichen Daten sehr verschiedene Histogramme entstehen. Die Histogramme in Abbildung 3 lassen für Interpretationen der Datenstruktur jede Menge Spielraum: Eine uni-, bi- oder trimodale, symmetrische, links- oder auch rechtsschräge Verteilung könnte begründet werden. Zum Vergleich ist unten rechts in Abbildung 3 eine Kerndichteschätzung eingefügt. Auf ein Verfahren zur Ausschaltung des Einflusses von x 0 wird im nächsten Abschnitt eingegangen.
Abbildung 3: Einfluss des Ursprungs: Histogramme für den selben Datensatz (n = 63) mit x 0 = 0,
2, 4, 6, 8 und h = 10 (Quelle: Härdle/Müller, 1993, S. 11)
Obwohl das Histogramm als Dichteschätzer bei geeigneter Wahl der Parameter h und x 0 einen brauchbaren Eindruck der Verteilung der Daten liefert, hat es doch ein paar generelle Nachteile (vgl. Hafner, 2001):
Kohler, Steffen: Nichtparametrische Dichteschätzung
• Durch die Klassifizierung der Daten findet ein Informationsverlust statt
• Das Histogramm soll eine in der Regel stetige und glatte Dichtefunktion schätzen, ist selbst aber unstetig und treppenförmig.
Diese Schwächen des Histogramms als Dichteschätzer werden von Kerndichteschätzern, die in Kapitel 3 behandelt werden, vermieden.
2.3 WARPing
WARPing ist ein Verfahren zur Ausschaltung des Einflusses von x 0 , der in Abbildung 3 gezeigt wurde. Der Begriff WARPing steht für Weighted Averaging of Rounded Points. Die Idee des WARPing basiert darauf m Histogramme mit verschiedenen x 0 zu konstruieren und dann über diese zu mitteln. Diese Mittelung von Histogrammen kommt, wie man zeigen kann (vgl. Härdle/Müller, 1993), einer Gewichtung der diskretisierten Datenpunkte durch den Dreieckskern (siehe Abschnitt 3.3) gleich. Das WARPing löst dabei nur das Problem des x 0 -Einflusses. Für die Wahl der optimalen Bandbreite h, die zur Erstellung der Histogramme benötigt wird, sei auf Abschnitt 3.5 verwiesen.
2.4 Vom Histogramm zum Kerndichteschätzer
Wie in Abschnitt 2.1 gezeigt wurde, kann das Histogramm als eine Stapelung von gleichartigen Blöcken auf den Klassenmitten der Beobachtungen interpretiert werden. Ein etwas verbesserter Dichteschätzer könnte nun so aussehen, dass diese Blöcke anstatt auf den Klassenmitten direkt auf den Beobachtungen gestapelt werden (vgl. Abbildung 4).
Formal sieht dieser Dichteschätzer folgendermaßen aus:
(Quelle: Thadewald, 1998)
Kohler, Steffen: Nichtparametrische Dichteschätzung
Abbildung 4: Ein verbesserter Dichteschätzer auf Basis des Histogramms: Blöcke über den eigentlichen Beobachtungen anstatt den Klassenmitten (Quelle: Thadewald, 1998, S.2)
Dieser gegenüber dem Histogramm verbesserte Dichteschätzer hat immer noch den Nachteil, als Schätzer für eine stetige Dichtefunktion selbst nicht stetig zu sein. Dieses Problem kann dadurch behoben werden, dass man anstatt rechteckigen Blöcken stetige „Haufen“ auf die Beobachtungen platziert. Und genau dies ist das Prinzip der Kerndichteschätzer.
3. Kerndichteschätzer
3.1 Konstruktion
Die Benutzung von Haufen anstatt von Blöcken wie beim einfachen Dichteschätzer aus Abschnitt 2.4 entspricht formal einer Substitution der Funktion G im einfachen Dichteschätzer mit einer Kernfunktion K im Kerndichteschätzer. Es gibt mehrere mögliche Funktionen K, die in Abschnitt 3.2 erläutert werden. Gemeinsam haben die Kernfunktionen in der Regel, dass sie um Null symmetrisch und unimodale Dichtefunktionen sind wie zum Beispiel die Dichte der Standardnormalverteilung. Um den Kerndichteschätzer zu Konstruieren, wird die von der Bandbreite h abhängige Kernfunktion K über jede Beobachtung gelegt und dann gemittelt. Die Formel für Kerndichteschätzer kann als
Kohler, Steffen: Nichtparametrische Dichteschätzung oder kompakter als
geschrieben werden. In Abbildung 5 wir die Idee der Kerndichteschätzer noch einmal graphisch veranschaulicht.
Abbildung 5: Kerndichteschätzer: „Haufen auf Beobachtungen“ (Quelle: Thadewald, 1998, S.3)
3.2 Arten von Kernfunktionen
Es gibt viele mögliche Kernfunktionen. Sie müssen die Eigenschaften einer Dichtefunktion erfüllen, also
und in der Regel sind sie um Null symmetrisch und unimodal. Beispiele oft verwendeter Kernfunktionen sind die Dichte der Standardnormalverteilung (Norm), auch Gauss-Kern genannt, der Epanechnikov-Kern (Epan), die Dreiecksdichte (Drei) oder der Rechteckskern (Rech):
Kohler, Steffen: Nichtparametrische Dichteschätzung Abbildung 6 zeigt die Kerndichteschätzungen eines Datensatzes unter Verwendung der obigen Kerne. Wie man sieht, unterscheiden sich die Dichteschätzungen kaum, nur der Rechteckskern liefert ein etwas raueres Ergebnis. Der Epanechnikov-Kern wird in bestimmter Hinsicht als der optimale Kern angesehen, die anderen Kerne sind jedoch annähernd gleich effizient (vgl. Hafner, 2001, S.86f). Die Wahl der Kernfunktion spielt jedoch eine vergleichsweise kleine Rolle zur Bandbreitenwahl (vgl. Abschnitt 3.3).
Abbildung 6: Dichteschätzung mit Epanechnikov-Kern, Normal-Kern, Dreieckskern und Rechteckskern (Quelle: Thadewald, 1998, S.6)
3.3 Der Einfluss der Bandbreite
Wie für Histogramme spielt auch bei Kerndichteschätzern die Wahl der Bandbreite h eine zentrale Rolle. Für sehr kleine Bandbreiten zeigt die Dichteschätzung eine sehr raue Struktur, für große Bandbreiten wird die Dichteschätzung sehr glatt (vgl. Abbildung 7). Daher wird h auch oft als Glättungsparameter bezeichnet. Wenn h zu groß gewählt wird kann es zum sogenannten Überglätten (oversmoothing) kommen, dass heißt das die Dichte zu sehr geglättet wird und möglicherweise wichtige Strukturen verloren gehen. Dem
Kohler, Steffen: Nichtparametrische Dichteschätzung entsprechend wenn h zu klein gewählt wird, kommt es zum Unterglätten (undersmoothing) und lokale Gegebenheiten der Daten haben einen zu großen Einfluss auf den Verlauf der Dichteschätzung (vgl. Härdle/Müller 1993, S.14f). Im nächsten Abschnitt werden verschiedene Verfahren zur optimalen Wahl der Bandbreite vorgestellt.
Abbildung 7: Einfluss der Bandbreitenwahl auf die Kerndichteschätzung, hier mit Normal-Kern (Quelle: Thadewald, 1998, S. 4)
3.4 Verfahren zur Bandbreitenwahl
Wie bisher gezeigt wurde, wird durch die in den Kerndichteschätzer integrierte Mittelung der Einfluss des Ursprungs ausgeschalten, und auch die Wahl der Kernfunktion spielt keine signifikante Rolle. Das Hauptproblem in der Kerndichteschätzung ist demnach die Bandbreitenwahl. Die Bestimmung der optimalen Bandbreite reduziert sich, wie sich zeigen wird, letztlich auf ein mathematisches Problem. Doch zunächst einmal muss man sich fragen, anhand welches Kriteriums man die Optimalität der Dichteschätzer mit verschiedenen Bandbreiten misst.
Kohler, Steffen: Nichtparametrische Dichteschätzung
3.4.1 Fehlermaße für die Dichteschätzung
Es bieten sich verschiedene Abweichungsmaße als Kriterien an. Man kann zum Beispiel vom mittleren quadratischen Fehler, im folgenden mit MSE (mean squared error) abgekürzt, der als der Erwartungswert der quadrierten Abweichung des Schätzwertes vom tatsächlichen Wert in einem Punkt definiert ist, ausgehen:
Da der MSE aber nur den Fehler an einer Stelle der Dichtefunktion misst, bietet es sich an, die Abweichung über die gesamte Funktion zu integrieren. Man erhält die integrierte quadratische Abweichung ISE (integrated squared error):
Wenn man nun den Erwartungswert von der ISE bildet bekommt man ein Fehlerkriterium, dass sich aufgrund der Analogie zur Parameterschätzung und der guten mathematischen Handhabung gut für die Bestimmung der Optimalität einer Kerndichteschätzung und damit auch der Bandbreitenwahl eignet:
Andere Fehlermaße sind der mittlere integrierte absolute Fehler MIAE (mean integrated absolute error), der analog über die absolute Abweichung der Schätzfunktion von der zu schätzenden Funktion konstruiert wird, und der mittlere größte Fehler MSUPE (mean supremum error), der aus dem größten Abstand zwischen Schätzfunktion und zu schätzender Funktion konstruiert wird (vgl. Wertz, 1978, S.41f). Auch andere Fehlerkriterien sind denkbar. In dieser Arbeit wird aber von MISE bzw. dem asymptotischen MISE als Fehlerkriterium ausgegangen.
Um nun die optimale Bandbreite zu bestimmen wird der asymptotische MISE für den Kernschätzer minimiert, also nach h abgeleitet und gleich Null gesetzt und nach h aufgelöst (vgl. Thadewald, 1998, S. 11ff). Für die optimale Bandbreite h * ergibt sich:
Kohler, Steffen: Nichtparametrische Dichteschätzung
mit Das mathematische Problem ist hierbei, dass h von dem Ausdruck R(ƒ") abhängt, der seinerseits wieder von der unbekannten Dichte ƒ abhängt. In den nächsten Abschnitten werden Verfahren vorgestellt um dieses Dilemma zu lösen.
3.4.2 Einfache Verfahren
Das einfachste Verfahren der Wahl der optimalen Bandbreite h * ist die sogenannte „Glättung nach Augenmaß“ (smoothing by eye). Bei diesem Verfahren betrachtet der Anwender eine Reihe von Graphen mit verschiedenen Bandbreiten und wählt dann ein Bandbreite aus, bei der für sein Verständnis die Dichtefunktion am sinnreichsten aussieht. Glättung nach Augenmaß kann durchaus gute Ergebnisse liefern, wobei eine gewisse Willkür nicht vermieden werden kann (vgl. Hafner, 2001, S. 88). Außerdem ist für viele Anwendungen eine Automatisierung der Bandbreitenwahl gefragt.
Um einen Ansatzpunkt für die Schätzung der optimalen Bandbreite zu liefern, wurden Faustregeln entwickelt. Diese gehen in der Regel von der Verwendung des Normal-Kerns aus, so dass sich in der Formel für die optimale Bandbreite
(siehe Abschnitt 3.4.1) für R(K) ≈ 0.2821 und für σ K = 1 ergibt und somit nur noch der Term R(ƒ") unbekannt ist. Um R(ƒ") zu schätzen, wird für ƒ eine Normalverteilung unterstellt. Dann hängt h * nur noch von der Standardabweichung σ und dem Stichprobenumfang n ab:
In dieser Gleichung muss nun die Standardabweichung σ durch einen geeigneten Schätzer s geschätzt werden, für den es viele Vorschläge in der statistischen Literatur gibt (vgl. Schaich, 1990, S. 163ff). Als eine mögliche Faustregel für die automatische Wahl der Bandbreite erhält man somit:
Für weitere einfache Verfahren und deren Konstruktion sei auf Thadewald (1998) S. 13f verwiesen.
Kohler, Steffen: Nichtparametrische Dichteschätzung
3.4.3 Kreuzvalidierung
Die Kreuzvalidierung (cross-validation) ist eine ausgefeiltere Technik zur Lösung des Problems der Formel für h * aus Abschnitt 3.4.1 und damit der automatisierten Bandbreitenwahl. Aufgrund ihrer Komplexität sollte zu ihrer Umsetzung ein Rechner benutzt werden. Ich möchte dieses Verfahren hier nur grob darstellen. Es sei auf Hafner (2001) S.90f, Thadewald (1998) S. 14ff und Härdle/Müller (1993) S. 16f verwiesen.
Die Kreuzvalidierung ist ein universell einsetzbares Schätzverfahren. Mit ihr wird ISE (vgl. Abschnitt 3.4.1) direkt geschätzt und somit die Dichteschätzung mit der optimalen Bandbreite identifiziert (vgl. Härdle/Müller, 1993, S.16). Die Idee der Kreuzvalidierung ist die Dichteschätzung an einem Punkt X i zu bestimmen, ohne dabei den Punkt selbst in der Schätzung zu verwenden. In anderen Worten wird versucht, aus einem Teil einer Stichprobe Informationen über einen anderen Teil dieser Stichprobe zu gewinnen. Es wird zwischen unverzerrter Kreuzvalidierung (UCV: unbiased cross-validation) und verzerrter Kreuzvalidierung (BCV: biased cross-validation) unterschieden. Die UCV schätzt MISE, die BCV schätzt den asymptotischen MISE. Die optimalen h der UCV beziehungsweise BCV wird bestimmt, indem die jeweilige Funktion minimiert wird, also nach h abgeleitet, gleich Null gesetzt und nach h aufgelöst wird:
(Quelle: Thadewald, 1998)
bzw.
(Quelle: Thadewald, 1998)
3.4.4 Andere Methoden
Es gibt verschiedene andere Methoden und Ansätze um das Problem der Wahl der optimalen Bandbreite zu lösen. Erwähnt sei hier noch die Plug-In Methode. Der Plug-In Schätzer (DPI: direct Plug-In) ersetzt das unbekannte R(ƒ") in der Formel
Kohler, Steffen: Nichtparametrische Dichteschätzung aus Abschnitt 3.4.1 direkt. Dabei wird ein Rekursionsprinzip angewandt (vgl. Thadewald, 1998, S. 17ff).
Ein neuerer Ansatz ist das sogenannte adaptive Schema zur Bandbreitenwahl (AVF: adaptive Vorfaktor-Methode). Die AVF ist in gewisser Weise auch ein Plug-In Ansatz, der aber weniger komplex und rechenintensiv ist. Die optimale Bandbreite, die den asymmetrischen MISE minimiert hat dabei folgende Struktur:
wobei
VF
ein Vorfaktor ist, der von der Schiefe, der Wahrscheinlichkeitsmasse an den Rändern (Tailgewicht) und der Konzentration der Wahrscheinlichkeit im Zentrum der Verteilung (Peakedness) abhängt (vgl. Thadewald, 1998, S. 20ff).
3.4.5 Beurteilung der Verfahren
Um die Leistungsfähigkeit der betrachteten Methoden miteinander zu vergleichen braucht man ein Kriterium. Die Konvergenzrate, mit der die geschätzte Bandbreite gegen die optimale Bandbreite strebt, bietet sich als solches an. Man kann zeigen, dass die unverzerrte und verzerrte Kreuzvalidierungsmethode UCV und BCV sehr geringe Konvergenzraten haben. Die Konvergenzrate des direkten Plug-In Schätzers DPI ist etwas besser. Das UCV-Verfahren und das BCV-Verfahren haben beide eine hohe Streuung. Die verzerrte Kreuzvalidierung hat zudem noch einen sehr hohen Bias, so dass man eher die unverzerrte Kreuzvalidierung anwenden sollte. Im Vergleich schneidet der DPI-Schätzer am besten ab (vgl. Thadewald, 1998, S.23). In Abbildung 8 werden die Methoden unverzerrte Kreuzvalidierung (UCV), verzerrte Kreuzvalidierung (BCV), direkte Plug-In Schätzer (DPI) und adaptive Vorfaktor-Methode (AVF) vergleichend graphisch gegenübergestellt.
Kohler, Steffen: Nichtparametrische Dichteschätzung
Abbildung 8: Vergleich der Methoden zur Schätzung der Bandbreite (Quelle: Thadewald, 1998, S. 22)
3.5 Variable Kerndichteschätzer
Eine Erweiterung der Kerndichteschätzung stellen Kerndichteschätzer mit variabler Bandbreite h da. Dies macht Sinn, da in Bereichen der Verteilung mit wenigen Datenpunkten, also in der Regel in den Randbereichen, der klassische Kerndichteschätzer die tatsächliche Dichte nicht immer gut nachbildet. Durch Anpassung der Bandbreite von Punkt zu Punkt erhält man einen besseren Schätzer. Die Bandbreite wird dabei in Bereichen mit hoher Dichter etwas kleiner und in Bereichen mit niedriger Dichte größer gewählt. Es existieren verschiedene Verfahren um dies zu bewerkstelligen, auf die hier aber nicht weiter eingegangen wird.
4. Andere Verfahren zur Dichteschätzung
Neben den hier behandelten Histogrammen und Kerndichteschätzern gibt es auch noch andere nichtparametrische Verfahren, mit denen Dichtefunktionen aus bekannten Verteilungen geschätzt werden können. Erwähnt seien hier Spline-Schätzer. Sie gehen vom Histogramm aus und versuchen eine stetige Funktion in
Kohler, Steffen: Nichtparametrische Dichteschätzung dieses einzupassen (vgl. Wertz, 1978, S. 86ff). Eine weitere Methode stellen die Nearest-Neighbour-Schätzer (nächste Nachbarn) dar. Hierbei wird die Dichte mittels der Abstände zu den nächsten Nachbarn der Datenpunkte geschätzt (vgl. Härdle/Linton, 1994, S. 2310ff). Daneben gibt es noch die Möglichkeit, Dichtefunktionen aufgrund von Fourierreihen zu Schätzen (vgl. Thadewald, 1998, S 23). In Hafner (2001) findet sich eine Methode, die mit dem Gleitenden Differenzenquotient der Verteilungsfunktion die Dichte bestimmt. Außerdem gibt es noch Ansätze, die Maximum-Likelihood-Methode auf die Dichteschätzung anzuwenden (vgl. Wertz, 1978, S.95f).
5. Anwendungen und Ausblick
Die nichtparametrische Dichteschätzung eignet sich primär zur Datenpräsentation, aufgrund derer dann eine Beurteilung der Daten erfolgen kann. Diese kann auch als Grundlage zur Formulierung parametrischer Modelle eingesetzt werden. Eine der wichtigsten Anwendungen der hier vorgestellten Glättungsmethoden findet sich in der nichtparametrischen Regressionsanalyse, also der Analyse des Zusammenhangs zweier oder mehrerer Zufallsvariablen (vgl. Härdle/Linton, 1994).
In dieser Arbeit wurden nur eindimensionale Dichteschätzer behandelt. Im mehrdimensionalen Bereich gibt es auch viele Anwendungsmöglichkeiten. Eine der wichtigsten Anwendungen ist hier die nichtparametrische Diskriminanzanalyse. Sie befasst sich mit dem Problem der Zuordnung einer Beobachtung zu bekannten unterschiedlichen Verteilungen und ihren geschätzten Dichten (vgl. Hafner, 2001, S.94).
Weitere Anwendungen der nichtparametrischen Dichteschätzung sind die Clusteranalyse und die geglättete Bootstrap-Methode (vgl. Hafner, 2001, S.94).
Kohler, Steffen: Nichtparametrische Dichteschätzung
Literaturverzeichnis
Bohley, Peter: Statistik, 4. Auflage, München, Wien: Oldenbourg 1991.
Büning, H. und G. Trenkler: Nichtparametrische statistische Methoden, 1.
Auflage, Berlin, New York 1978.
Hafner, Robert: Nichtparametrische Verfahren der Statistik, 2001, S. 75-95.
Härdle, W. und O. Linton: Applied Nonparametric Methods, in: Handbook of
Econometrics, Vol. IV, 1994, S. 2295-2339. Härdle, W. und M. Müller: Nichtparametrische Glättungsmethoden in der
alltäglichen statistischen Praxis, in: Allgemeines Statistisches Archiv, 77. Jg., 1993, S 9-31.
Härdle, W., Müller M., Sperlich S. und Werwatz A.: Non- and Semiparametric
Modelling, Overheads, [http://www.quantlet.de/folien/spmfolien.pdf], (Erstelldatum: 11. Oktober 2001; Verfügbarkeitsdatum: 17. Oktober 2001) Schaich, Eberhard: Schätz- und Testmethoden für Sozialwissenschaftler, 2.
Auflage, München 1990.
Thadewald, Thorsten: Uni- und bivariate Dichteschätzung,
Wirtschaftswissenschaftliche Dissertation, Berlin 1998. Wertz, Wolfgang: Statistical Density Estimation, Göttingen 1978.
Kohler Steffen: Nichtparametrische Dichteschätzung 19
Abbildungsverzeichnis
Abbildung 1: Das Histogramm als Summe gestapelter Blöcke auf den
Klassenmitten der Klassen der jeweiligen Beobachtungen (Quelle: Thadewald
1998, S 2) Seite 5
Abbildung 2: Einfluss der Bandbreite: Histogramme für den Selben Datensatz (n
109) mit h 40 60 80 120 (Quelle: Thadewald 1998 S 4) Seite 5
Abbildung 3: Einfluss des Ursprungs: Histogramme für den selben Datensatz (n
63) mit x 0 0 2 4 6 8 und h 10 (Quelle: Härdle Müller 1993 S 11) Seite 6
Abbildung 4: Ein verbesserter Dichteschätzer auf Basis des Histogramms: Blöcke
über den eigentlichen Beobachtungen anstatt den Klassenmitten (Quelle:
Thadewald 1998 S 2) Seite 8
Abbildung 5: Kerndichteschätzer: „Haufen auf Beobachtungen“ (Quelle:
Thadewald 1998 S 3) Seite 9
Abbildung 6: Dichteschätzung mit Epanechnikov-Kern Normal-Kern
Dreieckskern und Rechteckskern (Quelle: Thadewald 1998 S 6) Seite 10
Abbildung 7: Einfluss der Bandbreitenwahl auf die Kerndichteschätzung hier mit
Normal-Kern (Quelle: Thadewald 1998 S 4) Seite 11
Abbildung 8: Vergleich der Methoden zur Schätzung der Bandbreite (Quelle:
Thadewald 1998 S 22) Seite 16
Quote paper:
Steffen Kohler, 2001, Nichtparametrische Dichteschätzung, Munich, GRIN Publishing GmbH
This text can be quoted and accessed from this url:
Embed
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Presentations, Models, Tutorials, Instructions
Elaboration, 25 Pages
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Presentations, Models, Tutorials, Instructions
Elaboration, 35 Pages
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Presentations, Models, Tutorials, Instructions
Elaboration, 15 Pages
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Presentations, Models, Tutorials, Instructions
Elaboration, 25 Pages
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Presentations, Models, Tutorials, Instructions
Elaboration, 20 Pages
Erstellen einer schriftlichen Hausarbeit
Presentations, Models, Tutorials, Instructions
Termpaper, 14 Pages
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Presentations, Models, Tutorials, Instructions
Script, 46 Pages
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Presentations, Models, Tutorials, Instructions
Elaboration, 39 Pages
Steffen Kohler has published the text Nichtparametrische Dichteschätzung
Steffen Kohler has uploaded a new text
Moderne nichtparametrische Verfahren der Risikoanalyse
Eine anwendungsorientierte Ein...
Helge Toutenburg
Einführung in die nichtparametrische Statistik mit SAS und R
Ein anwendungsorientiertes Leh...
Christine Duller
0 comments