Dieser Beitrag widmet sich der datenbasierten Optimierung und deren konkreten Anwendung. Für diesen Zweck wird eine Lösungsmethode aufgestellt, in der die Pseudo-Huber-Regularisierung, die inexakte Newton-Methode, das GMRES Verfahren und die Armijo-Regel angewandt werden.
Ziel dabei ist, die Leistung einer Lösungsmethode auf Basis der inexakten Newton-Verfahren für die LASSO-Regression anhand einer Programmiersequenz in R zu implementieren und zu bewerten.
Inhaltsverzeichnis
- Einleitung
- LASSO-Regression
- Grundlagen
- Über die Methode der kleinsten Quadrate hinaus
- Formulierung einer Lasso-Regression
- Eine Newton-GMRES Methode für die LASSO-Regression
- Newton-GMRES-verfahren
- Das Schrittweitenverfahren von Armijo
- Implementierung der Lösungsmethode
- Datensätze und experimentelle Parameter
- R-Programmierung, Bibliotheken (linear algebra) und R Packages
- Auswertung der Ergebnisse
- Verifikation
- Auswertung der Genauigkeit
- Auswertung der Ausführungszeit
- Zusammenfassung und Ausblick
Zielsetzung und Themenschwerpunkte
Diese Arbeit beschäftigt sich mit der datenbasierten Optimierung und ihrer Anwendung in der Praxis. Sie untersucht eine Lösungsmethode für die LASSO-Regression, die auf der Pseudo-Huber-Regularisierung, der inexakten Newton-Methode, dem GMRES-Verfahren und der Armijo-Regel basiert. Das Ziel ist es, die Leistungsfähigkeit dieser Methode anhand einer Programmiersequenz in R zu implementieren und zu bewerten. Die Präzision des Modells und die benötigte CPU-Verarbeitungszeit bei einer bestimmten Datenmenge dienen als Bewertungskriterien. Durch einen Vergleich mit dem Trust-Region-Verfahren, das als ressourceneffizient gilt, soll die Validierung der Lösungsmethode erfolgen.
- Anwendung der LASSO-Regression in der Datenanalyse
- Entwicklung und Implementierung einer Lösungsmethode basierend auf der inexakten Newton-Methode
- Bewertung der Performance der Lösungsmethode in Bezug auf Modellpräzision und CPU-Verarbeitungszeit
- Vergleich der Ergebnisse mit dem Trust-Region-Verfahren
- Datenbasierte Optimierung für große Datensätze
Zusammenfassung der Kapitel
Das erste Kapitel führt in die Regression als mathematisches Konstrukt ein und erläutert die häufigsten Anwendungen sowie die Problematik der Überanpassung. Das zweite Kapitel stellt die LASSO-Regression vor, wobei die Eigenschaften und die Herausforderungen bei der Lösung der LASSO-Regression im Vordergrund stehen. Das dritte Kapitel beschreibt die Lösungsmethode, die auf der Pseudo-Huber-Regularisierung, dem Newton-Verfahren, dem GMRES-Verfahren und der Armijo-Regel basiert.
Schlüsselwörter
Die Arbeit befasst sich mit der LASSO-Regression, einer Methode der statistischen Analyse, die zur Datenanalyse von großen Datensätzen eingesetzt wird. Im Fokus steht die Entwicklung und Implementierung einer Lösungsmethode basierend auf der inexakten Newton-Methode, dem GMRES-Verfahren und der Armijo-Regel. Die Arbeit beleuchtet die Performance der Lösungsmethode in Bezug auf Modellpräzision und CPU-Verarbeitungszeit und vergleicht sie mit dem Trust-Region-Verfahren. Die Schlüsselbegriffe sind daher: LASSO-Regression, inexakte Newton-Methode, GMRES-Verfahren, Armijo-Regel, Datenbasierte Optimierung, Modellpräzision, CPU-Verarbeitungszeit, Trust-Region-Verfahren.
- Quote paper
- Daniela Rocio Cely Hernandez (Author), 2017, Datenbasierte Optimierung, R Programmierung und Anwendung, Munich, GRIN Verlag, https://www.grin.com/document/1050348