Register or log in at GRIN

Your e-mail-address or password is wrong
Register now
For new authors: free, easy and fast
This will be used as your user name, please specify a valid e-mail address

Lost password

Your e-mail-address or password is wrong

Request a new password
SEMIR - Statistical Excel Menu, Interacting with R close

Please wait

Please install the Adobe Flash Player if no e-book is displayed.

SEMIR - Statistical Excel Menu, Interacting with R

Diploma Thesis, 2003, 165 Pages
Author: Markus Haas
Subject: Statistics

Details

Category: Diploma Thesis
Year: 2003
Pages: 165
Grade: Sehr gut
Bibliography: ~ 14  Entries
Language: German
Archive No.: V30228
ISBN (E-book): 978-3-638-31534-0

File size: 2962 KB
Notes :
In der vorliegenden Diplomarbeit wird ein neuer Lösungsansatz für die einfache statistische Datenanalyse auf Office Ebene angeboten. Dieser Lösungsansatz ist als Excel Add-In konzipiert und trägt den Namen SEMIR. SEMIR steht für “Statistical Excel Menu, Interacting with R”. SEMIR besteht aus zwei zusätzlichen Excel-Menüs, die sich dem Benutzer bieten. Diese werden genützt, um einfache statistische Analysen durchzuführen.



Excerpt (computer-generated)

Diplomarbeit

Wirtschaftsuniversität Wien

SEMIR - Statistical Excel Menu, Interacting with R

Verfasser: 

Markus Haas

Studienrichtung: Handelswissenschaften

 

 

Inhaltsverzeichnis:
Danksagung ... 4
Vorwort  ... 5

1. Einleitung  ... 8
1.1. Statistische Softwarelösungen ... 8
1.1.1. SPSS ... 8
1.1.2. Excel ... 14
1.1.3. R  ... 20
1.2. Überblick über die behandelte Statistiksoftware ... 28
1.3. Die Synthese: Die Verbindung von R und Excel  ... 29

2. Beschreibung des Interfaces ... 30
2.1. Installation ... 31
2.2. Grundsätze der Funktionalität SEMIRs  ... 34
2.3. Funktionalität der einzelnen Menüpunkte ... 39
2.3.1. Menüstruktur  ... 39
2.3.2. Manager ... 41
2.3.3. Data  ... 42
2.3.4. Statistics (Excel Dataset)  ... 45
2.3.5. Statistics (R Dataset)  ... 54
2.3.6. Random  ... 60
2.3.7. Diagrams  ... 62
2.3.8. Das Kontextmenü ... 70
2.4. Deinstallation des Interfaces  ... 73

3. Programmierung ... 74
3.1. Programmierung in Visual Basic  ... 74
3.2. Programmierung in R  ... 86

4. Ansätze zur Weiterentwicklung  ... 90
4.1. Bedienungsfreundlichkeit ... 90
4.2. Funktionalität  ... 91

Literaturverzeichnis ... 93

Abbildungsverzeichnis  ... 95

Anhang1: Visual Basic Codierung ... 97
Anhang2: RLibrary Rfunctions.r  ... 156

Danksagung
[...]

Vorwort

In der vorliegenden Diplomarbeit wird ein neuer Lösungsansatz für die einfache statistische Datenanalyse auf Office Ebene angeboten. Dieser Lösungsansatz ist als Excel Add-In konzipiert und trägt den Namen SEMIR. SEMIR steht für “Statistical Excel Menu, Interacting with R”. SEMIR besteht aus zwei zusätzlichen Excel-Menüs, die sich dem Benutzer bieten. Diese werden genützt, um einfache statistische Analysen durchzuführen. 

Zielsetzung

SEMIR ist eine Symbiose mehrerer Programme mit einem klar gesteckten Ziel. Das Ziel ist es, Studienanfängern der Sozial- und Wirtschaftswissenschaftlichen Studienrichtungen ein Werkzeug in die Hand zu geben, um damit die elementare Statistik zu erlernen. 

Dazu ist eine Symbiose mehrerer Programme notwendig. Obwohl bereits hoch entwickelte Statistikprogramme am Markt sind, sind diese nicht optimal auf die Bedürfnisse der erwähnten Benutzergruppe abgestimmt. Zu komplexe Bedienung und zu große Optionalität verhindern ein leichtes Zurechtfinden. Andere Programme, mit denen der Studienanfänger bereits vertraut ist (wie z.B. Microsoft Excel), weisen nicht die erforderlichen Funktionen auf, um den statistischen Anforderungen gerecht zu werden.

Es wird daher mit SEMIR versucht, in einer vertrauten Umgebung, nämlich MS Excel, jene Funktionen einzubauen, die für die grundlegende Statistik nötig sind.

Inhaltsübersicht

Die Diplomarbeit ist in vier Kapitel gegliedert. Im ersten Kapitel wird eine Auswahl an Software vorgestellt, die an Sozial- und Wirtschaftswissenschaftlichen Universitäten im Rahmen des elementaren Statistikunterrichts Anwendung findet. Es werden in einem Überblick deren Grundgedanken und Funktionsweisen beschrieben. Anhand der Vor- und Nachteile dieser Softwareangebote wird gezeigt, dass es möglich ist, etliche Vorteile zu vereinen, ohne jedoch die Nachteile zu übernehmen.

Eine wesentliche Rolle kommt dabei der Software R zu. R bietet sich auf mehrfache Weise an. Da R als Open-Source Software geschrieben wurde, ist sie frei verfügbar. Andere Softwarepakete sind teuer, leisten jedoch nicht mehr als R. Weiters zeichnet sich R durch eine sehr moderne Programmierung, durch schnelle Berechnungen und eine einfache Syntax aus. Diese erlaubt es dem Benutzer, auf unkomplizierte Weise komplexe Modelle zu bilden. 

Diese Rechenstärke R′s wird mit der Bedienungsfreundlichkeit von Excel in Form von SEMIR verbunden. SEMIR wird im zweiten und dritten Kapitel ausführlich beschrieben. 

Im zweiten Kapitel wird eine eingehende Beschreibung von SEMIR für den Anwender gegeben. Dieser Teil der Diplomarbeit kann gewissermaßen als „Reference Manual“ und Unterstützung bei der Einarbeitung herangezogen werden. Ausgehend von der Installation werden nach und nach alle Funktionen einzeln beschrieben. Diese werden mit Screenshots und Handlungsanweisungen ergänzt. Das zweite Kapitel wird von einer Beschreibung der Deinstallation von SEMIR abgeschlossen.

Im dritten Kapitel wird der Quellcode erklärt. Diese Erklärung soll eine Verständnishilfe für das Zusammenspiel der einzelnen Elemente und die Weiterentwicklung von SEMIR darstellen. Der Quellcode ist zweigeteilt. Ein Teil der Makros wurde als Visual Basic Code, ein Zweiter als R Programmbibliothek verfasst. Es wird beschrieben werden, welche Funktionen die einzelnen Makros übernehmen und wie sie interagieren.

Das vierte Kapitel diskutiert abschließend Möglichkeiten, SEMIR weiterzuentwickeln. Es werden Vorschläge gemacht, in welche Richtung die Weiterentwicklung gehen könnte und Beispiele von Funktionalitäten gebracht, die in der jetzigen Version von SEMIR noch nicht enthalten sind.

In den Anhängen sind die Programmcodes der R Makros und der VB Makros abgedruckt. 

Aufbau von SEMIR

SEMIR fußt im Wesentlich auf 4 Pfeilern:

Erstens sind dies die Programme Excel und R. Excel dient dabei als „Basis“ und Arbeitsumgebung, in die ein zusätzliches Menü eingesetzt wird. Excel ist jenes Programm, das der Benutzer sieht. Die eigentliche Rechenarbeit wird jedoch im Hintergrund von R ausgeführt. R wird aufgrund seiner Rechenleistung und leichten Programmierbarkeit verwendet1. Jedoch sind noch zwei weitere Pfeiler notwenig, um SEMIR zu tragen. 

Zwei österreichische Wissenschafter haben dazu wesentliche Beiträge geleistet:

Thomas Baier von der TU-Wien hat den DCOM Server entwickelt. Dieser ist für die Kommunikation zwischen den Programmen Excel und R notwendig. Der DCOM Server ist die Voraussetzung dafür, dass Daten von Excel nach R transferiert, Befehle von Excel aus in R abgesetzt und deren Ergebnisse nach Excel zurückgeführt werden können.

Das Gegenstück dazu hat Erich Neuwirth, Universität Wien, verfasst. Er hat das „Grundgerüst“ in Visual Basic programmiert2, auf dem meine Arbeit aufbaut. Die von ihm in Visual Basic geschriegenen Befehle steuern den DCOM Server3.

Weitere Funktionen, die ebenfalls in SEMIR integriert wurden, wurden von Helmut Strasser, WU-Wien, verfasst. An entsprechender Stelle wird im Quellcode auf die Urheberschaft hingewiesen.

Auf Basis dieser funktionierenden Kommunikationsstruktur war es meine Hauptaufgabe, mich der Überführung der statistischen Berechnungen in Excel Befehle mit sinnvoller Menügestaltung zu widmen. Dies habe ich in Form des zusätzlichen Menüs „REngine“ und des Kontextmenüs in Excel realisiert.

Zur Programmierung

Die Programmierung in Visual Basic, als auch in R, fußen auf drei Prinzipien, die ich mir anfänglich als Ziel gesetzt habe: Leichte Verständlichkeit, Durchgängigkeit und Ausbaufähigkeit.

1) Leichte Verständlichkeit

Ich habe bei der Gestaltung der Menüs, der Vergabe der Variablennamen und der Zusammenstellung von Subs und Functions versucht, einen sinnvollen Aufbau zu finden. Der Aufbau der Module entspricht in etwa der Form des Menüs REngine. Ebenso sind die Befehle der Library Rfunctions.r in jener Reihenfolge angeordnet, wie sie in der Menüstruktur vorkommen.

Nicht zuletzt sollen ausführliche Kommentare im VB Code und in der Library Rfunctions.r dazu dienen, die Einarbeitung zu erleichtern und die Urheberschaft klarzustellen. Genauere Ausführungen im Hinblick auf die Programmierung sind in „3. Programmierung“ zu finden.

[....]


1 Excel und R werden im 1. Kapitel in ihren Grundzügen beschrieben.

2 Im Quellcode sind an den entsprechenden Stellen Verweise auf die Urheberschaft angebracht.

3 Die Kommunikationsstruktur von DCOM Server und Visual Basic Programmierung wird in „1.1.3.3. Die technischen Voraussetzungen für SEMIR“ beschrieben.


Comments

No comments yet

Add Comment
Your comment is reviewed before being published

Other users also were interested in the following titles:

Erstellen einer schriftlichen Hausarbeit

Author: Claudia Nickel
Presentations, Models, Tutorials, Instructions, 2006 Download as PDF-file for 4,99 EUR

Grundtechniken wissenschaftlichen Arbeitens

Author: Maik Philipp
Presentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR

This text can be quoted and accessed from this url:

http://www.grin.com/e-book/30228/semir-statistical-excel-menu-interacting-with-r
please wait Please wait