Die Diplomarbeit ist in vier Kapitel gegliedert. Im ersten Kapitel wird eine Auswahl an Software vorgestellt, die an Sozial- und Wirtschaftswissenschaftlichen Universitäten im Rahmen des elementaren Statistikunterrichts Anwendung findet. Es werden in einem Überblick deren Grundgedanken und Funktionsweisen beschrieben. Anhand der Vor- und Nachteile dieser Softwareangebote wird gezeigt, dass es möglich ist, etliche Vorteile zu vereinen, ohne jedoch die Nachteile zu übernehmen.
Eine wesentliche Rolle kommt dabei der Software R zu. R bietet sich auf mehrfache Weise an. Da R als Open-Source Software geschrieben wurde, ist sie frei verfügbar. Andere Softwarepakete sind teuer, leisten jedoch nicht mehr als R. Weiters zeichnet sich R durch eine sehr moderne Programmierung, durch schnelle Berechnungen und eine einfache Syntax aus. Diese erlaubt es dem Benutzer, auf unkomplizierte Weise komplexe Modelle zu bilden.
Diese Rechenstärke R's wird mit der Bedienungsfreundlichkeit von Excel in Form von SEMIR verbunden. SEMIR wird im zweiten und dritten Kapitel ausführlich beschrieben.
Im zweiten Kapitel wird eine eingehende Beschreibung von SEMIR für den Anwender gegeben. Dieser Teil der Diplomarbeit kann gewissermaßen als „Reference Manual“ und Unterstützung bei der Einarbeitung herangezogen werden. Ausgehend von der Installation werden nach und nach alle Funktionen einzeln beschrieben. Diese werden mit Screenshots und Handlungsanweisungen ergänzt. Das zweite Kapitel wird von einer Beschreibung der Deinstallation von SEMIR abgeschlossen.
Im dritten Kapitel wird der Quellcode erklärt. Diese Erklärung soll eine Verständnishilfe für das Zusammenspiel der einzelnen Elemente und die Weiterentwicklung von SEMIR darstellen. Der Quellcode ist zweigeteilt. Ein Teil der Makros wurde als Visual Basic Code, ein Zweiter als R Programmbibliothek verfasst. Es wird beschrieben werden, welche Funktionen die einzelnen Makros übernehmen und wie sie interagieren.
Das vierte Kapitel diskutiert abschließend Möglichkeiten, SEMIR weiterzuentwickeln. Es werden Vorschläge gemacht, in welche Richtung die Weiterentwicklung gehen könnte und Beispiele von Funktionalitäten gebracht, die in der jetzigen Version von SEMIR noch nicht enthalten sind.
In den Anhängen sind die Programmcodes der R Makros und der VB Makros abgedruckt.
Inhaltsverzeichnis
1. Einleitung
1.1. Statistische Softwarelösungen
1.1.1. SPSS
1.1.2. Excel
1.1.3. R
1.2. Überblick über die behandelte Statistiksoftware
1.3. Die Synthese: Die Verbindung von R und Excel
2. Beschreibung des Interfaces
2.1. Installation
2.2. Grundsätze der Funktionalität SEMIRs
2.3. Funktionalität der einzelnen Menüpunkte
2.3.1. Menüstruktur
2.3.2. Manager
2.3.3. Data
2.3.4. Statistics (Excel Dataset)
2.3.5. Statistics (R Dataset)
2.3.6. Random
2.3.7. Diagrams
2.3.8. Das Kontextmenü
2.4. Deinstallation des Interfaces
3. Programmierung
3.1. Programmierung in Visual Basic
3.2. Programmierung in R
4. Ansätze zur Weiterentwicklung
4.1. Bedienungsfreundlichkeit
4.2. Funktionalität
Zielsetzung & Themen
Das Hauptziel dieser Arbeit ist die Entwicklung von SEMIR, eines als Excel-Add-In konzipierten Werkzeugs, das statistische Analysefunktionen für Studienanfänger der Sozial- und Wirtschaftswissenschaften in einer vertrauten Office-Umgebung zugänglich macht. Durch die Verbindung der intuitiven Excel-Benutzeroberfläche mit der leistungsstarken statistischen Programmiersprache R wird eine Lücke geschlossen, die herkömmliche Statistiksoftware für Einsteiger oft unzugänglich macht.
- Integration von statistischen Berechnungen direkt in Microsoft Excel mittels R.
- Entwurf von benutzerfreundlichen Menüstrukturen und Dialogfenstern für die Datenanalyse.
- Umsetzung einer effizienten Kommunikationsstruktur zwischen Excel und R via DCOM-Server.
- Ermöglichung grundlegender statistischer Verfahren (Deskriptive Statistik, Regressionsanalyse, Clusteranalyse) ohne tiefgreifende Programmierkenntnisse.
- Etablierung eines erweiterbaren Systems für zukünftige statistische Methoden.
Auszug aus dem Buch
Die Synthese: Die Verbindung von R und Excel
In den bisherigen Abschnitten wurden die Stärken und Schwächen der Programme ausführlich beschrieben.
Es wurde gezeigt, dass MS Excel weit verbreitet ist und durch seine Benutzerfreundlichkeit besticht. Es wurde weiters unterstrichen, dass die wesentlichen Vorteile die Referenzierung von Bereichen, deren Adressierung mittels Namen ist. Dadurch ist es möglich, Daten automatisch neu berechnen und Grafiken aktualisieren zu lassen.
R kennt diesen Automatisierungsgrad nicht, verfügt jedoch über wesentliche andere Vorteile: Diese sind das Listenkonzept, die Arrays welche auch über zwei Dimensionen umfassen können, sowie die Datenframes. Letztere entsprechen in etwa Datenmatrizen in Excel. Wesentlich ist auch das Objektkonzept, welches nicht nur Daten, sondern auch Befehle als Objekte betrachtet und so das Verschachteln von Befehlen ineinander erlaubt.
Optimal wäre die Verbindung dieser zwei Programme, wobei von jedem lediglich die Vorteile übernommen werden. Dies wird mit der SEMIR versucht.
SEMIR realisiert folgende Grundidee: Ein Datensatz ist in Excel vorhanden; dieser ist leicht aus den verschiedenen Quellen einzulesen bzw. zu editieren. Dieser Datensatz kann mit Hilfe des Menüs REngine analysiert werden. Die Berechnungen werden sehr schnell in R durchgeführt. Die Ergebnisse werden wieder an Excel zurückgegeben und können dort auf vielfältige Weise weiterverarbeitet werden.
Zusammenfassung der Kapitel
1. Einleitung: Dieses Kapitel gibt einen Überblick über bestehende Statistik-Software wie SPSS, Excel und R, analysiert deren Stärken und Schwächen und motiviert die Entwicklung von SEMIR.
2. Beschreibung des Interfaces: Hier werden die Installation sowie die gesamte Menüstruktur und Funktionalität des SEMIR-Add-Ins praxisnah für den Anwender beschrieben.
3. Programmierung: Dieser Teil erläutert detailliert den Visual Basic Code der Benutzeroberfläche sowie die R-Programmbibliothek, die als Rechenkern von SEMIR dient.
4. Ansätze zur Weiterentwicklung: Das abschließende Kapitel diskutiert zukünftige Optimierungsmöglichkeiten sowohl im Bereich der Benutzerfreundlichkeit als auch der funktionalen Erweiterung von SEMIR.
Schlüsselwörter
SEMIR, Excel, R, statistische Datenanalyse, Statistiksoftware, Add-In, Visual Basic, DCOM-Server, GUI-Design, Benutzerfreundlichkeit, Regressionsanalyse, Clusteranalyse, deskriptive Statistik, Datenmanagement, Programmierung.
Häufig gestellte Fragen
Worum geht es in dieser Diplomarbeit grundsätzlich?
Die Arbeit befasst sich mit der Entwicklung von SEMIR ("Statistical Excel Menu, Interacting with R"), einem Add-In für Microsoft Excel, das statistische Analysen in einer vertrauten Office-Umgebung ermöglicht.
Was sind die zentralen Themenfelder?
Die zentralen Felder sind die softwaretechnische Integration von R in Excel, die Gestaltung benutzerfreundlicher grafischer Oberflächen (GUIs) für Statistik sowie die Automatisierung von Berechnungen.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, Studienanfängern der Sozial- und Wirtschaftswissenschaften ein Werkzeug zu bieten, das die elementare Statistik verständlich macht, indem es die Rechenstärke von R mit der Bedienbarkeit von Excel verbindet.
Welche wissenschaftliche Methode wird verwendet?
Es wird ein technischer Lösungsansatz entwickelt, der auf der Interaktion zweier Programme (Excel als Frontend, R als Backend) basiert und moderne Programmierkonzepte wie Vektorisierung und Rapid Prototyping nutzt.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in eine detaillierte Beschreibung des Interfaces, der praktischen Anwendung der verschiedenen Menüpunkte sowie eine tiefgehende Erklärung des zugrunde liegenden Programm-Quellcodes in Visual Basic und R.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wesentliche Keywords sind SEMIR, Excel, R, statistische Datenanalyse, GUI-Design, Programmierung und Bedienungsfreundlichkeit.
Wie genau kommunizieren Excel und R in SEMIR miteinander?
Die Kommunikation erfolgt über einen DCOM-Server, der als Schnittstelle dient, um Daten und Befehle zwischen der Excel-Umgebung und dem im Hintergrund laufenden R-Prozess zu transferieren.
Ist SEMIR nur für einfache statistische Zwecke gedacht?
Obwohl es primär für Studienanfänger entwickelt wurde, bietet es durch die Skriptsprache R eine solide Basis für komplexere statistische Auswertungen, die über einfache Excel-Funktionen hinausgehen.
- Quote paper
- Markus Haas (Author), 2003, SEMIR - Statistical Excel Menu, Interacting with R, Munich, GRIN Verlag, https://www.grin.com/document/30228