In dieser Arbeit soll eine Spracherkennungs- und Sprachsteuerungssoftware für eine Business-Intelligence-Anwendung konzipiert und als Prototyp umgesetzt werden. Die Software soll durch eine natürliche Sprache die Interaktion mit einer Business-Intelligence-Anwendung ermöglichen. Dabei soll die Business-Intelligence-Anwendung Sprachbefehle erkennen sowie interpretieren und im Anschluss anhand einer passenden Visualisierung entsprechende Auswertungen dynamisch darstellen.
Folgende Anforderungen sollte die Prototyp-Software dabei erfüllen:
• Natürliche Spracherkennung: Die Software soll natürlich gesprochene Sätze erkennen. Der Sprecher muss dabei keine künstlichen Pausen zwischen den einzelnen Wörtern einlegen.
• Einfache Sprachsteuerung: Die Navigation innerhalb der Business-Intelligence-Anwendung soll intuitiv mit Sprache ermöglicht werden.
• Intelligente Visualisierung: Je nach Fragestellung soll eine passende Visualisierung ausgewählt und automatisch dargestellt werden, womit eine leichte und fehlerfreie Interpretation der Daten ermöglicht wird.
Nach der Einleitung mit Zielsetzung und Abgrenzung werden in Kapitel 2 die theoretischen Grundlagen erörtert. Dazu werden zunächst die menschliche Sprache, die Spracherkennung und die Mensch-Computer-Interaktion (MCI) vorgestellt. Danach werden virtuelle Assistenten untersucht und auch die Begriffe Usability sowie Responsive Webdesign erläutert. Das Kapitel zu den theoretischen Grundlagen wird mit der Vorstellung von den Möglichkeiten, die sich durch HTML5 und CSS3 sowie JavaScript und die Web Speech API ergeben, abgeschlossen.
In Kapitel 3 werden die unterschiedlichen Methoden für eine optimale Visualisierung von Daten untersucht. Im Anschluss wird in Kapitel 4 zuerst der Begriff Business Intelligence allgemein definiert und anschließend die Business-Intelligence-Plattform Qlik Sense näher vorgestellt. In Kapitel 5 findet die Konzeption der Sprachsteuerungssoftware für die Business-Intelligence-Anwendung statt. Danach werden im Kapitel 6 die Ergebnisse aus der Realisierung der Software abgebildet. Abschließend finden im letzten Kapitel eine kritische Würdigung sowie ein Ausblick auf weitere Einsatzmöglichkeiten statt.
Inhaltsverzeichnis
1 Einleitung
1.1 Motivation
1.2 Zielsetzung dieser Arbeit
1.3 Abgrenzung
1.4 Aufbau der Arbeit
2 Theoretische Grundlagen
2.1 Menschliche Sprache
2.2 Spracherkennung
2.2.1 Spracherkennung mit Mustervergleich
2.2.2 Statistische Spracherkennung
2.2.3 Künstliche neuronale Netze
2.3 Mensch-Computer-Interaktion
2.4 Virtuelle Assistenten
2.5 Usability und Responsive Webdesign
2.6 HTML5 und CSS3
2.7 JavaScript und die Web Speech API
3 Visualisierung von Daten
4 Business-Intelligence-Plattform Qlik Sense
4.1 Allgemeine Informationen
4.2 In-Memory-Technologie und das assoziative Modell
4.3 Datenbeschaffung und Datenmodellierung
4.4 Übersicht Qlik Engine API und Capability APIs
5 Konzeption der Sprachsteuerungssoftware
5.1 Allgemeine Informationen
5.2 Funktionale und nichtfunktionale Anforderungen
5.3 Anbindung der Spracherkennungskomponenten
5.4 Prüfung der Genauigkeit des Web Speech API
5.5 Anbindung der Qlik-Sense-Applikation
5.6 Ermittlung und Darstellung der Chart-Objekte
5.7 Gestaltung der Webanwendung
5.8 Architektur der Webanwendung
6 Realisierung der Sprachsteuerungssoftware
6.1 Anbindung der APIs
6.2 Ermittlung und Darstellung der Chart-Objekte
6.3 Layout der Webanwendung
6.4 Bewertung der Webanwendung
7 Kritische Würdigung und Ausblick
Zielsetzung & Themen
Das Hauptziel dieser Masterthesis ist die Konzeptionierung und die prototypische Realisierung einer Sprachsteuerungssoftware für die Business-Intelligence-Plattform Qlik Sense. Die Arbeit untersucht dabei, wie durch natürliche Spracheingaben die Interaktion mit BI-Daten effizienter gestaltet werden kann, um eine dynamische und intuitive Visualisierung zu ermöglichen.
- Grundlagen der Spracherkennung und Mensch-Computer-Interaktion (MCI)
- Einsatzmöglichkeiten von virtuellen Assistenten in Business-Intelligence-Umgebungen
- Technische Implementierung einer sprachgesteuerten Weboberfläche mittels Web Speech API und Qlik APIs
- Methoden der datengesteuerten Visualisierung und deren automatisierte Auswahl
- Bewertung der Benutzerfreundlichkeit und Anwendbarkeit der entwickelten Lösung
Auszug aus dem Buch
1.1 Motivation
„Sprache ist der Schlüssel zur Welt.“ (Wilhelm von Humboldt)
Dieses Zitat von Wilhelm von Humboldt, Schriftsteller und Gründer der Universität in Berlin, zeigt die Wichtigkeit von Sprache auf. Menschen kommunizieren und tauschen sich hauptsächlich mit ihrer Hilfe untereinander aus. Dennoch findet Sprache erst nach der Tastatur und der Maus sowie den Touchscreens und Gesten Einzug in die Kommunikation mit Computern.
Wird die Entwicklung der Ein- und Ausgabemedien zur Kommunikation mit Maschinen bzw. Computern betrachtet, so lässt sich erkennen, dass die Durchdringung einer neuen Technologie mehrere Jahre oder sogar Jahrzehnte benötigt. Während die ersten Rechenmaschinen im 18. Jahrhundert mittels Lochkarten gesteuert wurden, konnte 1948 erstmals eine elektrische Tastatur zur schnelleren und besseren Datenerfassung beitragen. Doch erst mit einer Erfindung des Massachusetts Institute of Technology (MIT) der Technischen Hochschule und Universität in Cambridge, USA, aus dem Jahr 1964 konnte sich die Tastatur durchsetzen. Das MIT kombinierte das Eingabegerät Tastatur mit einem Ausgabegerät, dem Röhrenbildschirm. Dadurch ließen sich die Eingaben direkt prüfen und verarbeiten.
Im Dezember 1968 wurde die Maus als Eingabegerät von ihrem Erfinder Douglas Engelbart vorgestellt. Doch erst mit der Weiterentwicklung der graphischen Anwendungen, der günstigeren industriellen Herstellung und einem darauf ausgelegten Betriebssystem konnte sich die Maus als Kommunikationsmittel etablieren. Ermöglicht wurde dies durch die Entwicklung des Macintoshs von Apple und dessen erfolgreiche Einführung im Jahr 1984.
Zusammenfassung der Kapitel
1 Einleitung: Beschreibt die historische Entwicklung der Mensch-Computer-Interaktion, führt in das Thema der Sprachsteuerung in BI-Anwendungen ein und erläutert Zielsetzung sowie Aufbau der Arbeit.
2 Theoretische Grundlagen: Erörtert theoretische Ansätze der Spracherkennung, Mensch-Computer-Interaktion und Webtechnologien wie HTML5, CSS3 und die Web Speech API.
3 Visualisierung von Daten: Untersucht verschiedene Methoden und Kataloge zur effizienten Visualisierung von Daten und zur Auswahl passender Diagrammtypen.
4 Business-Intelligence-Plattform Qlik Sense: Stellt die Architektur, die In-Memory-Technologie, das assoziative Modell sowie die spezifischen APIs der Qlik Sense-Plattform vor.
5 Konzeption der Sprachsteuerungssoftware: Definiert die Anforderungen, die Softwarearchitektur und das Konzept für die Anbindung der Spracherkennungs- und Qlik-Schnittstellen für den Prototyp.
6 Realisierung der Sprachsteuerungssoftware: Beschreibt die konkrete technische Umsetzung der Sprachsteuerung, die Anbindung der APIs, das Layout sowie die Bewertung der Anforderungen.
7 Kritische Würdigung und Ausblick: Reflektiert die Ergebnisse der Arbeit und gibt einen Ausblick auf die Weiterentwicklung der Sprachsteuerung in der Business Intelligence.
Schlüsselwörter
Spracherkennung, Sprachsteuerung, Business Intelligence, Qlik Sense, Web Speech API, Mensch-Computer-Interaktion, Datenvisualisierung, Assoziatives Modell, Prototyp, Webanwendung, Responsive Webdesign, Benutzeroberfläche, Künstliche Intelligenz, Softwareentwicklung, Sprachassistent
Häufig gestellte Fragen
Worum geht es in dieser Masterthesis grundsätzlich?
Die Arbeit befasst sich mit der Konzeption und Entwicklung einer Softwarelösung, die es ermöglicht, Business-Intelligence-Anwendungen, speziell Qlik Sense, mittels natürlicher Sprache zu steuern und Daten dynamisch zu visualisieren.
Was sind die zentralen Themenfelder der Arbeit?
Die zentralen Themen umfassen die Spracherkennung (Web Speech API), die Mensch-Computer-Interaktion, moderne Webtechnologien sowie die effiziente Datenvisualisierung im Kontext von BI-Plattformen.
Was ist das primäre Ziel oder die Forschungsfrage der Arbeit?
Das Ziel ist die Realisierung eines Prototyps, der durch natürliche Sprachbefehle die Interaktion mit Daten ermöglicht, um die Bedienung von BI-Tools intuitiver und effizienter zu gestalten.
Welche wissenschaftliche Methode wurde für die Arbeit verwendet?
Die Arbeit basiert auf einer theoretischen Fundierung durch Literaturanalyse und einer praktischen Implementierungsmethode, bei der ein Prototyp entwickelt und anschließend auf Basis definierter funktionaler und nichtfunktionaler Anforderungen evaluiert wurde.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil behandelt die theoretischen Grundlagen, die Analyse von Visualisierungskatalogen, die Funktionsweise der Qlik-Sense-Plattform und detailliert die Konzeption sowie die technische Umsetzung der Sprachsteuerungssoftware.
Welche Schlüsselwörter charakterisieren diese Arbeit?
Die Arbeit wird primär durch Begriffe wie Spracherkennung, Qlik Sense, Sprachsteuerung, Datenvisualisierung und Business Intelligence charakterisiert.
Warum wurde für den Prototyp die Web Speech API gewählt?
Die Web Speech API wurde gewählt, um eine Lösung zu konzipieren, die keine externe Internetanbindung oder Benutzeranmeldung bei Drittanbietern erfordert, was besonders für deutsche Unternehmen von Relevanz ist.
Welche Rolle spielt das assoziative Modell von Qlik in der Arbeit?
Das assoziative Modell dient als Grundlage, um Datenbeziehungen über mehrere Quellen hinweg zu analysieren, was für die dynamische Generierung von Visualisierungen auf Basis von Sprachabfragen essenziell ist.
Wie wurde die Genauigkeit der Spracherkennung geprüft?
Es wurde ein Testszenario mit zehn Personen durchgeführt, die jeweils zehn Wörter und Sätze vorgesprochen haben, um die Erkennungsraten sowohl für einzelne Begriffe als auch für vollständige Sätze statistisch zu erfassen.
- Quote paper
- Mehmet Gençsoy (Author), 2018, Konzeptionierung und Realisierung einer Spracherkennungs- und Sprachsteuerungssoftware für Business-Intelligence-Anwendungen, Munich, GRIN Verlag, https://www.grin.com/document/425392