Anpassung von Data Governance in Zeiten stärker wachsender Nutzung von Big Data


Hausarbeit, 2021

35 Seiten, Note: 1,0


Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Abkürzungen

Glossar

Kurzfassung

Schlagworte

1 Einführung
1.1 Problemstellung
1.2 Zielsetzung
1.3 Vorgehensweise

2 Stand der Wissenschaft
2.1 Data Analytics
2.2 Big Data
2.3 Data Governance

3 Big Data Governance

4 Herausforderungen
4.1 Datenarchitektur
4.2 Datenqualität
4.3 Datenschutz & Datensicherheit
4.4 Standardisierung
4.5 Verantwortlichkeiten & Rollen
4.6 Dokumentation & Wissenstransfer

5 Zusammenfassung

6 Fazit

Literaturverzeichnis

Internetquellen

Abbildungsverzeichnis

Abbildung 1: Relevante Ebenen von Big Data Governance

Abbildung 2: Relevanzfaktoren von Big Data Governance

Abkürzungen

Abbildung in dieser Leseprobe nicht enthalten

Glossar

Abbildung in dieser Leseprobe nicht enthalten

Kurzfassung

Datenanalysen werden heutzutage von vielen Unternehmen genutzt, um Erkenntnisse und verborgene Muster aus Daten zu gewinnen. Big Data erweitert diese Analyse durch große Datensätze, Echtzeitdaten, sowie semi- und auch unstrukturierte Daten.1

Big Data Technologien ermöglichen es Unternehmen dabei, diese zu erzeugen, sammeln, verwalten, analysieren und zu visualisieren und Erkenntnisse mittels Diagnosen, Vorhersagen oder anderen Methoden zur Entscheidungsfindung zu gewinnen.2 3

Doch mit Einzug neuer Technologien zur Verarbeitung und Analyse von großen und komplexen Daten entstehen auch neue Herausforderungen. Ein wichtiges Unterfangen hierbei ist die parallele Einführung eines geeigneten Big-Data-Governance-Frameworks, um bestehende oder hierfür neu zu erschaffenden Rahmenwerken an diese neuen Bedingungen anzupassen.4 5

Diese Arbeit beschäftigt sich mit den Anforderungen und der Relevanz an Big-Data-Governance- Konzepte im Hinblick auf die Verarbeitung und Analyse semi- und unstrukturierter Daten, die im Zuge einer Einführung angepasst, erweitert und umgesetzt werden sollten, um die Datenstrategie erfolgreich an diese neuen Anforderungen und Umstände anzupassen, sodass datengestützte Geschäftsentscheidungen auch innerhalb der regulatorischen Rahmenbedingungen umgesetzt werden können.6 7

Schlagworte

Big Data - Data Governance - Data Architecture - Data Quality - Data Privacy & Security - semi- & unstructured Data

1 Einführung

Dieses Kapitel8 gibt einen ersten Einblick in die Problemstellung des Themenkomplexes und zeigt die Eingrenzung der Thematik auf. Weiter werden die wissenschaftliche Herangehensweise und die Gliederung der Arbeit aufgezeigt.9

1.1 Problemstellung

Mit Einzug von Big Data sind auf viele Dinge zu achten, so auch eine Anpassung der Data- & Information-Governance-Strategie. Dies gestaltet sich jedoch als Komplex, da keine klaren Übersichten über relevante und anzupassende Faktoren gegeben sind. Die Frage ist, wie Data Governance mit Einzug von Big Data und der Verarbeitung von semi- und unstrukturierten Daten anzupassen ist.10

1.2 Zielsetzung

In dieser Arbeit soll eruiert werden, welche Auswirkungen Big Data auf Data Governance hat. Hierbei soll näher betrachtet werden, welche Relevanzfaktoren sich zur Anpassung bei der Nutzung von Echtzeitdaten, großen Datensätzen und vor allem semi- und unstrukturierten Daten für Data Governance ergeben und welche Herausforderungen hierbei berücksichtigt werden müssen. Ebenfalls werden Lösungsvorschläge für die dargestellten Herausforderungen aufgezeigt, um erstens eine Übersicht über relevante Faktoren zu erhalten und zweitens eine etwaige Implementierung zu erleichtern. Ziel soll es sein, einen kurzen und zusammengefassten Überblick über relevante Punkte zu geben.11

1.3 Vorgehensweise

Für eine bessere Übersicht dieser Arbeit werden technische Definitionen - wenn davon auszugehen ist, dass sie im Allgemeinen nicht bekannt sind - in einem Glossar aufgeführt und kurz erläutert. Worte und Namen, die im Glossar enthalten sind, werden beim ersten Auftreten im Text kursiv dargestellt. Werden Begrifflichkeiten mehrmals genannt, wird auf eine weiter folgende kursive Darstellung verzichtet. Verweise im Glossar werden zur Abgrenzung der eigentlichen Arbeit separat geführt und nummeriert.

Primär- und Sekundärliteratur wird verwendet, um den derzeitigen Stand der Wissenschaft in Kapitel 2 abzubilden. In Kapitel 3 werden die Anforderungen an Big Data Governance ebenfalls literaturgestützt herausgearbeitet und daraufhin Relevanzfaktoren definiert und strukturiert, um die damit einhergehenden Herausforderungen und Lösungsansätze in Kapitel4aufzuzeigen. Auf eine Gewichtung der Kriterien wird dabei bewusst verzichtet, da diese hier generalisiert und nicht Anwendungsfall-spezifisch betrachtet werden und somit originär eine identische Kritikalität mit sich bringen.In Kapitel 5 wird eine Zusammenfassung der Erkenntnisse aus Kapitel 4 dargestellt und ein abschließendes Fazit in Kapitel 6 gezogen.

2 Stand der Wissenschaft

In diesem Kapitel wird der aktuelle Forschungsstand des Themenkomplexes Data Analytics, Big Data, sowie Data Governance aufgezeigt.

2.1 Data Analytics

Unter Data Analytics (Datenanalyse) werden allgemein Prozesse, Technologien, Frameworks und Algorithmen verstanden, um Erkenntnisse aus Daten zu gewinnen.12

Rohdaten haben oftmals keinen Informationsgehalt, bis diese kontextbasiert zu Informationen aufbereitet werden. Der Prozess umfasst unter anderem die Extraktion von Informationen durch Filterung, Verarbeitung, Kategorisierung und Verdichtung der Rohdaten, worauf die daraus gewonnenen Informationen dann organisiert und strukturiert werden, um Wissen mit Hinblick auf die gegebene Zielsetzung zu generieren. Je nach Zieldefinition werden spezielle Methoden verwendet, um die Vorhersage von Ereignissen, das Auffinden von Mustern oder Zusammenhängen in den Daten zu bewerkstelligen.13 Für eine erfolgreiche Informationsgewinnung werden die Daten im Vorfeld kategorisiert und katalogisiert, um einen Überblick über die Daten zu erhalten.14

Mittels Datenanalyse und den daraus gewonnenen Erkenntnissen sind Unternehmen in der Lage, Prozesse zu optimieren, Probleme zu identifizieren, Kosten zu optimieren, fundierte Geschäftsentscheidungen zu treffen, sowie Kundenbedarfe und Markttrends für verbesserte Produkte und Dienstleistungen zu nutzen.15

2.2 Big Data

Big Data hat in den letzten Jahren stark an Popularität gewonnen und beschreibt grob die Verarbeitung und Nutzung komplexer Daten zur Informationsgewinnung. Diese Daten können aus unterschiedlichsten Quellen, wie Social-Media-, E-Commerce-Systemen, Wearables, Smartphones oder medizinischen Geräten stammen und bestehen aus komplexen strukturierten, semi-, sowie unstrukturierten Daten, die die Verarbeitungsleistung klassischer relationaler Datenbanksysteme oder Data Warehouses (DWH) übersteigen.16 Hierbei ist anzumerken, dass moderne DWH (und vor allem cloudbasierte Systeme) mittlerweile sehr wohl in der Lage sind, semistrukturierte Daten, wie CSV -, PARQUET -, oder JSON -Dateien, zu verarbeiten, jedoch mit unstrukturierten Daten, wie Textdateien, Bilder, oder Audio- und Videodateien, meist noch nicht umgehen können.17

Big Data kann als Baustein zur Lösung aktueller Analyseprobleme genutzt werden, die mit Big Data einhergehen und die Anwender zwingt, neue Werkzeuge und Modelle für die Verwaltung zu nutzen, um externe und interne Informationsflüsse zu kontrollieren und zielorientiert einzusetzen.18 Hierzu werden verteilte, parallele, sowie cloudbasierte Verarbeitungsarchitekturen eingesetzt, die Speicher- und Rechenressourcen über eine große Anzahl von Clustern hinweg nutzbar machen.19

Eine genaue Definition von Big Data ist nach derzeitigem wissenschaftlichem Stand nicht gegeben, da es sich hierbei weder direkt um eine Technologie noch um ein Geschäftsmodell handelt.20

IBM beschreibt Big Data als eine Analyseform für Datensätze, deren Größe oder Art die Fähigkeit traditioneller relationaler Datenbanken übersteigt, diese mit geringer Latenz zu erfassen, zu verwalten und zu verarbeiten.21

Oracle versteht unter Big Data große und komplexe Datensätze aus neuen Datenquellen. Mittels der Analyse dieser Daten bieten sich neue Möglichkeiten zur Lösung von Geschäftsproblemen, die mit klassischen Datenquellen nicht umgesetzt werden können.22

2013 beschreibt Gartner Big Data anhand drei Dimensionen, welche die Grundlage von aktuellen Big Data Definitionen bildete.23 Eine derzeit gängige, erweiterte Definition von Big Data mit fünf Dimensionen sieht wie folgt aus:24

Volume

Bis zum Jahre 2025 soll das Volumen an jährlich generierten Daten weltweit von 33 Zettabyte (2018) bis auf 175 Zettabyte anwachsen.25 Zwar gibt es keinen festen Schwellenwert für das Datenvolumen von Big Data, wird jedoch in der Regel generell für Massendaten verwendet, die mit herkömmlichen Methoden, Datenbanken und Datenarchitekturen nur schwer zu speichern, zu verwalten und zu verarbeiten sind.26

Velocity

Velocity meint die Frequenz der zur Verarbeitung neu eingehenden Daten, was stark zum exponentiellen Wachstum dieser beiträgt. Bedingt durch strenge und zeitlich begrenzte Verarbeitungsfristen bei bestimmten Systemen, wie im Bankensektor, müssen viele Daten in oder nahezu in Echtzeit analysiert und ausgewertet werden.27

Variety

Variety meint hier die Vielfalt der unterschiedlichen Daten, die im Kontext von Big Data in strukturierter Form aus relationalen Datenbanken, oder in semi- und unstrukturierter Form aus Social-Media-Systemen, aus Sensorgeräten oder ähnlichen Geräten, gewonnen werden können.28 Text- und Audiodateien oder Webprotokolle sind nur einige Beispiele für Datentypen von Big Data - alles, was erfasst werden kann, jedoch kein Metadatenmodell besitzt und nicht in klassischen, relationalen Datenbanken ausgewertet werden kann.29 Die Speicherung, Verwaltung und Nutzung unstrukturierter Daten ist ein Hauptbestandteil von Big-Data-Konzepten.30

Veracity

Hiermit ist die Glaubwürdigkeit der Daten gemeint. Um einen Nutzen aus den unterschiedlichsten Daten generieren zu können, müssen diese erst bereinigt und aufbereitet werden, um eine qualitative Ausgangsbasis für die Auswertung und Extraktion von Informationen sicherzustellen.31

Value

Der Wert der Daten meint hier die Nutzbarkeit für den zu beabsichtigten Zweck und steht in direkter Verbindung zur Glaubwürdigkeit und Genauigkeit der Daten. Wenn Daten für einen angestrebten Zweck nicht genutzt werden können, haben diese de facto auch keinen Wert für die Zielerreichung.32

2.3 Data Governance

Data Governance umfasst Rollen, Methoden, Prozesse und Technologien, die für die Verwaltung und den Schutz der Datenbestände des Unternehmens erforderlich sind, um allgemein verständliche, vertrauenswürdige, sichere und auffindbare Unternehmensdaten zu gewährleisten.33

Der Fokus liegt auf Daten aus allen Datensystemen. Da operative und technische Verantwortlichkeiten auf Ebenen der einzelnen Systeme abgedeckt werden, muss eine übergreifende und zentrale Sicht auf die Daten umgesetzt werden. Data Governance wird dabei als Steuerungsmechanismus für die Datenstrategie genutzt.34

Eine geeignete Datenstrategie orchestriert die Umsetzung der Geschäftsstrategie in puncto Daten und Analytik. Dies ermöglicht Unternehmen eine gezielte Wertschöpfung und steuert die Datennutzung über alle Geschäftsprozesse hinweg, um Effizienz und Innovation zu fördern. Data Governance ist weiter erforderlich, um eine Datenstrategie zu implementieren, einschließlich Richtlinien und Frameworks zur Verwaltung, Überwachung und zum Schutz des Datenkapitals unter Berücksichtigung aller Rollen, Prozessen und Technologien.35

Die Etablierung von Data Governance ist dabei als langfristiges Unterfangen anzusehen und betrifft mehrere Ebenen in Unternehmen. Um Daten im Unternehmenskontext und in Abstimmung mit anderen Datenprojekten effizient zu organisieren und zu nutzen, müssen Data-Governance-Programme als ein fortlaufender, iterativer Prozess behandelt werden. Vor allem erfordert dies eine klare, bewusste Entscheidung des Managements, wie mit Daten gearbeitet und diese genutzt werden sollen.36

Data Governance erstreckt sich über den kompletten Datenlebenszyklus, von der Aufnahme über die Löschung der Daten hinweg. Ziel ist es, die richtigen Daten den richtigen Beteiligten für eine einfache und sichere Verwendung bereitzustellen, ohne dabei regulatorische, branchenbasierte, unternehmensbasierte oder länderbasierte Standards, zu verletzen.37

Des Weiteren ist Data Governance für die korrekte, konsistente und aktualisierte Datenübermittlung verantwortlich. Hierbei muss der Zugriff auf die erforderlichen Daten gewährleistet sein, jedoch dürfen nur berechtigte Nutzer auf spezifische Daten zugreifen, die für die Tätigkeit benötigt werden. Jeglicher Zugriff auf die Daten muss protokollier- und nachvollziehbar, für Echtzeit-, sowie nachgelagerte Auswertungen, sein.38

Mittels Data Governance soll ebenfalls das Vertrauen in die Daten gestärkt werden, was als grundlegende Voraussetzung für eine glaubwürdige Entscheidungsfindung und Risikobewertung in einem Unternehmen zu sehen ist.39

3 Big Data Governance

Soares (2013) definiert Big Data Governance als umfassendes Information-Governance- Programm zum Schutz, zur Optimierung und Monetarisierung von Big Data und sollte unter Einbindung mehrerer Funktionsbereiche innerhalb einer Organisation betrachtet werden.40 Unternehmen sollten bestehende Data-Governance-Programme für Big Data erweitern oder neu aufsetzen, falls nicht vorhanden, um den Zugang zu Daten, deren Integration, sowie die Verwaltung dieser, sicherzustellen.41

Die Vorteile von datengestützten Geschäftsentscheidungen beruhen in erster Linie auf der Glaub- und Vertrauenswürdigkeit der Daten, nur dann können die extrahierten Erkenntnisse verifizierbar zu Analysezwecken eingesetzt werden. Die traditionelle Aufgabe von Data Governance wird hierfür im Kontext von Big Data erweitert, um Informationen mit hoher Qualität auch aus unstrukturierten, bzw. großen Datenmengen zu schaffen.42

Nach DAMA DMBOK2 (2017) und Ladley (2012) besteht Data Governance aus mehreren Ebenen. Darunter fällt die Verwaltung und Integration der Datenarchitektur, die Verifizierung der Datenqualität, das Metadatenmanagement, die Stammdatenverwaltung (MDM), Datenschutz & Sicherheit, sowie die Datenmodellierung und die Anpassung an die betrieblichen Abläufe.43

Für eine Adaptierung werden die Ebenen von Data Governance restrukturiert und an die Herausforderungen von Big Data Governance angepasst (siehe Abbildung 1: Relevante Ebenen von Big Data Governance).

Abbildung 1: Relevante Ebenen von Big Data Governance33

Abbildung in dieser Leseprobe nicht enthalten

Dabei liegt das Hauptaugenmerk auf der Einbindung von Big Data in die Unternehmensarchitektur, sowie der Sicherstellung der Datenqualität, dem Schutz und der Sicherheit aller Daten, die aus einer Vielzahl von internen und externen Quellen stammen. Eine Herausforderung ist der Aufbau einer einheitlichen Sichtweise und Verwendung der Daten, um diese für betriebliche Abläufe transparent nutzen zu können. Ebenfalls die Verwertung von semi- und unstrukturierten Daten, da diese in Rohform meist nicht für qualitative Analysezwecke verwendet werden können. Diese Datentypen müssen zuerst aufwendig aufbereitet, kuratiert und strukturiert werden, um diese für eine Problemlösung zu verwenden.44 45

Durch standardisierte Prozesse, Verantwortlichkeiten und Vorgänge kann jedoch das Vertrauen in die Daten wachsen, wenn diese qualitätsgesichert, zertifiziert und dokumentiert vorliegen. Ebenfalls wächst die Sicherheit für Datenquellen durch Verifizierung dieser und minimiert somit ebenfalls die Aufwände für Audits oder der Einhaltung von Compliance-Richtlinien.46

[...]


1 Vgl. Burk et al. (2021): S. 109.

2 Vgl. DAMA-DMBOK2 (2017): S. 381.

3 Vgl. Ghavami, P. (2021): S. 52

4 Vgl. Hurwitz et al. (2013): S. 112f.

5 Vgl. Roman et al. (2011).

6 Vgl. Hurwitz et al. (2013): S. 92.

7 Vgl. Microsoft (2021).

8 Vgl. Hurwitz et al. (2013): S. 187.

9 Vgl. Roman et al. (2011).

10 Vgl. Bagha et al. (2019): S. 314.

11 Vgl. Ghavami, P. (2021): S. 131.

12 Vgl. Tsai et al. (2015).

13 Vgl. Tsai et al. (2015).

14 Vgl. Bagha et al. (2019): S 22ff.

15 Vgl. Ballard, C. et al. (2014): S. 6f.

16 Vgl. Hung, P. (2016); S. 1f.

17 Vgl. Azure Synapse Analytics (2021); Amazon Redshift (2021); Snowflake (2021).

18 Vgl. Morabito (2015): S. viii.

19 Vgl. Bagha et al. (2019): S. 25.

20 Vgl. Dorschel, J. (2015): S. 1ff.

21 Vgl. IBM (2021).

22 Vgl. Oracle (2021).

23 Vgl. Gartner (2013).

24 Vgl. Duygu et al. (2015).

25 Vgl. Statista (2020).

26 Vgl. Bagha et al. (2016): S. 26.

27 Vgl. Katal et al. (2013): S. 404.

28 Vgl. Bagha et al. (2016): S. 26.

29 Vgl. Chen et al. (2013).

30 Vgl. Katal et al. (2013): S. 404.

31 Vgl. Bagha et al. (2016): S. 27.

32 Vgl. Bagha et al. (2016): S. 27.

33 Vgl. Dama DMBOK2 (2017): S. 67f.

34 Vgl. Ladley, L. (2012): S. 11.

35 Vgl. DAMA DMBOK2 (2017): S. 67f.

36 Vgl. Bange, C. (2020): S. 21ff.

37 Vgl. Ladley, L. (2012): S. 11.

38 Vgl. Eryurek (2021): S. 9f.

39 Vgl. DAMA DMBOK2 (2017): S. 67f.

40 Vgl. Soares, S. (2013).

41 Vgl. Morabito, V. (2015): S. 85.

42 Vgl. Vincenzo, M. (2015); S. 83f.

43 Vgl. DAMA DMBOK2 (2017): S. 67f; Ladley, L. (2012): S. 11ff.

44 Quelle: Eigene Darstellung - in Anlehnung an DAMA DMBOK2 (2017).

45 Vgl. Morabito, V. (2015): S. 83f.

46 Vgl. Ghavami, P. (2021): S. 22f.

Ende der Leseprobe aus 35 Seiten

Details

Titel
Anpassung von Data Governance in Zeiten stärker wachsender Nutzung von Big Data
Hochschule
FOM Hochschule für Oekonomie & Management gemeinnützige GmbH, Stuttgart
Note
1,0
Autor
Jahr
2021
Seiten
35
Katalognummer
V1138426
ISBN (eBook)
9783346514585
ISBN (Buch)
9783346514592
Sprache
Deutsch
Schlagworte
Data Governance, Data Security, Big Data, unstrukturierte Daten, Data Quality, Data Architecture, unstrucured data, semi structured data
Arbeit zitieren
Simon Schilling (Autor:in), 2021, Anpassung von Data Governance in Zeiten stärker wachsender Nutzung von Big Data, München, GRIN Verlag, https://www.grin.com/document/1138426

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Anpassung von Data Governance in Zeiten stärker wachsender Nutzung von Big Data



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden