Problemstellung und Herausforderung von Big Data. Wie lässt sich Big Data mit dem Datenschutz vereinbaren?


Bachelorarbeit, 2017
38 Seiten, Note: 1,0
Nina Gerlt (Autor)

Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Abkürzungsverzeichnis

1 Einleitung

2 Grundlagen zu den Begriffen Big Data und Datenschutz
2.1 Big Data
2.1.1 Definition
2.1.2 Potenzial
2.1.3 Anwendungsbereiche
2.2 Datenschutz
2.2.1 Was ist Datenschutz überhaupt?
2.2.2 Prinzipien

3 Zusammenführung von Big Data und Datenschutz
3.1 Problemstellung und Herausforderung
3.2 Lösungsansätze
3.2.1 Datenschutzkontrolle
3.2.2 Anonymisierung
3.2.3 Pseudonymisierung
3.2.4 Privacy by Design

4 Kritische Analyse

5 Fazit und Ausblick

Literaturverzeichnis

Abbildungsverzeichnis

Abb. 1: Die vier Dimensionen von Big Data

Abb. 2: Big Data und die Prinzipien des Datenschutzrechts

Abb. 3: Die klassische Anonymisierung

Abb. 4: Die klassische Pseudonymisierung

Abb. 5: Die 7 Prinzipien von "Privacy by Design"

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

Das Thema Big Data, vor allem in Verbindung mit dem Datenschutz, wird aktuell wieder umfassend in den Medien diskutiert. Grund für diese Diskus- sion ist ein Artikel aus dem „Magazin“ des Schweizer „Tagesanzeigers“, der sich mit der Frage beschäftigt: „Wie zum Teufel konnte Donald Trump die Wahl gewinnen?“. Dieser Artikel liefert eine Antwort: Big Data. Lt. Kernaus- sage dieses Artikels, soll die Analyse-Firma Cambridge Analytica aus Washington DC, USA mit der Hilfe von personenbezogenen Daten die see- lische Verfassung der Amerikaner so analysiert haben, dass sie jeden denkbaren Wähler die Nachrichten des Kandidaten, je nach Persönlichkeit, vermitteln konnte.1 Cambridge Analytica hat also von jeden potenziellen US-Wähler ein psychologisches Profil angelegt.2 Dieser Artikel zeigt, wie wichtig aber auch riskant die Verwendung von „Big Data“ sein kann, ganz besonders wenn ein Augenmerk auf den Datenschutz geworfen wird.

Die Verwendung von Big Data ist besonders für Unternehmen in der heuti- gen Zeit nicht mehr wegzudenken. Aber auch jede Privatperson weiß, ohne die Daten, die weltweit verfügbar gemacht werden, ist so gut wie gar nichts mehr möglich.3 Mit jedem Online-Einkauf, mit jeder Eingabe in das Naviga- tionsgerät oder auch durch die Verwendung von GPS der sog. „Smart- Phones“ können Daten verwendet und ausgewertet werden. Das Problem dabei ist jedoch, dass der Großteil der Bevölkerung nicht weiß, ob welche und wie viele Daten überhaupt von sich veröffentlicht, verwendet und ver- arbeitet werden. Dies wirft schließlich die Kernfrage dieser Arbeit auf: „Hat nicht jeder Mensch das Recht auf informationelle Selbstbestimmung?“

Aufgrund dieser Überlegungen ist nun das Ziel dieser Arbeit, zu verdeutlichen, wie Big Data mit den Grundsätzen des aktuellen Datenschutzrechtes verwendet werden kann, ohne die Persönlichkeitsrechte der betroffenen Personen maßlos zu verletzen.

Der Aufbau dieser Arbeit ist wie folgt gegliedert. Nach der Einleitung folgt Kapitel 2, in welchem der theoretische Rahmen der vorliegenden Arbeit dargelegt und betrachtet wird. Kapitel 2 ist in zwei Unterkapitel mit den Ti- teln „Big Data“ und „Datenschutz“ aufgeteilt. In Bezug auf den Begriff „Big Data“ in Kapitel 2.1, wird zunächst ein Augenmerk auf die Definition gewor- fen. Insbesondere wird hier auf die vier V‘s eingegangen, welche für die nähere Begriffsdefinition notwendig sind. Im weiteren Verlauf wird außer- dem ein Blick auf das Potenzial und die Anwendungsbereiche von Big Data geworfen. In Kapitel 2.2 wird der Begriff Datenschutz kurz erläutert und außerdem mithilfe der Prinzipien des Datenschutzes differenziert. Der Hauptteil dieser Arbeit beschäftigt sich mit der Zusammenführung von Big Data und Datenschutz in Kapitel 3. Hier wird insbesondere auf die Heraus- forderungen und Lösungsansätze bei der Verwendung von Big Data unter Berücksichtigung des Datenschutzes eingegangen. In Kapitel 4 erfolgt an- schließend eine kritische Analyse in Bezug auf die dargestellte Problem- stellung und Ihre Lösungsansätze. Abschließend wird in Kapitel 5 ein Fazit gezogen und ein Zukunftsausblick gegeben.

2 Grundlagen zu den Begriffen Big Data und Datenschutz

2.1 Big Data

2.1.1 Definition

Der Begriff „Big Data“ ist ein Begriff der bereits seit einigen Jahren weit verbreitet ist und auf verschiedene Weisen definiert wird. Daher lässt sich zunächst grundsätzlich sagen, dass es keine exakte Definition von Big Data gibt. Dennoch möchte der Autor im Folgenden die für Ihn zutreffendste Definition von Big Data zitieren:

„‚Big Data‘ steht für große Datenmengen, die über das Internet oder anderweitig gesammelt, verfügbar gemacht und ausgewertet werden. Viele der Daten sind personenbezogen. Sie lassen sich, herausgelöst aus den ursprünglichen Erhebungskontexten, zu beliebigen Zwecken nutzen, z. B. um statistische Trends zu erkennen.“4

Die großen Mengen an Daten, die heute tagtäglich anfallen und exponenti- ell anwachsen, bilden die Grundlage von Big Data.5 Bereits im Jahr 2012 gab es lt. einer Studie weltweit mehr als 2,8 Zettabyte an Daten.6 Bis 2020 soll sich die Menge an Daten auf ca. 40 Zettabyte weltweit erhöhen.7 1 Zettabyte entspricht 1 Billion Gigabyte, umgerechnet in Byte ergibt dies eine Zahl aus einer 1 mit 21 Nullen.8 Zudem lässt sich sagen, dass Big Da- ta ein Sammelbegriff für Daten ist, die zu umfangreich sind, um auf einen einzigen Server Platz zu haben.9 Sie sind außerdem zu unstrukturiert, um in das Format einer Datenbank wie z.B. Excel, zu passen.10 Das Ziel bei der Anwendung von Big Data ist es nun, diese Daten trotzdem zu spei- chern und schnellstmöglich zu verarbeiten, um zeitnah nützliche und vor allem neue Informationen zu gewinnen.11

Wie bereits einleitend angesprochen, wird Big Data außerdem mithilfe der drei bzw. vier V’s definiert (Vgl. Abb. 1 Die vier Dimensionen von Big Data). Wobei die drei ersten V’s das Grundgerüst bilden. Die drei V’s stehen hier für Volume (Datenmenge), Velocity (Geschwindigkeit), Variety (Vielfalt) ergänzt um das vierte V Veracity (Wahrhaftigkeit). Im Folgenden wird der Autor nun auf die o.g. Eigenschaften bzw. Charakteristika12 von Big Data eingehen.

Abb. 1: Die vier Dimensionen von Big Data.

Abbildung in dieser Leseprobe nicht enthalten

(Schroeck/Shockley/Smart et al. 2012)

Volume

Das erste V für Volume steht im Zusammenhang mit Big Data für immer größere Datenmengen, die von Unternehmen analysiert werden können. Es handelt sich hierbei um Datenmengen die kontinuierlich weiter wach- sen.13 King beschreibt Volume als eine große Menge an Daten welche ge- managt und analysiert werden muss. Sie erklärt außerdem, dass der Um- fang der Daten steigt, je höher die Anzahl der Quellen und die Höhe der Datentiefe ist.14 Als Beispiel für große Datenmengen dient das bekannteste und wohl auch größte soziale Netzwerk Facebook, welches weltweit über 1 Mrd. Nutzer verzeichnet.15 Die aktiven Nutzer in Facebook vergeben pro Minute ca. 35.000 Likes an Vereine, Organisationen oder Hersteller und erzeugen mehr als 650.000 Inhalte wie z.B. Statusbeiträge, Fotos oder Videos.16

Velocity

Unter dem zweiten V, Velocity, wird die Geschwindigkeit der Daten ver- standen. Zum einen steht die Geschwindigkeit für die Aktualität der Daten und zum anderen geht es in diesem Zusammenhang um die schnelle Ge- schwindigkeit der Verarbeitung.17 Bei vielen Anwendungen wird ein größe- rer Wert auf die Geschwindigkeit der Daten (Velocity), als auf die große Menge der Daten (Volume) gelegt. Dies resultiert aus der Aussage, dass die Echtzeit- bzw. nahezu Echtzeit-Informationen den Unternehmen die Möglichkeit geben, flexibler zu reagieren als der Wettbewerb.18 Dement- sprechend kann man also festhalten, dass die Geschwindigkeit, mit der Daten erzeugt, verarbeitet und analysiert werden, ständig zunimmt.19 Die Ursache für eine ständige Zunahme der Geschwindigkeit ist nicht nur der Echtzeitgewinnung zuzuschreiben, sondern diese ergibt sich auch aus der Notwendigkeit die Datenströme in die Prozesse eines Unternehmens ein- zubinden und zudem in die Entscheidungsfindung zu integrieren.20

Variety

Variety, das dritte V, beschreibt zunächst die Vielfalt verschiedener Daten- strukturen und außerdem die Passgenauigkeit der Daten.21 In Relation mit Big Data versteht man unter dem Begriff „Vielfalt“ die Speicherung von strukturierten, semi-strukturierten und unstrukturierten Daten, welche welt- weit verfügbar gemacht werden.22 Semi-strukturierte Daten sind Daten, welche zum einen Teil strukturiert und zum anderen Teil unstrukturiert sind. Als Beispiel dient hier eine E-Mail. Der Kopf dieser E-Mail, welcher Daten wie die E-Mail Adresse und Namen des Absenders bzw. Empfängers bein- haltet ist grundsätzlich strukturiert. Der eigentliche Textteil der E-Mail ist hingegen unstrukturiert. Diese stark variierenden Daten, können zu höchst unterschiedlichen Zwecken gespeichert werden. Daraus folgt, dass die möglichen Inhalte und Formate besonders vielfältig sein können. Ein Groß- teil dieser gewonnenen Daten ist unstrukturiert, d.h. die Daten passen nicht in ein vorher generiertes Datenmodell.23 Vor allem die Daten, welche den Unternehmen besonders unstrukturiert vorliegen, stellen für die Anwen- dung von standardisierten Datenbanksystemen eine große Herausforde- rung dar und können daher teilweise nicht gewinnbringend verarbeitet wer- den.24

Veracity

Das vierte V, wurde von IBM eingeführt und steht bezugnehmend auf die Definition von Big Data für Veracity.25 Wie der Autor bereits erwähnt hat, bedeutet Veracity in der deutschen Übersetzung Wahrhaftigkeit. Wird der Begriff Wahrhaftigkeit in Zusammenhang mit Big Data gesetzt, bedeutet dies, dass die vorliegenden Datenbestände unterschiedliche Qualitäten aufweisen, welche zwingend bei den Auswertungen berücksichtigt werden müssen.26 Aufgrund des Großen Umfangs und der Geschwindigkeit der Daten, sollte daher unbedingt die Wahrhaftigkeit der Daten berücksichtigt werden, da die Inhalte der gewonnen Daten häufig verfälscht dargestellt werden.27 Verfälschte Daten sollten bei einer Big Data Analyse unbedingt vermieden werden. Besonders im Umgang mit Big Data stellt die hohe Da- tenqualität eine besondere Herausforderung dar, welche niemals unter- schätz werden sollte.28

2.1.2 Potenzial

„Data is power. It differentiates and becomes the basis for new products, sales and customer relationships. A company’s ‘optimal exploitation of data’ is key, but more importantly, that exploitation drives revenue.“29

Die Definition von Big Data, welche in der vorliegenden Arbeit mithilfe der vier V’s erläutert wurde, gibt bereits einen kleinen Einblick darauf, welch großes Potenzial hinter dem Begriff Big Data stecken kann. Durch die Un- mengen an weltweit verfügbaren Daten, können besonders Unternehmen bei der Anwendung von Big Data profitieren. Bei der Verwendung ver- schiedenster Daten aus internen und externen Quellen können Unterneh- men nicht nur die Marktsituation besser beurteilen, sondern außerdem Kunden mithilfe externer Daten aus bspw. Sozialen Medien analysieren und mithilfe interner Daten wie z. B. Kundenstammdaten genauere Kun- denprofile erstellen.30 Dadurch entsteht die Möglichkeit die Anforderungen der Kunden zu analysieren und somit die entsprechenden Produkte an die- se Kundenanforderungen anzupassen.31 Weiterhin kann dann außerdem schneller bspw. auf Anfragen oder Reklamationen reagiert werden.32 Dar- aus lässt sich schließen, dass sich Unternehmen durch Big Data Analysen Wettbewerbsvorteile sichern, neue Geschäftsmodelle erschließen und ggf. sogar Umsätze steigern können.

2.1.3 Anwendungsbereiche

Big Data kann in den verschiedensten Anwendungsbereichen gewinnbrin- gend verwendet werden. Daher werden nun die für den Autor fünf wichtigs- ten Anwendungsbereiche werden im Folgenden genannt und erläutert.

Marketing und Vertrieb

Es ist selbstverständlich, dass für jedes Unternehmen das Marketing ein wichtiger Bestandteil für den Erfolg eines Unternehmens ist. Mit der Hilfe von Big Data Analysen ergeben sich hier völlig neue Chancen. Denn durch die Anwendung von Big Data haben Unternehmen die Möglichkeit, Aussa- gen und Vorhersagen aus kundenspezifischen Anfragen und Verhaltens- weisen herauszufiltern, um diese anschließend in die gewünschte Marke- tingstrategie, also einen Plan bzw. eine Vorgehensweise zur Erreichung der Unternehmensziele, umzusetzen.33

Forschung und Produktentwicklung

Auch im Bereich der Forschung und Produktentwicklung, kann Big Data sinnvoll angewendet werden. Als Beispiel dient hier die Anwendung von Big Data-Analysen in dem Einsatzgebiet der Produktneuentwicklungen und Produktverbesserungen. Durch gezielte Auswertungen von bspw. Social- Media-Pattformen entsteht die Möglichkeit, Schwächen und Meinungen zu Produkten gezielt herauszufiltern.34 Dementsprechend können die Produkte dann anhand dieser Ergebnisse verbessert oder sogar neu entwickelt wer- den.

Controlling

Das Controlling in Unternehmen ist ein wichtiges Instrument der Führungs- ebene. Es arbeitet schon vor der Verwendung von Big Data mit Unmengen an Daten, jedoch können Hauptaufgaben wie z.B. die Datenakquise mithilfe konkreter Big Data Analysen in Zukunft um einiges schneller durchgeführt werden.35 Diese deutlich schnellere Verarbeitung ist möglich, obwohl von Zeit zu Zeit immer mehr Daten zur Verfügung stehen. Big Data gibt den Controllern also die Möglichkeit, ein Großteil der Information, welche aus verschiedenen Unternehmensbereichen stammen, in kürzester Zeit zu- sammenzuführen, ohne das mit besonders großem Aufwand ein Datenmo- dell z.B. in Form einer Excel-Tabelle, entwickelt werden muss.36

Produktion

Bei dem ersten Gedanken an den Begriff „Produktion“ denken wohl die wenigsten daran, dass auch in diesem Bereich große Mengen an Daten verwendet werden und vor allem notwendig sind. Die Verarbeitung von Big Data dient dazu, Schwachpunkte im Produktionsablauf schnellstmöglich zu analysieren und somit zukünftige Produktionsabläufe zu verbessern.37 „Die meisten dieser Daten fließen in Echtzeit in Datenbanken ein und werden für Zwecke der Überwachung und Optimierung von Prozessen und wirtschaft- lichen Parametern genutzt.“38

Distribution und Logistik

Im Bereich der Logistik wird immer mehr ein Augenmerk auf Vollautomati- sche Lagersysteme geworfen. Aufgrund von immer häufigeren Just-in-Time Lieferungen nach Kundenwünschen, ist dies in vielen Unternehmen auch nicht mehr wegzudenken. Daher ist auch hier die Anwendung von Big Data notwendig um „die Daten der Auftragsfertiger, der Zwischenlager und der Logistikpartner sowie Prognosen künftiger Absatzprognosen“39 zu analysie- ren. Nach erfolgreicher Analyse dienen die gewonnen Daten als Grundlage zur Optimierung der internen und externen Distribution- und Logistikabläu- fe.

2.2 Datenschutz

2.2.1 Was ist Datenschutz überhaupt?

Die schnelle technische Entwicklung von Big Data, welche Unternehmen und auch Behörden die Möglichkeit gibt, Unmengen an personenbezoge- nen Daten zu verarbeiten und zu analysieren, gibt Anlass dazu das Thema Datenschutz zwingend bei Big Data Analysen zu berücksichtigen.40 Aus diesem Grund werden nun im Folgenden die Antworten auf die Fragen: „Was ist Datenschutz überhaupt?“ und „Wozu dient der Datenschutz?“ er- läutert.

Grundsätzlich ist zunächst folgendes festzuhalten:

„Datenschutz ist ein grundlegendes Recht, das sowohl bei der manuellen als auch bei der maschinellen Datenverarbeitung zu beachten ist.“41

Angesichts der Bezeichnung „Datenschutz“, kann vermutet werden, dass der Datenschutz nur die Daten an sich schützt. Diese Aussage ist jedoch nicht korrekt. Denn tatsächlich geht es bei dem Datenschutz um den Schutz der dargestellten Informationen, welche mit einer Person in Verbin- dung (personenbezogene Daten s.u.) gebracht werden können.42 Die Grundlage für den Datenschutz bzw. für das Datenschutzrecht ist das BDSG. Dieses beschreibt in §1 Abs. 1 „Zweck dieses Gesetzes ist es, den Einzelnen davor zu schützen, dass er durch den Umgang mit seinen per- sonenbezogenen Daten in seinem Persönlichkeitsrecht beeinträchtigt wird.“ Fortführend ist außerdem §1 Abs. 2 hervorzuheben: „Dieses Gesetz gilt für die Erhebung, Verarbeitung und Nutzung personenbezogener Daten […].“ Daraus lässt sich schließen, dass personenbezogene Daten im Sinne des BDSG „Angaben“ sind und damit Inhalte. Diese dürfen folglich nicht mit dem technischen Begriff „Daten“ verwechselt werden.43

[...]


1 Vgl. Reinbold/Schnack (2016).

2 Vgl. Reinbold/Schnack (2016).

3 Vgl. Heuer (2013), S. 3.

4 Weichert (2013a), S. 251.

5 Vgl. Helbing (2015) S. 1.

6 Vgl. Davenport (2014), S. 2.

7 Vgl. Grafik o. V. (2017).

8 Vgl. Weichert (2013a), S, 252.

9 Vgl. Davenport (2014), S. 1.

10 Vgl. Davenport (2014), S. 1.

11 Vgl. Freiknecht (2014), S. 9.

12 Vgl. King (2014), S. 35.

13 Vgl. Schroeck/Shockley/Smart et al. (2012), S. 4.

14 Vgl. King (2014), S. 35.

15 Vgl. Klein/Tran-Gia/Hartmann (2013), S. 320.

16 Vgl. James (2016).

17 Vgl. Freiknecht (2014), S. 11.

18 Vgl. McAfee/Brynjolfsson (2012), S. 63.

19 Vgl. Schroeck/Shockley/Smart et al. (2012), S. 4.

20 Vgl. Schroeck/Shockley/Smart et al. (2012), S. 4.

21 Vgl. Fasel (2014), S. 389.

22 Vgl. Fasel/Meier (2016), S. 6.

23 Vgl. Dorschel/Dorschel (2015), S. 8.

24 Vgl. Klein/Tran-Gia/Hartmann (2013), S. 320.

25 Vgl. Schroeck/Shockley/Smart et al. (2012), S. 5.

26 Vgl. Fasel/Meier (2016), S. 6.

27 Vgl. Freiknecht (2014), S. 12.

28 Vgl. Schroeck/Shockley/Smart et al. (2012), S. 5.

29 King (2014), S. 60.

30 Vgl. Fasel (2014), S. 398.

31 Vgl. Fasel (2014), S. 398.

32 Vgl. Fasel (2014), S. 398.

33 Vgl. CP Monitor (2013), S. 15.

34 Vgl. o. V. (2012), S. 36 f.

35 Vgl. Eich (2014)

36 Vgl. o. V. (2012), S. 41.

37 Vgl. Jüngling (2015)

38 o. V. (2012), S. 38.

39 o. V. (2012), S. 39.

40 Vgl. Heuberger-Götsch/Burkhalter (2014), S. 1.

41 Witt (2010), S. 1.

42 Vgl. Hoeren/Völkel (2014), S. 19.

43 Vgl. Hoeren/Völkel (2014), S. 19.

Ende der Leseprobe aus 38 Seiten

Details

Titel
Problemstellung und Herausforderung von Big Data. Wie lässt sich Big Data mit dem Datenschutz vereinbaren?
Hochschule
Verwaltungs- und Wirtschaftsakademie Hellweg-Sauerland GmbH
Note
1,0
Autor
Jahr
2017
Seiten
38
Katalognummer
V378138
ISBN (eBook)
9783668555921
ISBN (Buch)
9783668555938
Dateigröße
713 KB
Sprache
Deutsch
Schlagworte
Big Data, Datenschutz, Kritische Analyse, Datensicherheit, Informationsflut, Problemstellung, Herausforderung, Wirtschaftsinformatik, Big Data und Datenschutz, Privacy by Design, Anonymisierung, Pseudonymisierung, Datenschutzkontrolle, 4V, Potenzial von Big Data, Große Datenmengen, Anwendungsbereiche Big Data, Prinzipien Datenschutz, Was ist Datenschutz, Was ist Big Data, Datenschutzgrundverordnung, DSGVO
Arbeit zitieren
Nina Gerlt (Autor), 2017, Problemstellung und Herausforderung von Big Data. Wie lässt sich Big Data mit dem Datenschutz vereinbaren?, München, GRIN Verlag, https://www.grin.com/document/378138

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Problemstellung und Herausforderung von Big Data. Wie lässt sich Big Data mit dem Datenschutz vereinbaren?


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden