Von Big Open Data zu Big Company Value

Ein Analyserahmen zur Einordnung von Anwendungsfällen


Bachelorarbeit, 2015

86 Seiten, Note: 2


Leseprobe

Inhaltsverzeichnis

II Abkürzungsverzeichnis

III Abbildungsverzeichnis

IV Tabellenverzeichnis

1 Open Data als Ressource im digitalen Zeitalter
1.1 Wirtschaftliches Potential von Open Data
1.2 Zielsetzung der Arbeit
1.3 Aufbau und Vorgehensweise

2 Grundlagen zu ÄBig Open Data“ und ÄBig Company Value“
2.1 Definition zentraler Begriffe anhand einer Literaturanalyse
2.2 Abgrenzung von Open Data zu Big Data
2.3 Arten, Quellen und Anwendungsbereiche von Open Data
2.4 Einsatzbeispiele aus der Praxis
2.5 Marktanalyse von Open Data-Anbietern

3 Erstellung eines Analyserahmens zur Einordnung von Anwendungsfällen
3.1 Vorgehen bei der Entwicklung des Analyserahmens
3.2 MECE-Bäume zur Problemstrukturierung
3.3 Skalenentwicklung und Gewichtung der Indikatoren
3.4 Achsenwertberechnung mit Beschreibung der Extrema
3.5 Entwicklung und Einordnung beispielhafter Anwendungsfälle

4 Evaluierung des Analyserahmens mit Hilfe einer Expertenbefragung
4.1 Vorgehen und Durchführung der Befragung
4.2 Auswertung der Erkenntnisse

5 Kritische Bewertung von Open Data
5.1 Unternehmerische und akademische Relevanz
5.2 Herausforderungen und Probleme zu Open Data
5.3 Staat, Gesellschaft und Bürger als Gewinner

V Anhang

VI Literaturverzeichnis
VI.I Bibliografie
VI.II Onlinequellen

VII Eidesstattliche Erklärung

II Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

III Abbildungsverzeichnis

Abbildung 1: Prognose zum Volumen der jährlich generierten digitalen Datenmenge weltweit, eigene Bearbeitung nach (EMC Corporation 2012)

Abbildung 2: Big Data Datenchaos (MILLER, 2015)

Abbildung 3: Vier V‘s von Big Data (eigene Darstellung)

Abbildung 4: Einsatz verschiedener Analysearten in deutschen Unternehmen (ERWIN/HEIDKAMP (2015), S. 29)

Abbildung 5: Abgrenzung und Überschneidung der Konzepte Big Data und Open Data (eigene Darstellung)

Abbildung 6: Bereiche und Beispiele von Open Data (eigene Darstellung)

Abbildung 7: Kartenausschnitt der Applikation FixMyStreet (FixMyStreet, 2015)

Abbildung 8: Kartenausschnitt der Zillow Webseite (Zillow, 2015)

Abbildung 9: Übersicht der vorderen Platzierungen vom Global Open Data Index (OPEN KNOWLEDGE FOUNDATION, 2015a)

Abbildung 10: Verwendung verschiedener Datenarten für Analysen in deutschen Unternehmen, eigene Bearbeitung nach (ERWIN/HEIDKAMP (2015), S.27)

Abbildung 11: Fünf Schritte beim Vorgehen zur Erstellung des Analyserahmens (eigene Darstellung)

Abbildung 12: MECE-Strukturbaum zur Open Data Verwendbarkeit (eigene Darstellung)

Abbildung 13: MECE Strukturbaum zum Business Value durch Open Data (eigene Darstellung)

Abbildung 14: MECE-Struktur zur Open Data Verwendbarkeit mit Gewichten (eigene Darstellung)

Abbildung 15: MECE-Struktur zum Business Value durch Open Data mit Gewichten (eigene Darstellung)

Abbildung 16: Open Data Analyserahmen (eigene Darstellung)

Abbildung 17: Einordnung betrachteter Use Cases in den Analyserahmen (eigene Darstellung)

Abbildung 18: Antworten auf die Frage, ob der Einsatz des Analyserahmens in Kundengesprächen vorstellbar ist (eigene Darstellung)

IV Tabellenverzeichnis

Tabelle 1: Übersicht über Studien zur Prognose des wirtschaftlichen Nutzens von Open Data (eigene Darstellung)

Tabelle 2: Verschiedene Begriffe für Open Data (eigene Darstellung)

Tabelle 3: Häufigkeit der Nennungen von Open Data Merkmalen bei der Literaturanalyse (eigene Darstellung)

Tabelle 4: Kategorien der Wichtigkeit eines Merkmals [in %] (eigene Darstellung)

Tabelle 5: Übersicht deutscher Bundesländer und deren OD-Portale (eigene Darstellung)

Tabelle 6: Datenportale ausgewählter Länder, sortiert nach der Anzahl verfügbarer Daten (eigene Darstellung)

Tabelle 7: Übersicht der ermittelten Achsenwerte der Expertenbefragung (eigene Darstellung)

1 Open Data als Ressource im digitalen Zeitalter

ÄDaten sind wertvoll.“1Ebenso wie ÄInformationen gewinnen [sie] immer mehr [an] Bedeutung. So bezeichnet die EU-Kommissarin für die Digitale Agenda, Neelie Kroes, diese als [das] Gold des digitalen Zeitalters, auf deren Basis neue, wertschaffende Inhalte entstehen und deren Vorteile sich auf alle Bereiche der Gesellschaft auswirken.“2Daten sind im digitalen Zeitalter die Schlüsselressourcen für wirtschaftliche, politische und gesellschaftliche Aktivitäten.3In nahezu allen Gebieten wissensbasierter Gesellschaften entwickeln sie sich zu einem wesentlichen Rohstoff im heutigen Informationszeitalter.4Eine der prägendsten Veränderungen, die dazu beiträgt, ist die Digitalisierung. ÄThe digitization of just about everything […] is one of the most important phenomena of recent years”5, beschreiben Brynjolfsson und McAfee die Entwicklung. Im Zuge dieser Erscheinung wird alles, was quantifizierbar, sprich messbar ist, in ein digitales Format übertragen und abgespeichert. Das können Dokumente, Prozesse, Musik, Fotos, Videos, oder Karten sein. Sobald Daten codiert sind, können sie leicht repliziert werden. Die digitalen Kopien können nahezu ohne jegliche Kosten erstellt und beinahe in Echtzeit über das Internet an jeden Ort dieser Welt übermittelt werden. Von zusätzlicher Bedeutung ist die Eigenschaft der Nicht-Rivalität, d.h. dass digitale Güter, von mehreren Personen gleichzeitig benutzt werden können.6Zusammengenommen machen diese Eigenschaften digitale Daten zu einem ökonomisch unerlässlichen Rohstoff.

ÄAuch in der stark auf Digitalisierung und Innovation ausgerichteten deutschen Volkswirtschaft gewinnen Daten als Ressource für die ökonomische Entwicklung an Bedeutung. […] Die zugrundeliegende Idee dabei ist, dass offene Daten als verfügbare Ressource einen größeren ökonomischen Mehrwert erzeugen als der Verkauf geschlossener Daten durch staatliche Institutionen.“7Offene Daten, auch als Open Data (OD) bezeichnet, stellen eine hochwertige Ressource dar, indem sie nun der Öffentlichkeit zur Verfügung gestellt werden. ÄIm Zeitalter der Informationsgesellschaft sind Daten und Informationen immer leichter, schneller und in größeren Mengen verfügbar.“8Dies zeigt sich anhand der rasanten Digitalisierung aller Lebensbereiche. Jeder produziert heute, ob bewusst oder unbewusst, Daten, sobald er ein elektronisches Gerät verwendet. Seien es GPS-Daten, die per Smartphone erfasst, Log-Daten, die während des Autofahrens erfasst werden oder das Besuchen eines Webshops. Überall werden Daten gesammelt und archiviert, wohingegen kaum Daten gelöscht werden. Statista, das deutsche Online-Portal für Statistiken, hat eine Prognose zu den jährlich erzeugten Datenmengen veröffentlicht, welche in Abbildung 1 zu sehen ist.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Prognose zum Volumen der jährlich generierten digitalen Datenmenge weltweit, eigene Bearbeitung nach (EMC Corporation 2012)

Der Großteil dieser Daten ist jedoch nicht für jedermann verfügbar. Wenn ehemals geheim gehaltene Daten nun der Öffentlichkeit zugänglich gemacht werden, sind diese von besonderem Interesse. Ein Beispiel dafür sind Finanzdaten über den deutschen Staatshaushalt.

In der Informationsund Wissensgesellschaft steht der Wissenserwerb an oberster Stelle. Die Grundlage des Wissenserwerbs sind Daten. Daten sind Abfolgen von Zeichen, die mit einer gewissen Syntax verbunden sind. Werden Daten mit einer bestimmten Bedeutung verbunden, entsteht Information. Die Vernetzung mehrerer Informationen und die Beziehungen zwischen ihnen ermöglicht es, Wissen zu generieren.9Joel Gurin sieht in Open Data eine mächtige Ressource für Unternehmen, welche die Daten verwenden, um Innovationen zu kreieren, während die Grundlage an sich kostenlos ist.10Da die Kosten von Open Data verglichen mit aufwendig erhobenen oder extern erworbenen Daten extrem gering sind, entsteht für Unternehmen ein großer Vorteil. In deutschen Firmen herrscht die Überzeugung, dass Open Data Äein wertvoller Rohstoff [ist] vorausgesetzt, man weiß mit ihm umzugehen.“11Wie jede andere Unternehmens-Ressource sind offene Daten nur wertvoll, wenn der Nutzen die Kosten übersteigt. Um Open Data verwenden zu können, müssen zunächst Daten gesucht, gesammelt, aufbereitet und verarbeitet werden, um einen Nutzen daraus zu erzielen.12Der erhoffte Mehrwert führt zu einer Entwicklung von monetärem Wert aus Daten. Kunden zahlen für diese Informationen, von denen sie sich einen Nutzen oder neues Wissen erhoffen, einen Preis.13Diese Zahlungsbereitschaft birgt für Unternehmen im Hinblick auf die Verwendung der noch relativ selten genutzten öffentlich zugänglichen Daten eine enorme Chance.

1.1 Wirtschaftliches Potential von Open Data

ÄOpen Data the new movement to make large amounts of data available for public use.“14So umschreibt Gurin die Open Data Bewegung, welche ein enormes wirtschaftliches Potential innehat. ÄMaking data more ‘liquid’ (open, widely available, and in shareable formats) has the potential to unlock large amounts of economic value, by improving the efficiency and effectiveness of existing processes; making possible new products, services, and markets; and creating value for individual consumers and citizens.”15. In dieser Arbeit steht der wirtschaftliche Aspekt von Open Data im Mittelpunkt, weshalb an dieser Stelle einige Studien vorgestellt werden, die den ökonomischen Wert von Open Data oder Public Sector Information (PSI) ermitteln. Ä[Allerdings gibt es in] der Fachliteratur […] bisher keine Studie, die den Nutzen von Open Data in seiner gesamten Breite untersucht.“16

Im Jahr 2000 wurde eine Studie der PIRA Energy Group veröffentlicht, welche einen Top-Down-Ansatz verfolgt und den ökonomischen Wert von Public PSI in der EU auf 68 Mrd. Euro schätzt.17PSI sind Informationen des öffentlichen Sektors, welche der Staat erhoben hat. 2006 untersuchte die MEPSIR Studie ebenfalls den Nutzen von PSI für die, zum damaligen Zeitpunkt 25 Mitglieder umfassende, EU und Norwegen. Die geschätzte Marktgröße bewegt sich demnach zwischen zehn und 48 Mrd. Euro.18Der Vickery Report aus dem Jahr 2011 beziffert die direkten und indirekten ökonomischen Auswirkungen, die durch die Nutzung von PSI in der EU (27 Mitgliedsstaaten) bei 143 Mrd. Euro pro Jahr liegen.19Ein Report vom McKinsey Global Institute aus dem Jahr 2013 berechnet den Mehrwert, der durch die Freisetzung und Verwendung von Open Data entstehen kann, auf weltweit drei Billionen Euro pro Jahr, aufgeteilt in unterschiedliche Bereiche. Dieser kann durch Effizienzsteigerungen, Entscheidungsverbesserungen, dem Entwickeln neuer Produkte und Services, Kosteneinsparungen sowie Qualitätssteigerungen für Kunden entstehen.20Nachfolgende Tabelle 1 zeigt eine Übersicht vorgestellter Studien.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Übersicht über Studien zur Prognose des wirtschaftlichen Nutzens von Open Data (eigene Darstellung)

Die vorgestellten Studien weisen unterschiedliche Ergebnisse nach, was unter anderem mit der Komplexität der Quantifizierung von Nutzen zusammenhängt. Zudem ist eine vollumfassende Bewertung des Mehrwerts nahezu unmöglich, da eine beträchtliche Zahl an Bereichen in die Ermittlung eines Werts einbezogen werden kann. Im Verlauf der Zeit ist jedoch ein Anstieg des wirtschaftlichen Mehrwerts von Open Data/PSI zu erkennen. Einzig der Report von McKinsey von 2013 prognostiziert den Nutzen von Open Data, wohingegen sich die älteren wissenschaftlichen Untersuchungen auf PSI beziehen. Das liegt vor allem daran, dass die Open Data Bewegung eine relativ junge Disziplin ist. Wie aber alle Studien gleichermaßen darlegen, birgt die Verwendung von Open Data ein exorbitantes Potential. Gerade für Unternehmen ergeben sich große Möglichkeiten im Hinblick darauf, dass die frei verfügbare und kostenlose Ressource Open Data verwendet werden kann. ÄIndem öffentliche Verwaltungen Daten zur wirtschaftlichen Nutzung zur Verfügung stellen, verbessern sie die Innovationskraft und damit die wirtschaftliche Situation, der im Wettbewerb stehenden Unternehmen. Dies soll wiederum zu höherem Wirtschaftswachstum, höheren Steuereinnahmen und steigenden Einnahmen der Sozialsysteme führen.“21Da die Open Data Bewegung insbesondere von Einrichtungen der Regierungen getragen wird, indem diese Daten erheben und zur Verfügung stellen, erfahren sie einen positiv rückläufigen Effekt.

1.2 Zielsetzung der Arbeit

Das Ziel dieser Arbeit ist zum einen, einen weitreichenden Einblick rund um das Thema Open Data zu geben und zum anderen ein hilfreiches Instrument zum Einsatz in der Kundenakquise des Software-Startups ‚One Logic‘ zu entwickeln. In Unternehmen werden derzeit hauptsächlich Daten verwendet, die innerhalb der eigenen Organisation gewonnen werden. Öffentlich zugängliche Datensätze werden nur sporadisch oder viel zu selten in die Wertschöpfungskette aufgenommen. Da das Gebiet um offene Daten noch recht neu und speziell der Mehrwert, welcher durch die Verwendung von Open Data erzeugt werden kann, zu wenig erforscht ist, soll die Anfertigung eines Analyserahmens genauere Einblicke zu Anforderungen an die Daten und möglichen Mehrwerten für Betriebe geben. Verschiedene Aspekte des Business Value durch Open Data (BVdOD) werden genauer untersucht und verständlich dargestellt. Ferner bringen eindeutige Begriffsbestimmungen zu Open Data, Big Data und BVdOD Klarheit über die Thematik. Im Zuge dieser Arbeit wird Führungspersonen in Unternehmen bewusst gemacht, welche Möglichkeiten durch Open Data entstehen können. Der Analyserahmen wird auf Anwendungsfälle von Unternehmen aller Branchen anwendbar sein, wobei das Hauptaugenmerk bei denen liegt, die sich der Kernkompetenz Datenverarbeitung widmen. Mit Hilfe des Schemas soll dem Kunden während der Akquise einfach und anschaulich erläutert werden, welches Potenzial öffentlich zugängliche Datensätze für den Anwendungsfall seines Unternehmens haben können.

1.3 Aufbau und Vorgehensweise

Die vorliegende Arbeit ist insgesamt in fünf Kapitel aufgeteilt. Das erste führt zum Thema hin, indem Open Data als Ressource vorgestellt und deren Potential, sowie die unternehmerische Relevanz aufgezeigt wird. Daraufhin wird die Zielsetzung der Bachelorarbeit vorgeführt, der Aufbau und die Vorgehensweise beschrieben.

Das zweite Kapitel gibt einen umfassenden Einstieg rund um das Thema Open Data. Anhand einer detaillierten Literaturrecherche werden die Begriffe Open Data, Big Data (BD) und Business Value durch Open Data definiert. Anschließend wird Open Data genau von Big Data abgegrenzt. Dazu werden die Gemeinsamkeiten und Unterschiede herausgearbeitet. Im Bereich Open Data wird zudem genauer auf die Anwendungsbereiche, Quellen und Einsatzbeispiele eingegangen. Durch eine Internetrecherche werden der nationale sowie internationale Markt und die Merkmale von Open Data Portalen analysiert.

Aufbauend auf den erarbeiteten Grundlagen wird im dritten Abschnitt ein Analyserahmen erstellt, mit dessen Hilfe Anwendungsfälle von Unternehmen oder Kunden eingeordnet werden können. Hierzu stellt man in einem ersten Schritt mit Hilfe des MECE-Prinzips Indikatoren für die Achsenberechnung auf und strukturiert sie in Entscheidungsbäumen. Die Definition der Achsen wird im zweiten Schritt mit der Festlegung der Gewichte für die einzelnen Indizes abgeschlossen. Dann dokumentiert man die Berechnungen. Anschließend wird der Analyserahmen, die beiden Achsen Open Data Verwendbarkeit (ODV) und BVdOD vorgestellt und die Extremwerte definiert. Für die Analysematrix werden vier beispielhafte Anwendungsfälle zur Veranschaulichung entwickelt und in diese eingeordnet.

Unter Punkt 4 wird der Analyserahmen anhand der Durchführung einer Expertenbefragung explorativ untersucht und evaluiert. Die Befragung wird als qualitative Forschungsmethode realisiert, da der Bereich um die Mehrwerte der Open Data Verwendung in Unternehmen noch unerforscht ist. Die daraus gewonnenen Erkenntnisse verwendet man zur Evaluierung des Analyserahmens, der gegebenenfalls angepasst werden kann.

Das letzte Kapitel gibt einen Ausblick über künftige Entwicklungen der Verwendung von Open Data in Unternehmen und deren Forschungsstand. Neben einer Bewertung darüber, ob ein derart entwickelter Analyserahmen in Unternehmen zum Einsatz kommen kann, sowie einer akademischen Aussicht auf den unternehmensrelevanten Bereich Open Data, runden zwei Abschnitte über Vorund Nachteile die Arbeit ab. Eine Zusammenfassung zu Herausforderungen sowie positiven Auswirkungen von Open Data schließen die Arbeit ab.

2 Grundlagen zu „Big Open Data“ und „Big Company Value“

ÄDie Open Data Bewegung steckt, wie viele andere (digitale) Entwicklungen rund um den digitalen Strukturwandel noch in den Kinderschuhen.“22Daher ist es nicht verwunderlich, dass ein Mangel an Klarheit über die Begrifflichkeiten und Fachbegriffe, die in der Literatur und in öffentlichen Debatten rund um Open Data verwendet werden, herrscht.23Aufgrund dessen werden im zweiten Kapitel stellvertretend für ÄBig Open Data“ die Begriffe Open Data und Big Data, sowie für ÄBig Company Value“ die Begriffe Business Value und BVdOD definiert. Hier wird zunächst auf die Geschichte der Open Data Bewegung eingegangen.

Schon 1803 hat der damalige Präsident der Vereinigten Staaten von Amerika, Thomas Jefferson, den Wert vom Veröffentlichen von Informationen erkannt. Er war der Ansicht, dass ein freier Informationsfluss die Wirtschaft und die Gesundheit einer Demokratie begünstigen. Daher finanzierte er eine zweieinhalbjährige Entdeckungsreise für Lewis und Clark, um so viele Informationen wie möglich über die Wildnis der neu erworbenen Kolonie Louisiana zu erhalten. Diese entspricht in etwa einem Drittel der Größe der heutigen USA. Die ermittelten Daten beschleunigten das Wirtschaftswachstum und ermöglichten es, die Landesgrenzen festzulegen.24

Die Open-Access-Bewegung, auch Open-Science-Bewegung genannt, hat zwischen 1999 und 2002 ihren Ursprung in der Wissenschaft, mit dem Ziel, Forschungsergebnisse, dazugehörige Daten, Materialien und Darstellungen in multimedialer Form im Internet frei zugänglich zu publizieren.25ÄAllerdings kann von einer Open-Data-Bewegung frühestens seit Beginn des 21. Jahrhunderts die Rede sein.“26Diese hat ihren Beginn in den USA, mit dem Gedanken, dass alle mit Steuern bezahlten Daten frei und für jedermann zugänglich sein sollen. Im Gegensatz dazu ist in Europa die Anschauung verbreitet, dass mit Daten eher beschützend und vertraulich umgegangen wird.27Ein weiterer viel benutzter Begriff ist Open Government, der Ävielfältige Öffnungsprozesse von Staat und Verwaltung mit der Maßgabe Transparenz, Partizipation und Kollaboration zwischen Staat, Bürgern, Wissenschaft und Wirtschaft zu fördern“28, bezeichnet. Alltagssprachlich werden Ädie Begriffe Open Data und Open Government Data meist synonym für das Phänomen der Öffnung des Staates verwendet.“29Es zeigt sich, dass Open Data, sowie Open Government Data zwei neuartige Bewegungen der heutigen Zeit beschreiben. Im Folgenden wird Open Data hinsichtlich der Daten betrachtet.

2.1 Definition zentraler Begriffe anhand einer Literaturanalyse

In diesem Abschnitt werden die Ergebnisse der Literaturanalyse vorgestellt und Definitionen zentraler Begriffe genauer bestimmt und herausgearbeitet.

Open Data

Zuallererst ist zu sagen, dass die Definition von Open Data nicht zu einem bestimmten Zeitpunkt entstand, sondern sich im Lauf der Jahre entwickelt hat.30In Anbetracht dessen, gibt es bis heute keine weltweit einheitlich anerkannte Definition, auf die man sich stützen kann.31Im Dezember 2007 wurden von einer Arbeitsgruppe der US-Regierung im kalifornischen Sebastopol zum Thema ‚Offene Regierung‘ acht Open Government Data Prinzipien erarbeitet (vgl. Anhang 1). Die Sunlight Foundation, unter deren Sponsoring das Meeting stattfand, hat diese Liste an Merkmalen überarbeitet. Sie gibt in Form von zehn Prinzipien Aufschluss darüber, welche Merkmale zu beachten sind, um Daten als offen und zugänglich zu bezeichnen. Diese Liste dient als Grundlage der Definition von Open Data. Im Juni 2012 hat das Komitee für öffentliche Transparenz von Großbritannien zehn Public Data Prinzipien publiziert, die die Veröffentlichung von Daten leiten soll.32Im Mai 2013 hat schließlich das Office of Management of Budget der US-Regierung eine Open Data Richtlinie herausgegeben.33Diese beinhaltet eine weitere Begriffsbestimmung von Open Data. Die Vielfalt der Bezeichnungen (siehe Tabelle 2), die synonym für Open Data verwendet werden, macht deutlich, dass es noch keine allgemein gültige Definition gibt.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2: Verschiedene Begriffe für Open Data (eigene Darstellung)

Die Anstrengungen der Regierungen in aller Welt zeigen die Absicht, eine einheitliche Open Data Definition auszuarbeiten. Im Zuge dieser Arbeit wurden mit Hilfe einer Literaturrecherche 36 Quellen (Zeitschriftenaufsätze, Monographien, BlogEinträge, Artikel auf Webseiten, Berichte, Gutachten und andere Paper) ausgewertet. Diese hat man nach Eigenschaften bzw. Merkmalen von Open Data durchsucht und anschließend für jede Quelle eine Liste an Merkmalen erstellt. Einige Merkmale waren sehr ähnlich oder überschnitten sich, was ein Problem darstellte. Zum Beispiel ist die Eigenschaft ‚Vollständigkeit‘ ein Teil der ‚Datenqualität‘ und Merkmale wie ‚Freie Erreichbarkeit‘ oder ‚Freie Zugänglichkeit‘ beschreiben den gleichen Sachverhalt. Mehrere Merkmale wurden in Gruppen von Merkmalen zusammengefasst. Aus den Listen konnte dann die Anzahl der Nennungen für jedes Merkmal bzw. Merkmalgruppe summiert werden, um Häufigkeiten zu errechnen.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 4: Kategorien der Wichtigkeit eines Merkmals [in %] (eigene Darstellung)

Tabelle 4 zeigt die Kategorien der Wichtigkeit eines Merkmals.

Von den als ‚unwichtig‘ eingestuften Merkmalen wurden keine in die Definition aufgenommen, von den als ‚sehr wichtig‘ und ‚wichtig‘ eingeordneten jedoch alle. Aus der Menge der als ‚optional‘ eingestuften Attribute wurden einige ausgewählte in die Definition integriert. Die Wichtigkeit, bzw. Häufigkeit errechnet sich folgendermaßen:

Abbildung in dieser Leseprobe nicht enthalten

Durch die oben beschriebene Auswertung der betrachteten Literatur sowie in Anlehnung an bereits bestehende Begriffserklärungen wird eine eigene Definition erstellt. Open Data wird wie folgt aufgefasst:

Unter Open Data werden Datensätze bzw. Daten verstanden, die für jeden (Organisationen, Unternehmen und Privatpersonen) öffentlich und leicht zugänglich sind. Diese sind frei verfügbar, stehen vorzugsweise über das Internet zum Download bereit und können ohne Einschränkungen zu jedem Zweck verwendet werden. Dazu werden die Daten unentgeltlich (oder gegen einen geringen finanziellen Aufwand, der die Reproduktionskosten der Daten nicht übersteigt), in maschinenlesbaren Formaten und unter offenen Lizenzen veröffentlicht. Die Datensätze sind in angemessener Aktualität, unter Angabe von Metadaten und Beachtung der Nicht-Diskriminierung von Personengruppen dauerhaft vollständig verfügbar.

Nun wird genauer auf die einzelnen Merkmale eingegangen. Der wichtigste Aspekt von Open Data ist Offenheit, welche dadurch gegeben ist, dass die Daten für jeden öffentlich zugänglich sind. Das heißt, dass Datensätze über eine Internetseite oder ein Online-Portal downloadbar sind. Ferner bedeutet das, dass der Zugriff auf Daten zulässig ist, ohne eine Begründung dafür zu haben.

Die damit im Einklang stehende Diskriminierungsfreiheit muss gegeben sein. Folglich werden weder Personengruppen von der Zugänglichkeit ausgeschlossen, noch muss man die eigene Identität nachweisen. Daten sollen also ohne eine vorgelagerte Mitgliedschaft oder Registrierung auf dem Online-Portal zugreifbar sein.34

Durch die leichte Zugänglichkeit sind Datensätze einfach zu finden. Wenn ein Normalverbraucher nach einem bestimmten Datensatz im Internet über eine Suchmaschine sucht, sollte er mit geringem Aufwand fündig werden.35

Der Verwendungszweck stellt ebenso einen elementaren Bestandteil der Open Data Definition dar. Die Datensätze sollen ebenso überarbeitet wie weiterverbreitet werden können, egal, ob etwas daran verändert wurde oder nicht. Es soll Ä[k]eine Einschränkung der Einsatzzwecke“36vorliegen, sodass jede Privatperson und jedes Unternehmen sämtliche Rechte der Weiterverarbeitung innehat.

Eine weitere bedeutende Eigenschaft von Open Data ist die kostenlose Verfügbarkeit, welche im optimalen Fall keine Ausgaben für den Daten-Verwender verursacht. Einer der Hauptgründe für das Aufkommen der Open Data Bewegung ist, dass die von der öffentlichen Verwaltung erhobenen Daten Allgemeingut sind, da der Bürger dafür bereits seinen Beitrag in Form von Steuern geleistet hat. Folglich hat jeder Bürger einen Anspruch, um auf diese Daten zuzugreifen. Für ein paar wenige Datensätze sind jedoch geringe Kosten aufzuwenden. In diesem Fall soll allerdings der Preis für einen Datensatz die Reproduktionskosten nicht übersteigen, um noch von Open Data sprechen zu können.37

„Die Verwendung von maschinenlesbaren Formaten bei der Veröffentlichung von frei verfügbaren Daten ist ein wesentliches Kriterium, um solche Informationen tatsächlich als offen einstufen zu können. Erst die Maschinenlesbarkeit vereinfacht die Aufbereitung der Daten für unterschiedliche Anwendungen. Liegen z.B. tabellarische Daten in PDF-Dokumenten vor, so können zwar Menschen diese Daten problemlos lesen und verstehen, da dieses Format auf die Qualität der Bildschirmanzeige ausgelegt ist, aber die maschinelle Lesbarkeit und Weiterverwendbarkeit ist nur eingeschränkt gegeben. Im Gegensatz dazu stellen allgemein von Software interpretierbare Formate wie XML, CSV oder RDF sicher, dass die Daten von einer großen Anwendergruppe effizient weiterverwendet und aufbereitet werden können.“38In Anhang 2 können wichtige erforderliche Formate für das Veröffentlichen von Daten im Web eingesehen werden.

Das Merkmal ‚Lizensierung‘ umschreibt die Veröffentlichung der Daten unter Verwendung einer Lizenz, welche die rechtlichen Konditionen bestimmt. Zum einen kann ein Datensatz ohne eine Lizenz veröffentlicht werden. Hierbei ist davon auszugehen, dass alle Rechte in Bezug auf die Verwendung, die Weiterverarbeitung, die Veränderung und das Urheberrecht gegeben sind. Zum anderen kann ein Datensatz unter Angabe einer bestimmten Lizenz publiziert werden. Die Lizenz enthält dann die relevanten rechtlichen Informationen. Sofern eine ‚offene Lizenz‘ verwendet wird, sollten keine rechtlichen Einschränkungen vorhanden sein.39

Datensätze, die als Open Data publiziert werden, sollen vollständig und aktuell sein. Dabei gilt, dass die Datensätze so lückenlos wie möglich und so aktuell wie nötig sind. Damit es beim Verständnis der Daten keine Schwierigkeiten gibt, soll der komplette Rohdatensatz verfügbar gemacht werden. Im Fall eines unvollständigen Datensatzes können Verständnisprobleme auftreten. Zu beachten ist, dass Datensätze in einem angemessenen Zeitraum nach der Erhebung und Zusammenstellung veröffentlicht werden. Wird beispielsweise der Haushalt einer Regierung für das aktuelle Jahr abgesegnet, aber die darin zugrunde liegenden Daten erst ein Jahr später veröffentlicht, ist das Merkmal der Aktualität nicht mehr erfüllt.40

Metadaten sind grundlegende Informationen über einen bestimmten Datensatz. Der Erhebungszeitraum bzw. das Datum, der Ersteller des Datensatzes, der Ort der Erhebung oder Daten zu einer Kontaktperson dienen als Beispiele für Metadaten. Generell beinhalten sie detailliertere Beschreibungen zur Datenerhebung.41

Die Dauerhaftigkeit von Open Data ist gleichzusetzen mit der Nachhaltigkeit. Hierbei geht es darum, dass Daten zeitlich unbegrenzt, also dauerhaft im Internet abrufbar sind. Darüber hinaus werden sie unter Angabe eindeutiger Bezeichnungen versioniert, falls es einen aktuelleren Datensatz zu einem bestimmten Sachverhalt gibt.42

Big Data

ÄBig Data bezeichnet den Einsatz großer Datenmengen aus vielfältigen Quellen mit einer hohen Verarbeitungsgeschwindigkeit zur Erzeugung wirtschaftlichen Nutzens.“43Big Data gilt als Lösung zum rasanten Anstieg der Datenmengen, die als ein Datenchaos verstanden werden. (siehe Abbildung 2).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Big Data Datenchaos (MILLER, 2015)

ÄEnde der 1990er-Jahre tauchte […] der Begriff ‚Big Data‘ in der wissenschaftlichen Literatur zum ersten Mal auf. Gemeint waren damit in der Regel Datenbestände, die zu groß waren, um sie im Arbeitsspeicher oder gar in lokalen Speichermedien aufzubewahren […].“44In der Fachliteratur wurde das Phänomen Big Data, welches vornehmlich für die Wirtschaft und datenverarbeitende Unternehmen eine Rolle spielt, zunächst mit den sogenannten ‚drei V’s‘ definiert.45Dies sind ‚Volume‘ (Volumen/Menge), ‚Velocity‘ (Geschwindigkeit) und ‚Variety‘ (Vielfalt). Mittlerweile wird die Definition von Big Data mit den ‚vier V’s‘ beschrieben, welche um den Aspekt ‚Veracity‘ (Richtigkeit) erweitert wurde.46

Das Volumen umschreibt die immer größer werdenden Datenund Informationsmengen, die aufgenommen, analysiert und verarbeitet werden müssen. Die Menge der Daten steigt mit der Anzahl der Quellen, der höheren Datentiefe und der höheren Auflösung an, sodass herkömmliche Datenbank-Tools mit der Speicherung und Verarbeitung nicht mehr zurechtkommen.47

Das Charakteristikum ‚Vielfalt‘ geht mit dem Anstieg der Datenmenge einher. Denn auch hier nimmt die Verschiedenartigkeit der Datenstruktur gleichsam zu. Die Datensätze können in strukturierter, semi-strukturierter und unstrukturierter Form erhoben werden, egal ob intern oder extern. Beispiele hierfür sind Transaktionsdaten aus Unternehmen, Sensordaten von unterschiedlichsten Maschinen, LogDaten aus Programmen oder Clickstream-Daten aus E-Shops.48Wie aus Anhang 3 ersichtlich wird, werden pro Minute über 1300 Terrabyte an Daten im Internet transferiert und erzeugt. Ein Großteil hat einen Orts-, Zeitsowie Aktivitätsbezug, was die Quantität der Daten erheblich erhöht. Diese Entwicklung zeigt, wie schnell verschiedenste Datenarten zunehmen.

Das Merkmal ‚Geschwindigkeit‘ ist auch auf die Verarbeitungsgeschwindigkeit der Daten zurückzuführen. Immense Datenmengen müssen nahezu in Echtzeit ausgewertet werden. Beispielsweise sollten Analysen bei höchster Datenübertragung durch gesteigerte Rechenleistung und Speicherkapazitäten Antworten im Sekundenbereich liefern.49

Das jüngste Attribut der vier V’s ist wie bereits erwähnt die ‚Richtigkeit‘. Dabei geht es um die Qualität der Daten, welche vor allem von Inkonsistenzen, Unvollständigkeit und Ambiguitäten beeinflusst wird. Je besser die Datenqualität, desto nachvollziehbarer und begründbarer werden datengestützte Entscheidungen.50Zusammenfassend sind in Abbildung 3 die ‚vier V’s‘ von Big Data abgebildet.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Vier V‘s von Big Data (eigene Darstellung)

Ein nicht außer Acht zu lassender Aspekt ist ‚Analytics‘. Dieser steht für die Auswertung von Daten. Darunter versteht man Analysemethoden zur automatischen Erkennung und Nutzung von Mustern und Zusammenhängen. Zur Veranschaulichung werden hier statistische Analysen, Data Mining, Vorhersagemodelle oder Optimierungsalgorithmen genannt.

Business Value

Business Value ist ein schwer erfassbarer Begriff und wird synonym zu Mehrwert oder Unternehmensperformance verwendet, dabei beschreibt er einen Zugewinn für Unternehmen.

Bereits Aristoteles fand durch seine Forschung zwei Intentionen von Wert, den Gebrauchswert und den Gegenwert. Ersterer ist der Wert, den ein Gut für ein Individuum besitzt und sich aus der Summe einzelner Attribute zusammensetzt. Zum Beispiel hat ein Smartphone mit mobiler Datenverwendung einen höheren Gebrauchswert, als eines ohne das genannte Merkmal. Der Gegenwert eines Gutes ist der Wert, den man in Form einer Gegenleistung erbringt, wie beispielsweise der Preis, den man für ein neues Auto bereit ist zu zahlen.51In der Literatur wird unter Business Value, wie oben genannt, häufig der Mehrwert in bzw.

[...]


1FORSTERLEITNER/GEGENHUBER (2011), S. 238.

2PREISCHE (2014), S. 7.

3Vgl. OPEN KNOWLEDGE FOUNDATION DEUTSCHLAND (2015).

4Vgl. BARNICKEL/KLESSMANN (2012), S. 127.

5BRYNJOLFSSON/MCAFEE (2014), S. 66.

6BRYNJOLFSSON/MCAFEE/SPENCE (2014).

7KRIEGER/HUNNIUS (2015).

8ECKERT/FLÜGGE/GAUCH (2014), S. 1.

9Vgl. LEHNER (2014), S. 54-57.

10GURIN (2014b), S. 1.

11ERWIN/HEIDKAMP (2015), S. 3.

12GURIN (2014a), S. 55.

13SHAPIRO/VARIAN (1999), S. 3.

14GURIN (2014b), S. 7.

15MANYIKA et al. (2013), S. 1.

16PREISCHE (2014), S. 31.

17Vgl. GRUEN/HOUGHTON/TOOTH (2014), S. 17.

18Vgl. PREISCHE (2014), S. 31.

19Vgl. PREISCHE (2014), S. 31.

20Vgl. MANYIKA et al. (2013), S. 6.

21KRIEGER/HUNNIUS (2015).

22DAPP (2015).

23Vgl. BONINA (2013), S. 5.

24Vgl. MANYIKA et al. (2013), S. 1.

25Vgl. DANOWSKI/POHL (2013), S. 9-10.

26DANOWSKI/POHL (2013), S. 9-10.

27POIKOLA/KOLA/HINTIKKA (2010), S. 11.

28ECKERT/FLÜGGE/GAUCH (2014), S. 6.

29LEDERER (2015), S. 39.

30LEDERER (2015), S. 40.

31LEHTONEN (2011), S. 6-7.

32UBALDI (2013), S. 8-10.

33BURWELL et al. (2013), S. 5.

34Vgl. KLESSMANN et al. (2012), S. 35-38.

35Vgl. HMGOVERNMENT (2012), S. 22-24.

36VON LUCKE/GEIGER (2010), S. 3-4.

37Vgl. LANGKABEL (2010).

38ECKERT/FLÜGGE/GAUCH (2014), S. 4.

39Vgl. OPEN KNOWLEDGE FOUNDATION (2015b).

40VON LUCKE/GEIGER (2010), S. 4-5.

41Vgl. OLIVER et al. (2012), S. 117.

42 Vgl. COWAN/ALENCAR/MCGARRY (2014), S. 29. 14

43BARTEL et al. (2012), S. 21.

44DEBORTOLI/MÜLLER/BROCKE (2014), S. 316-317.

45BRYNJOLFSSON/MCAFEE (2012).

46KING (2013), S. 35.

47GURIN (2014b), S. 258.

48Vgl. KING (2013), S. 35.

49Vgl. BARTEL et al. (2012), S. 21.

50Vgl. KING (2013), S. 35.

51Vgl. VARGO/MAGLIO/ARCHPRU AKAKA (2008), S. 146.

Ende der Leseprobe aus 86 Seiten

Details

Titel
Von Big Open Data zu Big Company Value
Untertitel
Ein Analyserahmen zur Einordnung von Anwendungsfällen
Hochschule
Universität Passau  (Wirtschaftswissenschaftliche Fakultät)
Note
2
Autor
Jahr
2015
Seiten
86
Katalognummer
V341095
ISBN (eBook)
9783668306011
ISBN (Buch)
9783668306028
Dateigröße
3346 KB
Sprache
Deutsch
Schlagworte
Open Data, Use Case, Big Data, Business Value, Analyserahmen
Arbeit zitieren
Michael Aringer (Autor), 2015, Von Big Open Data zu Big Company Value, München, GRIN Verlag, https://www.grin.com/document/341095

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Von Big Open Data zu Big Company Value



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden