Grin logo
de en es fr
Shop
GRIN Website
Texte veröffentlichen, Rundum-Service genießen
Zur Shop-Startseite › Informatik - Wirtschaftsinformatik

BIG DATA. Technologieansätze im Überblick

Titel: BIG DATA. Technologieansätze im Überblick

Seminararbeit , 2015 , 44 Seiten , Note: 1,3

Autor:in: Rainer Emslander (Autor:in)

Informatik - Wirtschaftsinformatik
Leseprobe & Details   Blick ins Buch
Zusammenfassung Leseprobe Details

Aktuell ist „Big Data“ in aller Munde. Übersetzt man Big Data aus dem Englischen, lautet dies schlicht „große Datenmengen“. Doch große Datenmengen sind weder in der IT noch in den Geschäftsprozessen eine Neuigkeit.

Neu sind die Geschwindigkeit des Wachstums des globalen Datenvolumens sowie die Anforderungen, diese zu verarbeiten und zu analysieren, um einen betriebswirtschaftlichen Nutzen daraus ziehen zu können. Zwischen den Jahren 2010 und 2020 prognostiziert man unter Experten ein weltweites Wachstum des Datenvolumens um 42% pro Jahr. Dies entspricht einer Steigerung zwischen 2010 und 2020 um mehr als das 30-Fache.

Die zunehmende Digitalisierung in Unternehmen, der anhaltende Trend zu Social Media, das An-wenden von mobilen Anwendungen auf Smartphones, etc. haben zur Folge, dass das Datenvolumen, welches auch verarbeitet werden muss, rasant ansteigt. Weiter wird die Integrität und Auswertung der Datenmengen immer komplexer. Es fallen nicht mehr ausschließlich strukturierte, sondern vermehrt unstrukturierte Daten an.

In Summe führt dies zu völlig neuen Anforderungen an die Skalierbarkeit, Verfügbarkeit, Flexibilität und Performanz im Datenmanagement und somit an die Informationstechnologie. Relationale Datenmodelle mit SQL als Abfragesprache sind in einigen Fällen hierzu nicht mehr die erste Wahl.

Nachfolgende Arbeit definiert in Kapitel zwei den Begriff Big Data und verdeutlicht das Wirkungsprinzip sowie die Relevanz für deutsche Unternehmen. Kapitel drei widmet sich aktuellen Technologiesegmenten im Big Data-Umfeld, gibt einen Überblick zur Taxonomie verwendeter Technologien und stellt abschließend zwei Architektur- und Lösungsansätze mit Big Data im Banken- und Automobilsektor vor. Zum Schluss wird die Arbeit zusammengefasst und ein Ausblick gegeben.

Leseprobe


Inhaltsverzeichnis

1. Einleitung

2. BIG DATA – Grundlagen

2.1 Begriffsbestimmung

2.2 Wirkungsprinzip

2.3 Relevanz

3. BIG DATA – Technologieansätze im Überblick

3.1 Aktuelle Kerntechnologiesegmente

3.1.1 Scalable No-SQL – Hadoop

3.1.2 Streaming

3.1.3 In-Memory

3.1.4 Standard SQL

3.2 Taxonomie von BIG DATA-Technologien

3.2.1 Daten-Haltung

3.2.2 Daten-Zugriff

3.2.3 Analytische Verarbeitung

3.2.4 Visualisierung

3.2.5 Daten-Integration

3.2.6 Daten-Governance & -Sicherheit

3.3 Exemplarische Architektur- und Lösungsansätze mit BIG DATA

3.3.1 PSD Bank Hannover: Optimiertes Zielgruppenmarketing

3.3.2 BMW: Verbesserte Produktentwicklung und erhöhte Kundenzufriedenheit

4. Zusammenfassung und Ausblick

Zielsetzung & Themen

Diese Seminararbeit untersucht das Phänomen „Big Data“ im Kontext einer zunehmend digitalisierten Wirtschaft. Das primäre Ziel ist es, den Begriff Big Data zu definieren, die technologischen Grundlagen und Segmentierungen zu erläutern und den betriebswirtschaftlichen Nutzen sowie die Relevanz für deutsche Unternehmen anhand konkreter Praxisbeispiele aus der Automobil- und Bankenbranche aufzuzeigen.

  • Grundlegende Begriffsbestimmung und Wirkungsprinzipien von Big Data
  • Überblick über aktuelle Kerntechnologien wie Hadoop, NoSQL und In-Memory-Systeme
  • Taxonomie von Big Data-Technologien von der Datenhaltung bis zur Governance
  • Analyse des Nutzens für das Management und spezifische Einsatzmöglichkeiten
  • Fallstudien zur Umsetzung: Optimiertes Zielgruppenmarketing und verbesserte Produktentwicklung

Auszug aus dem Buch

3.1.1 Scalable No-SQL – Hadoop

NoSQL-Datenbanken sind eine flexible, moderne Art von Datenbanktechnologie, mit der die Möglichkeit besteht, unterschiedlich strukturierte Daten hoch skalierbar und nicht relational zu speichern und zu verarbeiten. Einige NoSQL-Datenbanken erlauben auch komplexe Anfrageanforderungen im Gegensatz zu herkömmlichen relationalen Datenbanken z.B. ohne ein fest definiertes Datenschema (etwa im Bereich von unstrukturierten Daten wie Video-, Bild- oder Audiodateien). [Bitk14, 24; EdFr10, 2f]

Apache Hadoop gilt als flexible Anwendung für die Parallelverarbeitung von unterschiedlich strukturierten Massendaten. Es ist ein von der Apache Software Foundation programmiertes Open-Source-Framework für den Stapelverarbeitungsbetrieb. Es sorgt für stabile Analyse- und Speicherprozesse und lässt sich horizontal skalieren. Hauptbestandteile von Hadoop sind das Hadoop MapReduce-Framework und das Hadoop Distributed File System (HDFS). [FeSc15, 279]

Hadoop Distributed File System (HDFS) ist eine Open-Source-Software zur verteilten Verarbeitung von Massendaten in beliebigen Datenformaten in Stapelform (engl.: Batch) auf hoch skalierbaren Server-Clustern. Entwickelt wurde diese neue Technologie mit dem Ziel, große Datenmengen vor allem kostengünstig zu speichern und zu verarbeiten. HDFS stellt eine hohe Verfügbarkeit und Redundanz der Daten sicher. NoSQL und HDFS werden oft in einem Atemzug genannt, denn durch eine gezielte Kombination beider Technologien kann der Zugriff auf Massendaten verbessert werden. [FeSc15, 285; Bitk14, 34f; Müll14, 447ff, Praj13, 28]

Zusammenfassung der Kapitel

1. Einleitung: Diese Einleitung führt in das Thema Big Data ein, beschreibt das exponentielle globale Datenwachstum und leitet die daraus resultierenden neuen Anforderungen an die Informationstechnologie ab.

2. BIG DATA – Grundlagen: Dieses Kapitel definiert den Begriff Big Data anhand der "3V" (Volume, Velocity, Variety) sowie "Veracity" und "Value" und beleuchtet deren Relevanz für Unternehmen.

3. BIG DATA – Technologieansätze im Überblick: Hier werden die technologischen Kernsegmente, eine generelle Taxonomie der Lösungen sowie exemplarische Architekturansätze in der Praxis vorgestellt.

4. Zusammenfassung und Ausblick: Das abschließende Kapitel fasst die technologischen Herausforderungen und Erfolgsfaktoren für Big Data-Strategien zusammen und bewertet die Bedeutung für den Wirtschaftsstandort Deutschland.

Schlüsselwörter

Big Data, Hadoop, NoSQL, In-Memory, Datenmanagement, Skalierbarkeit, Daten-Governance, Daten-Integration, Predictive Analytics, Daten-Ingestion, Wirtschaftsinformatik, Industrie 4.0, Datenwachstum, Cloud-Computing, IT-Strategie

Häufig gestellte Fragen

Worum geht es in der Arbeit grundsätzlich?

Die Arbeit behandelt Big Data als zentrale technologische und wirtschaftliche Herausforderung in einer digitalisierten Welt, analysiert die technologischen Grundlagen und zeigt, wie Unternehmen davon profitieren können.

Was sind die zentralen Themenfelder?

Die zentralen Felder umfassen die Definition und Relevanz von Big Data, die technologische Klassifikation (NoSQL, Streaming, In-Memory) sowie die praktische Anwendung in Architekturmodellen.

Was ist das primäre Ziel der Arbeit?

Ziel ist es, den Begriff Big Data zu klären, einen Überblick über die technologischen Lösungsansätze zu geben und den betriebswirtschaftlichen Mehrwert für Unternehmen aufzuzeigen.

Welche wissenschaftliche Methode wird verwendet?

Die Arbeit nutzt eine Literatur- und Theorieanalyse sowie die Darstellung exemplarischer Architektur- und Fallbeispiele aus der Unternehmenspraxis.

Was wird im Hauptteil behandelt?

Der Hauptteil gliedert sich in die technologischen Segmente, die Taxonomie der Big Data-Technologien (von der Datenhaltung bis zur Governance) und Architekturkonzepte.

Welche Schlüsselwörter charakterisieren die Arbeit?

Die Arbeit lässt sich durch Begriffe wie Big Data, Skalierbarkeit, Hadoop, NoSQL, Analytics, Daten-Governance und digitale Transformation charakterisieren.

Welche Rolle spielt die Daten-Governance bei Big Data?

Daten-Governance ist essenziell, um die Qualität, Sicherheit und Compliance der Daten sicherzustellen, insbesondere wenn durch das Datenvolumen (Volume) eine perfekte Datenqualität nicht immer wirtschaftlich ist.

Wie unterscheidet sich das PSD Bank-Beispiel von herkömmlichen Methoden?

Die PSD Bank nutzt Big Data für eine Echtzeit-Zielgruppenanalyse, bei der bis zu 1.000.000 Datenpunkte pro Sekunde verarbeitet werden, um Kunden individualisierte Angebote zu unterbreiten.

Warum ist das BMW-Beispiel für Big Data relevant?

BMW nutzt die Auswertung von Reparatur-, Diagnose- und Sensordaten, um Produktentwicklungsprozesse zu verbessern, Kosten zu senken und die Kundenzufriedenheit durch proaktive Angebote zu steigern.

Ende der Leseprobe aus 44 Seiten  - nach oben

Details

Titel
BIG DATA. Technologieansätze im Überblick
Hochschule
Universität Regensburg  (Lehrstuhl für Wirtschaftsinformatik I, Informationssysteme)
Note
1,3
Autor
Rainer Emslander (Autor:in)
Erscheinungsjahr
2015
Seiten
44
Katalognummer
V346892
ISBN (eBook)
9783668363816
ISBN (Buch)
9783668363823
Sprache
Deutsch
Schlagworte
BIG DATA SQL HADOOP Scalable No-SQL Streaming In-Memory Haltung Zugriff Visualisierung Daten-Integration Analytische Verarbeitung Technologie Wirkungsprinzip Architektur Lösungsansatz Data Warehouse DW CEP Compex Event Processing CMS Content-Management-System CRM Customer-Relationship-Management Datenbank DSCP Distributed Stream Computing Platform ELT Extract-Load-Transform ERP Enterprise-Resource-Planning ETL Extract-Transform-Load Gigabyte Exabyte Terrabyte GPS Global Positioning System HDFS IMS In-Memory-Systeme IMDB In-Memory-Data-Base IMDG In-Memory-Data-Grip Not only structured query language NoSQL OLAP Online-Analytical-Processing Relational Database Memory System Structured Query Language Random Access Memory Velocity Veracity Value Variety Volume Predictive Analytics Datarisierung Descriptive Analytics Big Data Analytics Diagnostic Analytics Prescriptive Analytics Vernetzung Industrie 4.0
Produktsicherheit
GRIN Publishing GmbH
Arbeit zitieren
Rainer Emslander (Autor:in), 2015, BIG DATA. Technologieansätze im Überblick, München, GRIN Verlag, https://www.grin.com/document/346892
Blick ins Buch
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
Leseprobe aus  44  Seiten
Grin logo
  • Grin.com
  • Versand
  • Kontakt
  • Datenschutz
  • AGB
  • Impressum