Zunächst werden im allgemeinen Teil der vorliegenden Arbeit das Data-Warehouse-System und die HADOOP-Technologie definiert. Dabei wird auf die Teilbereiche HDFS, Map-Reduce und YARN eingegangen. Daraufhin werden mögliche Gründe für den Einsatz dieser Techniken geliefert. In Kapitel 3 werden dann die Möglichkeiten für einen Einsatz von HADOOP zur Erweiterung der klassischen Data-Warehouse-Architektur aufgezeigt. Abschließend wird die vorliegende Arbeit kurz zusammengefasst und ein Fazit daraus gezogen.
Inhaltsverzeichnis
Abbildungsverzeichnis
Abkürzungsverzeichnis
1 Einleitung
1.1 Motivation
1.2 Zielsetzung und Vorgehensweise
2 Grundlagen
2.1 Definition von Data-Warehouse-Systemen
2.2 Definition der HADOOP-Technologie
2.2.1 HDFS
2.2.2 Map-Reduce
2.2.3 YARN
2.3 Gründe für den Einsatz der HADOOP-Technologie
3 Möglichkeiten zur Erweiterung der klassischen Data-Warehouse-Architektur um HADOOP
3.1 HADOOP als Staging-Area im ETL-Prozess
3.2 HADOOP als ELT-Worker
3.3 HADOOP als Datenbank
3.4 HADOOP als langfristig verfügbares Datenarchiv
5 Fazit
Literaturverzeichnis
- Quote paper
- Johannes Veeh (Author), 2016, Integration von HADOOP in die Data-Warehouse-Architektur, Munich, GRIN Verlag, https://www.grin.com/document/431601