Grin logo
en de es fr
Shop
GRIN Website
Publicación mundial de textos académicos
Go to shop › Ciencias de la computación - Programación

Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis

Título: Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis

Trabajo Escrito , 2022 , 23 Páginas , Calificación: 1,4

Autor:in: Anonym (Autor)

Ciencias de la computación - Programación
Extracto de texto & Detalles   Leer eBook
Resumen Extracto de texto Detalles

In vielen modernen IT-Systemen und Anwendungen gibt es festgelegte und wiederholte Tasks, die häufig auch in einer gleichbleibenden Reihenfolge oder mit verschiedenen Abhängigkeiten zwischen den Tasks durchgeführt werden. Dabei kann es ggf. zu Problemen in der Datenkonsistenz oder Bearbeitungszeit kommen, wenn diese Tasks und Rechenschritte nicht organisiert und strukturiert werden. Insofern ist die Betrachtung von Softwaretools zur Ausgestaltung und zum Management von festgelegten (Arbeits-) Prozessen, den sogenannten Workflows sinnvoll, die den Ablauf der Prozesse verbessern, Fehler bei der Datenverarbeitung minimieren und die Datenkonsistenz erhöhen.

Ein solches Workflowmanagement-Tool ist Apache Airflow. Apache Airflow wurde von Airbnb entwickelt, um die Prozesse des Unternehmens automatisieren und ein besseres Planen und Monitoren ermöglichen zu können. 2016 wurde Airflow Teil von Apache und damit als Open-Source Tool Nutzern kostenfrei zur Verfügung gestellt. Apache Airflow ermöglicht es, Workflows zu modellieren, auszuführen, pflegen und zu überwachen.

Extracto


Inhaltsverzeichnis

  • Einführung
    • Einordnung ins Hadoop Ökosystem
    • Airflow Prinzipien
    • Grundlegende Konzepte
      • Task
      • Task Instance
      • DAG
      • DAG run
  • Komponenten
    • Webserver und Web UI
    • Scheduler & Executor
    • Worker
    • Metadata Database
    • DAG Directory
  • Einsatz in der Praxis
  • Vergleich Workflow Anwendungen
  • Vor- & Nachteile
  • Fazit

Zielsetzung und Themenschwerpunkte

Dieses Dokument bietet eine Einführung in Apache Airflow, ein Open-Source-Tool für Workflow-Management. Es erläutert die Funktionsweise von Airflow, seine Einordnung im Hadoop-Ökosystem, seine Kernprinzipien und grundlegenden Konzepte. Darüber hinaus werden die Komponenten von Airflow vorgestellt und sein Einsatz in der Praxis beschrieben.

  • Workflow-Management mit Apache Airflow
  • Einordnung von Airflow im Hadoop-Ökosystem
  • Kernprinzipien von Airflow
  • Grundlegende Konzepte wie Tasks, Task Instances, DAGs und DAG runs
  • Komponenten von Airflow

Zusammenfassung der Kapitel

  • Einführung: Dieses Kapitel stellt Apache Airflow als Workflow-Management-Tool vor und erläutert die Notwendigkeit für Workflow-Management in modernen IT-Systemen.
  • Einordnung ins Hadoop Ökosystem: Dieses Kapitel erklärt die Rolle von Airflow innerhalb des Hadoop-Ökosystems und zeigt, wie es mit anderen Komponenten zusammenarbeitet.
  • Airflow Prinzipien: Dieses Kapitel beschreibt die vier Kernprinzipien von Airflow - dynamisch, erweiterbar, elegant und skalierbar - die die Workflow-Erstellung und den Betrieb vereinfachen.
  • Grundlegende Konzepte: Dieses Kapitel führt die fundamentalen Konzepte von Airflow wie Tasks, Task Instances, DAGs und DAG runs ein, die die Struktur von Workflows bilden.
  • Komponenten: Dieses Kapitel beschreibt die wichtigsten Komponenten von Airflow, einschließlich des Webservers, des Schedulers, des Executors, des Workers, der Metadata Database und des DAG Directories.
  • Einsatz in der Praxis: Dieses Kapitel beleuchtet die Anwendung von Airflow in realen Szenarien und zeigt praktische Anwendungsbeispiele auf.
  • Vergleich Workflow Anwendungen: Dieses Kapitel vergleicht Airflow mit anderen Workflow-Management-Tools, um seine Stärken und Schwächen im Kontext der verfügbaren Alternativen zu beleuchten.
  • Vor- & Nachteile: Dieses Kapitel analysiert die Vor- und Nachteile von Airflow, um eine objektive Bewertung des Tools zu ermöglichen.

Schlüsselwörter

Apache Airflow, Workflow-Management, Hadoop, Open-Source, Tasks, Task Instances, DAG, DAG run, Scheduler, Executor, Worker, Metadata Database, DAG Directory, dynamisch, erweiterbar, elegant, skalierbar.

Final del extracto de 23 páginas  - subir

Detalles

Título
Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis
Universidad
Reutlingen University
Calificación
1,4
Autor
Anonym (Autor)
Año de publicación
2022
Páginas
23
No. de catálogo
V1358759
ISBN (PDF)
9783346878649
ISBN (Libro)
9783346878656
Idioma
Alemán
Etiqueta
apache airflow einführung komponenten einsatz praxis
Seguridad del producto
GRIN Publishing Ltd.
Citar trabajo
Anonym (Autor), 2022, Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis, Múnich, GRIN Verlag, https://www.grin.com/document/1358759
Leer eBook
  • Si ve este mensaje, la imagen no pudo ser cargada y visualizada.
  • https://cdn.openpublishing.com/images/brand/1/preview_popup_advertising.jpg
  • Si ve este mensaje, la imagen no pudo ser cargada y visualizada.
  • Si ve este mensaje, la imagen no pudo ser cargada y visualizada.
  • Si ve este mensaje, la imagen no pudo ser cargada y visualizada.
  • Si ve este mensaje, la imagen no pudo ser cargada y visualizada.
  • Si ve este mensaje, la imagen no pudo ser cargada y visualizada.
  • Si ve este mensaje, la imagen no pudo ser cargada y visualizada.
  • Si ve este mensaje, la imagen no pudo ser cargada y visualizada.
Extracto de  23  Páginas
Grin logo
  • Grin.com
  • Page::Footer::PaymentAndShipping
  • Contacto
  • Privacidad
  • Aviso legal
  • Imprint