Grin logo
en de es fr
Shop
GRIN Website
Publier des textes, profitez du service complet
Go to shop › Informatique - Programmation

Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis

Titre: Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis

Dossier / Travail , 2022 , 23 Pages , Note: 1,4

Autor:in: Anonym (Auteur)

Informatique - Programmation
Extrait & Résumé des informations   Lire l'ebook
Résumé Extrait Résumé des informations

In vielen modernen IT-Systemen und Anwendungen gibt es festgelegte und wiederholte Tasks, die häufig auch in einer gleichbleibenden Reihenfolge oder mit verschiedenen Abhängigkeiten zwischen den Tasks durchgeführt werden. Dabei kann es ggf. zu Problemen in der Datenkonsistenz oder Bearbeitungszeit kommen, wenn diese Tasks und Rechenschritte nicht organisiert und strukturiert werden. Insofern ist die Betrachtung von Softwaretools zur Ausgestaltung und zum Management von festgelegten (Arbeits-) Prozessen, den sogenannten Workflows sinnvoll, die den Ablauf der Prozesse verbessern, Fehler bei der Datenverarbeitung minimieren und die Datenkonsistenz erhöhen.

Ein solches Workflowmanagement-Tool ist Apache Airflow. Apache Airflow wurde von Airbnb entwickelt, um die Prozesse des Unternehmens automatisieren und ein besseres Planen und Monitoren ermöglichen zu können. 2016 wurde Airflow Teil von Apache und damit als Open-Source Tool Nutzern kostenfrei zur Verfügung gestellt. Apache Airflow ermöglicht es, Workflows zu modellieren, auszuführen, pflegen und zu überwachen.

Extrait


Inhaltsverzeichnis

  • Einführung
    • Einordnung ins Hadoop Ökosystem
    • Airflow Prinzipien
    • Grundlegende Konzepte
      • Task
      • Task Instance
      • DAG
      • DAG run
  • Komponenten
    • Webserver und Web UI
    • Scheduler & Executor
    • Worker
    • Metadata Database
    • DAG Directory
  • Einsatz in der Praxis
  • Vergleich Workflow Anwendungen
  • Vor- & Nachteile
  • Fazit

Zielsetzung und Themenschwerpunkte

Dieses Dokument bietet eine Einführung in Apache Airflow, ein Open-Source-Tool für Workflow-Management. Es erläutert die Funktionsweise von Airflow, seine Einordnung im Hadoop-Ökosystem, seine Kernprinzipien und grundlegenden Konzepte. Darüber hinaus werden die Komponenten von Airflow vorgestellt und sein Einsatz in der Praxis beschrieben.

  • Workflow-Management mit Apache Airflow
  • Einordnung von Airflow im Hadoop-Ökosystem
  • Kernprinzipien von Airflow
  • Grundlegende Konzepte wie Tasks, Task Instances, DAGs und DAG runs
  • Komponenten von Airflow

Zusammenfassung der Kapitel

  • Einführung: Dieses Kapitel stellt Apache Airflow als Workflow-Management-Tool vor und erläutert die Notwendigkeit für Workflow-Management in modernen IT-Systemen.
  • Einordnung ins Hadoop Ökosystem: Dieses Kapitel erklärt die Rolle von Airflow innerhalb des Hadoop-Ökosystems und zeigt, wie es mit anderen Komponenten zusammenarbeitet.
  • Airflow Prinzipien: Dieses Kapitel beschreibt die vier Kernprinzipien von Airflow - dynamisch, erweiterbar, elegant und skalierbar - die die Workflow-Erstellung und den Betrieb vereinfachen.
  • Grundlegende Konzepte: Dieses Kapitel führt die fundamentalen Konzepte von Airflow wie Tasks, Task Instances, DAGs und DAG runs ein, die die Struktur von Workflows bilden.
  • Komponenten: Dieses Kapitel beschreibt die wichtigsten Komponenten von Airflow, einschließlich des Webservers, des Schedulers, des Executors, des Workers, der Metadata Database und des DAG Directories.
  • Einsatz in der Praxis: Dieses Kapitel beleuchtet die Anwendung von Airflow in realen Szenarien und zeigt praktische Anwendungsbeispiele auf.
  • Vergleich Workflow Anwendungen: Dieses Kapitel vergleicht Airflow mit anderen Workflow-Management-Tools, um seine Stärken und Schwächen im Kontext der verfügbaren Alternativen zu beleuchten.
  • Vor- & Nachteile: Dieses Kapitel analysiert die Vor- und Nachteile von Airflow, um eine objektive Bewertung des Tools zu ermöglichen.

Schlüsselwörter

Apache Airflow, Workflow-Management, Hadoop, Open-Source, Tasks, Task Instances, DAG, DAG run, Scheduler, Executor, Worker, Metadata Database, DAG Directory, dynamisch, erweiterbar, elegant, skalierbar.

Fin de l'extrait de 23 pages  - haut de page

Résumé des informations

Titre
Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis
Université
Reutlingen University
Note
1,4
Auteur
Anonym (Auteur)
Année de publication
2022
Pages
23
N° de catalogue
V1358759
ISBN (PDF)
9783346878649
ISBN (Livre)
9783346878656
Langue
allemand
mots-clé
apache airflow einführung komponenten einsatz praxis
Sécurité des produits
GRIN Publishing GmbH
Citation du texte
Anonym (Auteur), 2022, Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis, Munich, GRIN Verlag, https://www.grin.com/document/1358759
Lire l'ebook
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • https://cdn.openpublishing.com/images/brand/1/preview_popup_advertising.jpg
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
Extrait de  23  pages
Grin logo
  • Grin.com
  • Page::Footer::PaymentAndShipping
  • Contact
  • Prot. des données
  • CGV
  • Imprint