Hausarbeiten logo
Shop
Shop
Tutorials
En De
Shop
Tutorials
  • How to find your topic
  • How to research effectively
  • How to structure an academic paper
  • How to cite correctly
  • How to format in Word
Trends
FAQ
Zur Shop-Startseite › Informatik - Programmierung

Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis

Titel: Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis

Hausarbeit , 2022 , 23 Seiten , Note: 1,4

Autor:in: Anonym (Autor:in)

Informatik - Programmierung

Leseprobe & Details   Blick ins Buch
Zusammenfassung Leseprobe Details

In vielen modernen IT-Systemen und Anwendungen gibt es festgelegte und wiederholte Tasks, die häufig auch in einer gleichbleibenden Reihenfolge oder mit verschiedenen Abhängigkeiten zwischen den Tasks durchgeführt werden. Dabei kann es ggf. zu Problemen in der Datenkonsistenz oder Bearbeitungszeit kommen, wenn diese Tasks und Rechenschritte nicht organisiert und strukturiert werden. Insofern ist die Betrachtung von Softwaretools zur Ausgestaltung und zum Management von festgelegten (Arbeits-) Prozessen, den sogenannten Workflows sinnvoll, die den Ablauf der Prozesse verbessern, Fehler bei der Datenverarbeitung minimieren und die Datenkonsistenz erhöhen.

Ein solches Workflowmanagement-Tool ist Apache Airflow. Apache Airflow wurde von Airbnb entwickelt, um die Prozesse des Unternehmens automatisieren und ein besseres Planen und Monitoren ermöglichen zu können. 2016 wurde Airflow Teil von Apache und damit als Open-Source Tool Nutzern kostenfrei zur Verfügung gestellt. Apache Airflow ermöglicht es, Workflows zu modellieren, auszuführen, pflegen und zu überwachen.

Leseprobe


Inhaltsverzeichnis

  • Einführung
    • Einordnung ins Hadoop Ökosystem
    • Airflow Prinzipien
    • Grundlegende Konzepte
      • Task
      • Task Instance
      • DAG
      • DAG run
  • Komponenten
    • Webserver und Web UI
    • Scheduler & Executor
    • Worker
    • Metadata Database
    • DAG Directory
  • Einsatz in der Praxis
  • Vergleich Workflow Anwendungen
  • Vor- & Nachteile
  • Fazit

Zielsetzung und Themenschwerpunkte

Dieses Dokument bietet eine Einführung in Apache Airflow, ein Open-Source-Tool für Workflow-Management. Es erläutert die Funktionsweise von Airflow, seine Einordnung im Hadoop-Ökosystem, seine Kernprinzipien und grundlegenden Konzepte. Darüber hinaus werden die Komponenten von Airflow vorgestellt und sein Einsatz in der Praxis beschrieben.

  • Workflow-Management mit Apache Airflow
  • Einordnung von Airflow im Hadoop-Ökosystem
  • Kernprinzipien von Airflow
  • Grundlegende Konzepte wie Tasks, Task Instances, DAGs und DAG runs
  • Komponenten von Airflow

Zusammenfassung der Kapitel

  • Einführung: Dieses Kapitel stellt Apache Airflow als Workflow-Management-Tool vor und erläutert die Notwendigkeit für Workflow-Management in modernen IT-Systemen.
  • Einordnung ins Hadoop Ökosystem: Dieses Kapitel erklärt die Rolle von Airflow innerhalb des Hadoop-Ökosystems und zeigt, wie es mit anderen Komponenten zusammenarbeitet.
  • Airflow Prinzipien: Dieses Kapitel beschreibt die vier Kernprinzipien von Airflow - dynamisch, erweiterbar, elegant und skalierbar - die die Workflow-Erstellung und den Betrieb vereinfachen.
  • Grundlegende Konzepte: Dieses Kapitel führt die fundamentalen Konzepte von Airflow wie Tasks, Task Instances, DAGs und DAG runs ein, die die Struktur von Workflows bilden.
  • Komponenten: Dieses Kapitel beschreibt die wichtigsten Komponenten von Airflow, einschließlich des Webservers, des Schedulers, des Executors, des Workers, der Metadata Database und des DAG Directories.
  • Einsatz in der Praxis: Dieses Kapitel beleuchtet die Anwendung von Airflow in realen Szenarien und zeigt praktische Anwendungsbeispiele auf.
  • Vergleich Workflow Anwendungen: Dieses Kapitel vergleicht Airflow mit anderen Workflow-Management-Tools, um seine Stärken und Schwächen im Kontext der verfügbaren Alternativen zu beleuchten.
  • Vor- & Nachteile: Dieses Kapitel analysiert die Vor- und Nachteile von Airflow, um eine objektive Bewertung des Tools zu ermöglichen.

Schlüsselwörter

Apache Airflow, Workflow-Management, Hadoop, Open-Source, Tasks, Task Instances, DAG, DAG run, Scheduler, Executor, Worker, Metadata Database, DAG Directory, dynamisch, erweiterbar, elegant, skalierbar.

Ende der Leseprobe aus 23 Seiten  - nach oben

Details

Titel
Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis
Hochschule
Hochschule Reutlingen
Note
1,4
Autor
Anonym (Autor:in)
Erscheinungsjahr
2022
Seiten
23
Katalognummer
V1358759
ISBN (eBook)
9783346878649
ISBN (Buch)
9783346878656
Sprache
Deutsch
Schlagworte
apache airflow einführung komponenten einsatz praxis
Produktsicherheit
GRIN Publishing GmbH
Arbeit zitieren
Anonym (Autor:in), 2022, Apache Airflow. Einführung, Komponenten und Einsatz in der Praxis, München, GRIN Verlag, https://www.hausarbeiten.de/document/1358759
Blick ins Buch
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • https://cdn.openpublishing.com/images/brand/2/preview_popup_advertising.jpg
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
Leseprobe aus  23  Seiten
Hausarbeiten logo
  • Facebook
  • Instagram
  • TikTok
  • Shop
  • Tutorials
  • FAQ
  • Zahlung & Versand
  • Über uns
  • Contact
  • Datenschutz
  • AGB
  • Impressum