Apache Airflow
![]() | |
Тип | ETL |
---|---|
Розробник | Apache Software Foundation, Airbnb |
Стабільний випуск | 1.10.1 |
Мова програмування | Python ![]() |
Стан розробки | активний |
Ліцензія | Apache Software License 2.0d[1] і Apache License ![]() |
Репозиторій | github.com/apache/airflow |
Вебсайт | airflow.apache.org ![]() |
Airflow - це програма для створення, запуску і моніторингу потоків робіт.[2]
Опис
Потоки робіт в Airflow задаються орієнтованими ациклічними графами (англ. directed acyclic graph, DAG). DAG - це набір задач які потрібно виконати і залежностей між ними.[3]
Кожен DAG описується мовою Python, і завантажується в Airflow з файлів директорії вказаної змінною DAG_FOLDER
, якщо всередині файлу зустрічаються рядок "airflow"
і рядок DAG
. Airflow виконає кожен такий файл і імпортує з них всі об'єкти в глобальному просторі імен модуля що мають тип DAG
.[3]
Конкретні задачі які виконуються в кожному вузлі DAG-а задаються операторами (англ. Operators). Існує багато різних класів операторів, наприклад[3]:
BashOperator
- виконує команди BashPythonOperator
- викликає довільну функцію мовою PythonSimpleHttpOperator
- надсилає HTTP запитMySqlOperator
,SqliteOperator
,PostgresOperator
,JdbcOperator
, і т.п. - виконує SQL запитSensor
- певний час очікує виконання якоїсь умови
Існують також різноманітні спеціальні оператори, наприклад цілий набір для виконання різних дій з Google Cloud Platform[4]
![]() | Цей розділ потребує доповнення. |
Історія
Проект розпочатий Максимом Бушеманом (фр. Maxime Beauchemin) в Airbnb в 2014-му році. Офіційно переведений на Github Airbnb в 2015, а в травні 2016 приєднаний до інкубатора Apache Software Foundation.[5]
Хмарні сервіси
Google Cloud Composer
Google Cloud Platform серед інших сервісів надає також Airflow, під назвою Cloud Composer.[6] Запуск бета версії сервісу відбувся 1 травня 2018 року[7].
Див. також
Зноски
- ↑ https://airflow.incubator.apache.org/license.html
- ↑ https://airflow.readthedocs.io/en/latest/
- ↑ а б в https://airflow.apache.org/concepts.html
- ↑ https://airflow.apache.org/howto/operator.html#google-cloud-platform-operators
- ↑ https://airflow.apache.org/project.html
- ↑ https://cloud.google.com/composer/
- ↑ https://cloud.google.com/blog/products/gcp/cloud-composer-is-now-in-beta-build-and-run-practical-workflows-with-minimal-effort