GNU/Linux >> Linux Esercitazione >  >> Ubuntu

Come installare Apache Airflow su Ubuntu 20.04

In questa guida illustreremo come installare Apache Airflow su Ubuntu 20.04

Flusso d'aria Apache è una piattaforma di gestione del flusso di lavoro open source per pipeline di ingegneria dei dati. È iniziato presso Airbnb nell'ottobre 2014 come soluzione per gestire increApache Airflow dell'azienda è una piattaforma di gestione del flusso di lavoro open source per pipeline di ingegneria dei dati.

Apache Airflow è una piattaforma di orchestrazione del flusso di lavoro automatizzata e open source utilizzata per gestire la pianificazione delle attività e la definizione delle priorità. L'interfaccia utilizza un sistema basato su Python per consentire agli utenti di inserire attività e dipendenze. Airflow può quindi essere utilizzato per monitorare la distribuzione e l'esecuzione del carico di lavoro.

Così è iniziato su Airbnb nell'ottobre 2014 come soluzione per gestire i flussi di lavoro sempre più complessi dell'azienda. La creazione di Airflow ha consentito ad Airbnb di creare e programmare i propri flussi di lavoro in modo programmatico e di monitorarli tramite l'interfaccia utente integrata di Airflow. Flussi di lavoro singolarmente complessi. La creazione di Airflow ha consentito a Airbnb di creare e programmare i propri flussi di lavoro in modo programmatico e di monitorarli tramite l'interfaccia utente integrata di Airflow.

Installa Apache Airflow

Segui i passaggi seguenti per iniziare con Apache Airflow

  • Assicurati che tutti i pacchetti di sistema siano aggiornati eseguendo il seguente comando:
sudo apt update -y && sudo apt upgrade -y
  • Il server MySQL è richiesto per Apache Airflow, non utilizzare SQLite come DB di metadati in produzione:dovrebbe essere utilizzato solo per sviluppo/test. Si consiglia di utilizzare Postgresql o MySQL. Fai clic qui per ulteriori informazioni.
  • Il passaggio successivo consiste nell'installare pip con i seguenti comandi:
sudo apt-get install software-properties-common -y
sudo apt-add-repository universe
sudo apt-get update -y
sudo apt-get install python3-pip python-setuptools -y
  • Assicurati che le dipendenze necessarie per Apache Airflow siano installate eseguendo il comando seguente:
sudo apt-get install -y libmysqlclient-dev libssl-dev libkrb5-dev python3-virtualenv python-jinja2
  • Airflow ha bisogno di una home directory in cui memorizza tutte le sue impostazioni, configurazioni, quindi per farlo esegui il comando seguente:
export AIRFLOW_HOME=~/airflow
  • Installa Apache Flusso d'aria con l'esecuzione dei seguenti comandi:
virtualenv airflow_unixcop
cd airflow_unixcop/
pip3 install apache-airflow
pip3 install typing_extensions
  • Quindi riavvia il sistema.
reboot
  • Verifica che Apache Airflow sia stato installato correttamente controllandone la versione
airflow version
  • Il passaggio successivo è inizializzare il database Apache Airflow e aggiornarlo.
airflow initdb
airflow db upgrade
  • Avvia Apache airflow server eseguendo il comando seguente
airflow webserver -p 8080
  • Inoltre puoi creare un utente Apache Airflow,

NOTA :Non sono stati creati nome utente e password predefiniti se stai solo utilizzando la ruota python.

Esegui quanto segue per creare un utente:

airflow users  create --role Admin --username admin --email admin --firstname admin 
  • Per verificare che Apache Airflow sia ora in esecuzione, apri un browser web e vai a localhost:8080 . accedi con l'utente che hai appena creato, verrai reindirizzato alla finestra sottostante

Conclusione

Questo è tutto,
questa guida per l'installazione di Apache Airflow in Ubuntu 20.04

Grazie


Ubuntu
  1. Come installare Apache su Ubuntu 18.04

  2. Come installare Apache su Ubuntu 20.04

  3. Come installare Apache Maven su Ubuntu 18.04

  4. Come installare Apache Sqoop su Ubuntu 16.04

  5. Come installare Apache su Ubuntu?

Come installare Apache Solr 8.9 su Ubuntu 18.04

Come installare OpenOffice su Ubuntu 20.04

Come installare Apache Tomcat 10 su Ubuntu 21

Come installare NetBeans in Ubuntu 21.04

Come installare Apache Airflow su Ubuntu 20.04

Come installare Apache su Ubuntu 20.04