In questo tutorial, ti mostreremo come installare Apache Airflow su Ubuntu 20.04 LTS. Per chi non lo sapesse, Airflow è una delle soluzioni di gestione del flusso di lavoro più popolari, autori, pianifica e monitora i flussi di lavoro. Airflow è scritto in Python e i flussi di lavoro sono creati tramite script Python. Airflow è progettato secondo il principio della "configurazione come codice".
Questo articolo presuppone che tu abbia almeno una conoscenza di base di Linux, sappia come usare la shell e, soprattutto, che ospiti il tuo sito sul tuo VPS. L'installazione è abbastanza semplice e presuppone che tu sono in esecuzione nell'account root, in caso contrario potrebbe essere necessario aggiungere 'sudo
' ai comandi per ottenere i privilegi di root. Ti mostrerò l'installazione passo passo dello strumento di gestione dei flussi di lavoro Apache Airflow su Ubuntu 20.04 (Focal Fossa). Puoi seguire le stesse istruzioni per Ubuntu 18.04, 16.04 e qualsiasi altra distribuzione basata su Debian come Linux Mint.
Prerequisiti
- Un server che esegue uno dei seguenti sistemi operativi:Ubuntu 20.04, 18.04, 16.04 e qualsiasi altra distribuzione basata su Debian come Linux Mint.
- Si consiglia di utilizzare una nuova installazione del sistema operativo per prevenire potenziali problemi.
- Accesso SSH al server (o semplicemente apri Terminal se sei su un desktop).
- Un
non-root sudo user
o accedere all'root user
. Ti consigliamo di agire comenon-root sudo user
, tuttavia, poiché puoi danneggiare il tuo sistema se non stai attento quando agisci come root.
Installa Apache Airflow su Ubuntu 20.04 LTS Focal Fossa
Passaggio 1. Innanzitutto, assicurati che tutti i pacchetti di sistema siano aggiornati eseguendo il seguente apt
comandi nel terminale.
sudo apt update sudo apt upgrade
Passaggio 2. Installazione del database MySQL.
È richiesto il server MySQL. Se non hai installato MySQL, puoi seguire la nostra guida qui.
Passaggio 3. Installazione di Pip.
Esegui il seguente comando per installare Pip sul tuo sistema:
sudo apt-get install software-properties-common sudo apt-add-repository universe sudo apt-get update sudo apt-get install python-setuptools sudo apt install python3-pip
Passaggio 4. Installazione di Apache Airflow su Ubuntu 20.04.
Prima di installare Apache Airflow, dovrai eseguire i seguenti comandi per assicurarti che le dipendenze necessarie siano installate:
sudo apt-get install libmysqlclient-dev sudo apt-get install libssl-dev sudo apt-get install libkrb5-dev
Una volta terminato, ora installa Apache Airflow utilizzando il seguente comando:
sudo apt install python3-virtualenv virtualenv airflow_idroot cd airflow_idroot/ source activate export AIRFLOW_HOME=~/airflow install apache-airflow pip3 install typing_extensions airflow db init airflow webserver -p 8080
Passaggio 5. Accesso all'interfaccia Web di Apache Airflow.
Una volta installato correttamente, apri un browser web e digita l'URL:https://localhost:8080
. Dovresti vedere la seguente pagina:
Congratulazioni! Hai installato con successo Apache Airflow. Grazie per aver utilizzato questo tutorial per l'installazione dello strumento di gestione dei flussi di lavoro Apache Airflow su Ubuntu 20.04 LTS Focal Fossa system. Per ulteriore aiuto o informazioni utili, ti consigliamo di controlla il sito Web ufficiale di Apache Airflow.