GNU/Linux >> Linux Esercitazione >  >> Ubuntu

Come installare lo strumento Pentaho Data Integration (PDI) su Ubuntu

Lo strumento di integrazione dei dati Pentaho è uno strumento di analisi aziendale utilizzato per l'integrazione dei dati nell'analisi dei dati. La business intelligence (BI) viene eseguita principalmente sull'integrazione dei dati, l'analisi dei dati e la visualizzazione dei dati, in cui i dati vengono forniti da un'origine di input e vengono divisi in molte parti per varie operazioni come l'unione, l'unione e la manipolazione. L'integrazione dei dati è il processo di raccolta, connessione ed elaborazione dei dati.

I dati possono essere utilizzati in diversi tipi. I dati grezzi, i dati in tempo reale, i dati del database e qualsiasi fonte di dati possono essere utilizzati per la sintesi dei dati. Il database viene eseguito su Structured Query Language (SQL), dove l'integrazione dei dati Pentaho richiede anche una solida conoscenza di SQL.

Strumento di integrazione dei dati Pentaho (PDI)

Sono disponibili strumenti di integrazione dei dati open source per i processi di Business Intelligence (BI) e di visualizzazione dei dati. Esistono diversi strumenti di integrazione dei dati open source come Clover ETL, Pentaho, Karma, Pimcore, Skool, Myddleware, Talend Open Studio . Tra questi, PDI è lo strumento di integrazione dei dati più utilizzato e facile da usare. Ha un'interfaccia utente grafica (GUI) intelligente ed equilibrata. PDI viene utilizzato principalmente per l'elaborazione dei dati, che può essere utilizzata anche con il file system Hadoop (HDFS).

Per l'elaborazione analitica online (OLAP) e la visualizzazione dei dati, è molto importante gestire i dati con attenzione e manipolarli se necessario. Per questo tipo di lavoro, l'integrazione dei dati Pentaho è uno strumento utile che può essere eseguito in quasi tutti i sistemi operativi.

Oggi vedremo come installare correttamente lo strumento di integrazione dei dati Pentaho su Ubuntu. Utilizziamo Ubuntu come piattaforma comune, ma anche altre distribuzioni di Linux come Kali, Mint, Red Hat, Lubuntu, ecc. sono compatibili con Pentaho.

Installazione dello strumento di integrazione dei dati Pentaho

Lo strumento di integrazione dei dati Pentaho richiede la versione 1.8 di Java. Se nel tuo sistema è in esecuzione qualsiasi altra versione di Java, devi disinstallarla e reinstallare java 8. Devi assicurarti di avere java 8 installato come predefinito.

Passaggio 1:verifica della versione Java

Per controllare l'attuale versione java della tua macchina, vai al terminale e digita il comando terminale indicato di seguito. Questo mostrerà la tua versione java corrente se hai già installato java.

java -version
- -

Se la tua macchina non ha java installato, ti mostrerà le righe di comando di base su come installare Java dal terminale.

Passaggio 2:installazione e configurazione di Java 8

Se hai la versione richiesta di Java, che è 1.8, sei a posto! Ma se non hai la versione richiesta di Java, segui la riga di comando nel terminale per installare java 1.8. Se hai la versione successiva di Java installata nel tuo sistema, devi prima eliminarla. Per farlo, digita la seguente riga di comando nel tuo terminale.

sudo apt remove openjdk-11-jre-headless openjdk-11-jre openjdk-11-jdk-headless openjdk-11-jdk

Per installare java 1.8 ecco la riga di comando del terminale:

sudo apt install openjdk-8-jdk

Dopo aver installato Java 1.8, impostala come versione predefinita di Java. Per questo, segui la riga di comando nel terminale.

sudo update-alternatives --config java
sudo apt install default-jre

Fase 3:download dello strumento di integrazione dei dati Pentaho

Dopo aver installato e configurato Java, ora sei pronto per scaricare lo strumento Pentaho Data Integration (PDI). Il link per il download è riportato di seguito. È quasi un file compresso da 1,5 Gb.

Download dello strumento di integrazione dei dati Pentaho

Al termine del download, estrai il file compresso. E poi, troverai la cartella dei file di PDI simile all'immagine qui sotto.

Qui, all'interno della cartella PDI, devi trovare il cucchiaio strumento, che verrà eseguito per aprire il PDI. Ora è giunto il momento di discutere dello strumento cucchiaio. Con l'aiuto di Java, il cucchiaio esegue lo strumento di integrazione dei dati Pentaho all'interno della tua macchina.

Per eseguire lo strumento cucchiaio, vai all'interno della cartella di integrazione dei dati di Pentaho, fai clic con il pulsante destro del mouse in un punto qualsiasi della cartella e seleziona 'apri con terminale' . Una volta aperto il terminale, apparirà così:

Quindi digita sh spoon.sh  e premi il pulsante Invio. Ecco qua! Lo strumento di integrazione dei dati di Pentaho si sta aprendo!

Eseguirà Java nel tuo sistema e contemporaneamente verrà visualizzata una finestra pop-up sullo schermo che indica che il PDI si sta aprendo. Il tuo display dovrebbe assomigliare all'immagine riportata di seguito.

Passaggio 4:configurazione dello strumento di integrazione dei dati Pentaho per il primo utilizzo

Qui, hai quasi finito di installare l'integrazione dei dati Pentaho nella tua macchina. Ora sei pronto per l'uso! L'integrazione dei dati di Pentaho ti consente di connettere database, caricare file CSV, eseguire operazioni SQL e molto altro ancora. Oggi mostreremo come inviare e-mail dall'integrazione dei dati Pentaho.

Per lo più, l'integrazione dei dati di Pentaho consente l'invio di e-mail allo scopo di segnalare lo stato di avanzamento dei lavori. PDI consente anche di allegare file via e-mail all'estremità client dell'integrazione dei dati Pentaho. Per inviare un'e-mail dallo strumento di integrazione dei dati di Pentaho, devi ottenere l'autorizzazione dal servizio di posta elettronica che stai utilizzando.

Ad esempio, se utilizzi Gmail, devi ottenere l'autorizzazione da Gmail. Per questo all'inizio, devi accedere a Gmail, quindi nelle impostazioni di sicurezza; lì devi concedere l'accesso ad "Accesso alle app meno sicure".

Ora torniamo allo strumento di integrazione dei dati di Pentaho! Nella finestra di integrazione dei dati di Pentaho, troverai due opzioni principali, sono:

  • Trasformazioni
  • Offerte di lavoro

Dopo aver cliccato su Lavori, sotto Lavori, troverai l'opzione "Posta". Ora devi trascinare e rilasciare la funzione di posta nella finestra di sinistra, come mostrato nell'immagine qui sotto.

Successivamente, in Pentaho Data Integration in alto, troverai una barra di ricerca, digita "Start" e troverai un oggetto chiamato "Start". Devi trascinare e rilasciare anche quello nella finestra vuota a sinistra. Nello stesso processo, devi trascinare e rilasciare il pulsante "Successo" nella stessa finestra. L'allineamento di quei 3 pulsanti all'interno della finestra sarà,

Inizio> Posta> Successo

Ora è il momento di collegare tra loro i 3 pulsanti all'interno dello strumento di integrazione dei dati Pentaho. Per questo, devi tenere premuto il pulsante "Shift" dalla tastiera e fare clic sul primo oggetto che desideri unire con l'oggetto successivo, tenendo premuto shift e trascinando il cursore del mouse i pulsanti saranno interconnessi. Successivamente, è necessario configurare le impostazioni della funzione "Start". Per quel doppio clic sulla funzione "Start", si aprirà una finestra di dialogo in cui troverai le opzioni di impostazione.

La guida alle impostazioni principali dell'invio di e-mail nell'integrazione dei dati Pentaho è riportata di seguito con esempi.

Nella colonna "Indirizzo", le impostazioni saranno:

Indirizzo di destinazione: Questo indirizzo sarà l'indirizzo e-mail a cui desideri inviare un'e-mail dall'integrazione dei dati di Pentaho. Se hai più di un destinatario e-mail, usa semplicemente una virgola (,) tra due e-mail. Puoi anche usare Cc e Ccn se lo desideri.
Nome mittente: È il tuo indirizzo email che dispone dell'autorizzazione di "Accesso ad app meno sicure"

Nella colonna "Server" le impostazioni saranno:

Server SMTP :smtp.gmail.com(per il servizio Gmail)
Porta: 465

Seleziona l'autenticazione , l'impostazione di autenticazione sarà:

Utente di autenticazione: È il tuo indirizzo email che dispone dell'autorizzazione di "Accesso ad app meno sicure". Inserisci l'e-mail all'interno dell'integrazione dei dati di Pentaho.
Password di autenticazione:
Password della tua e-mail di autenticazione. Quindi seleziona "Utilizza autenticazione sicura".
Tipo di autenticazione sicura:SSL

Nella colonna "Messaggio email", le impostazioni saranno:

Includere la data nel messaggio? : Segno di spunta
Utilizza il formato HTML nel corpo della posta: Segno di spunta
Codifica: UTF-8
Oggetto: Oggetto della tua email
Commento: Corpo della tua email.

Dopo aver terminato questa configurazione lì, troverai una colonna denominata "File allegati" se desideri allegare qualsiasi file con la tua email devi impostare anche questa colonna. L'integrazione dei dati di Pentaho consente agli utenti di allegare un file con l'e-mail.

Ora salva questo file PDI nella tua macchina, l'estensione del file sarà nome_file.ktr
Qui, .ktr è l'estensione del file bollitore di Pentaho bollitore. Dopo che il file è stato salvato e tutto è perfetto, fai clic sul pulsante "Avvia", che inizializzerà il tuo lavoro di posta elettronica. Verificherà le impostazioni PDI e invierà l'e-mail al destinatario.

Se tutto è stato eseguito correttamente, riceverai un messaggio di successo, come mostrato di seguito nell'immagine. Se succede qualcosa di sbagliato, vedrai il messaggio di errore sullo schermo. Dopo aver corretto quegli errori, riprovare ti porterà al successo.

Tocco finale

Ecco a voi la fase finale di questo post. In questo post, abbiamo discusso i fondamenti della PDI. Abbiamo visto il processo per evitare errori java e come impostare una versione java come predefinita. Nel mezzo di questo post, abbiamo discusso le impostazioni del pulsante e-mail di PDI. E in fondo, abbiamo discusso delle impostazioni del fornitore di posta elettronica e delle impostazioni dell'utente finale.

L'integrazione dei dati di Pentaho è uno strumento di business intelligence (BI) per l'integrazione dei dati che ha una caratteristica speciale di invio di e-mail ai clienti. Ha molte più funzioni per l'analisi dei dati. Se hai qualcosa da condividere con altri sugli strumenti di integrazione dei dati o hai qualcosa da chiedere in relazione a questo post, puoi chiedere nella sezione commenti qui sotto.


Ubuntu
  1. Come installare Java su Ubuntu

  2. Come installare Java su Ubuntu Linux

  3. Come installare Java su Ubuntu 18.04

  4. Come installare Gradle su Ubuntu 18.04

  5. Come installare Java 17 in Ubuntu 20.04

Come installare OpenJDK (Java) su Ubuntu

Come installare NetBeans su Ubuntu 20.04

Come installare Oracle Java 16 su Ubuntu 18.04 / 20.04

Come installare Java su Ubuntu 22.04 LTS

Come installare Java JDK 9 su Ubuntu 15.04

Come installare Java su Ubuntu 22.04