GNU/Linux >> Linux Esercitazione >  >> Ubuntu

Come installare Apache Hive con Hadoop su CentOS, Ubuntu e LinuxMint

Cos'è Apache Hive? Il software di data warehouse Apache Hive facilita l'esecuzione di query e la gestione di grandi set di dati che risiedono nello storage distribuito. Hive fornisce un meccanismo per proiettare la struttura su questi dati ed eseguire query sui dati utilizzando un linguaggio simile a SQL chiamato HiveQL. Leggi di più sul sito ufficiale

Questa guida pratica ti aiuterà a installare Apache Hive su CentOS/RHEL con Hadoop con semplici passaggi.

Passaggio 1:installa JAVA e Hadoop

Apache Hive richiedeva Java 6 o una versione successiva. Dobbiamo anche installare hadoop prima di installare apache hive sul nostro sistema. Usa i link sottostanti per installarli

Passaggi per installare JAVA su CentOS e RHEL 7/6/5
Passaggi per installare Hadoop su Linux

Fase 2:scarica l'archivio Hive

Dopo aver configurato hadoop con successo sul tuo sistema Linux. iniziamo la configurazione dell'alveare. Per prima cosa scarica l'ultimo codice sorgente hive ed estrai l'archivio usando i seguenti comandi.

# cd /home/hadoop
# wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz
# tar xzf hive-0.12.0-bin.tar.gz
# mv hive-0.12.0-bin hive
# chown -R hadoop hive

Fase 3:imposta le variabili d'ambiente

Dopo aver estratto il file di archivio hive, passa all'utente hadoop e imposta le seguenti variabili di ambiente.

# su - hadoop
$ export HADOOP_HOME=/home/hadoop/hadoop
$ export HADOOP_PREFIX=/home/hadoop/hadoop
$ export HIVE_HOME=/home/hadoop/hive
$ export PATH=$HIVE_HOME/bin:$PATH

Fase 4:avvia Hive

Prima di eseguire hive dobbiamo creare /tmp e /utente/alveare/magazzino e impostali chmod g+w in HDFS prima di creare una tabella in Hive. Usa i seguenti comandi.

$ cd /home/hadoop/hive
$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp
$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /tmp
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse

Iniziamo a usare hive usando il seguente comando.

$ bin/hive

Logging initialized using configuration in jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.properties
hive>

Fase 5:crea una tabella demo e prova

A questo punto hai installato con successo hive. Creiamo una tabella di esempio usando il seguente comando

hive>  CREATE TABLE demo1 (id int, name string);
OK
Time taken: 6.565 seconds

Mostra le tabelle create con il comando seguente.

hive> SHOW TABLES;
OK
demo1
Time taken: 0.231 seconds, Fetched: 1 row(s)

Rilascia la tabella usando il comando seguente.

hive> DROP TABLE demo1;
OK
Time taken: 2.393 seconds

Maggiori informazioni sulle operazioni SQL su hive sul sito ufficiale di apache hive.


Ubuntu
  1. Come installare il software Ghost Blog con Apache e SSL su Ubuntu 16.04

  2. Come installare Apache Hadoop su CentOS 7, Ubuntu 18.04 e Debian 9

  3. Come installare Apache Maven su Ubuntu 18.04 e 16.04

  4. Come installare Apache Hadoop su Ubuntu 14.04

  5. Come installare Apache Hadoop su Ubuntu 18.04 LTS

Come installare e configurare il modulo mod_pagespeed con Apache su Ubuntu 20.04 LTS

Come installare il software Ghost Blog con Apache e SSL su Ubuntu 15.10

Come installare PrestaShop su Ubuntu 20.04 con Apache

Come installare e configurare Hadoop su Ubuntu 20.04

Come installare Drupal con Apache su Debian e Ubuntu

Come installare Django 3.2 su Ubuntu 20.04 con Apache e WSGI