Cos'è Apache Hive? Il software di data warehouse Apache Hive facilita l'esecuzione di query e la gestione di grandi set di dati che risiedono nello storage distribuito. Hive fornisce un meccanismo per proiettare la struttura su questi dati ed eseguire query sui dati utilizzando un linguaggio simile a SQL chiamato HiveQL. Leggi di più sul sito ufficiale
Questa guida pratica ti aiuterà a installare Apache Hive su CentOS/RHEL con Hadoop con semplici passaggi.
Passaggio 1:installa JAVA e Hadoop
Apache Hive richiedeva Java 6 o una versione successiva. Dobbiamo anche installare hadoop prima di installare apache hive sul nostro sistema. Usa i link sottostanti per installarli
Passaggi per installare JAVA su CentOS e RHEL 7/6/5
Passaggi per installare Hadoop su Linux
Fase 2:scarica l'archivio Hive
Dopo aver configurato hadoop con successo sul tuo sistema Linux. iniziamo la configurazione dell'alveare. Per prima cosa scarica l'ultimo codice sorgente hive ed estrai l'archivio usando i seguenti comandi.
# cd /home/hadoop # wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz # tar xzf hive-0.12.0-bin.tar.gz # mv hive-0.12.0-bin hive # chown -R hadoop hive
Fase 3:imposta le variabili d'ambiente
Dopo aver estratto il file di archivio hive, passa all'utente hadoop e imposta le seguenti variabili di ambiente.
# su - hadoop $ export HADOOP_HOME=/home/hadoop/hadoop $ export HADOOP_PREFIX=/home/hadoop/hadoop $ export HIVE_HOME=/home/hadoop/hive $ export PATH=$HIVE_HOME/bin:$PATH
Fase 4:avvia Hive
Prima di eseguire hive dobbiamo creare /tmp e /utente/alveare/magazzino e impostali chmod g+w in HDFS prima di creare una tabella in Hive. Usa i seguenti comandi.
$ cd /home/hadoop/hive $ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp $ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse $ $HADOOP_HOME/bin/hadoop fs -chmod g+w /tmp $ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse
Iniziamo a usare hive usando il seguente comando.
$ bin/hive Logging initialized using configuration in jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.properties hive>
Fase 5:crea una tabella demo e prova
A questo punto hai installato con successo hive. Creiamo una tabella di esempio usando il seguente comando
hive> CREATE TABLE demo1 (id int, name string); OK Time taken: 6.565 seconds
Mostra le tabelle create con il comando seguente.
hive> SHOW TABLES; OK demo1 Time taken: 0.231 seconds, Fetched: 1 row(s)
Rilascia la tabella usando il comando seguente.
hive> DROP TABLE demo1; OK Time taken: 2.393 seconds
Maggiori informazioni sulle operazioni SQL su hive sul sito ufficiale di apache hive.