GNU/Linux >> Linux Esercitazione >  >> Linux

Come vedere i contenuti dei file Hive orc in Linux

Risposta aggiornata nell'anno 2020 :

Secondo la risposta di @Owen, ORC è cresciuto e maturato come il proprio progetto Apache. Un elenco completo di utenti ORC mostra quanto sia diffuso ora supportato in molte varietà di tecnologie Big Data.

Ringraziamo @Owen e il team del progetto ORC Apache, il sito del progetto ORC ha una documentazione aggiornata completamente mantenuta sull'utilizzo dello strumento autonomo Java o C++ sul file ORC memorizzato su un file system locale Linux. Che ha portato avanti la fiaccola per la pagina wiki originale di Hive+ORC Apache.

Risposta originale datata:May 30 '14 at 16:27

L'utilità di dump del file ORC viene fornita con hive (0.11 o superiore):

hive --orcfiledump <hdfs-location-of-orc-file>

Collegamento sorgente


È anche in grado di vedere il contenuto di un file ORC dall'applicazione desktop in esecuzione su Linux.

Esiste un'applicazione desktop per visualizzare Parquet e anche altri dati in formato binario come ORC e ​​AVRO. È un'applicazione Java pura in modo che possa essere eseguita su Linux, Mac e anche Windows. Si prega di controllare Bigdata File Viewer per i dettagli.

Supporta tipi di dati complessi come array, map, struct, ecc.


Ora c'è anche un eseguibile nativo per Linux e MacOS che stampa il contenuto del file orc in JSON. Vedere il progetto ORC (http://orc.apache.org/) e creare gli strumenti C++.

% orc-contents examples/TestOrcFile.test1.orc

C'è anche uno strumento di metadati nativo:

% orc-metadata ../examples/TestOrcFile.test1.orc

Il progetto ORC ha anche un uber jar autonomo che può fare lo stesso da Java.

% java -jar orc-tools-1.2.3-uber.jar data myfile.orc

Linux
  1. Come convertire file in codifica UTF-8 in Linux

  2. Come visualizzare il contenuto dei file compressi in Linux

  3. Come visualizzare o modificare l'ACL nei file Linux

  4. Come estrarre i file .gz e .tar.gz in Linux

  5. Come vedo du in GB invece di MB in Linux?

Come troncare (svuotare) i file in Linux

Come rinominare uno o più file in Linux

Come decomprimere i file gz in Linux

Come trovare file basati su timestamp in Linux

Come eliminare i file elencati in un altro file in Linux

Come comprimere un file in Linux