GNU/Linux >> Linux Esercitazione >  >> Linux

Converti doc in txt tramite la riga di comando

Dovrai utilizzare due diversi strumenti a riga di comando, a seconda che tu stia lavorando con il formato .doc o .docx.

Per .doc usa catdoc:

catdoc foo.doc > foo.txt

Per .docx usa docx2txt:

docx2txt foo.docx

Quest'ultimo produrrà un file chiamato foo.txt nella stessa directory dell'originale.

Non sono sicuro di quale distribuzione Linux stai utilizzando, ma sia catdoc che docx2txt sono disponibili dai repository di Ubuntu, ad esempio:

apt-get install docx2txt

O con Homebrew su Mac:

brew install docx2txt

ecco un progetto perl che pretende di farlo. Ho fatto molto di questo anche a mano, usando XSLT su document.xml. il file Docx stesso è solo un file zip, puoi decomprimerlo e ispezionare gli elementi. Dirò che questo non è difficile da fare per file specifici, ma è molto difficile da fare nel caso generale, a causa della mancanza di documentazione su come Word memorizza internamente le cose e la varianza della rappresentazione interna.


Linux
  1. Risolvi i problemi di GlusterFS

  2. Come convertire i file di testo in tutto maiuscolo o minuscolo

  3. Come generare schermate video di file video tramite la riga di comando di Linux

  4. Scrivere su file .txt?

  5. openpyxl converte CSV in EXCEL

Comando principale di Linux

Openssl Generazione Sha-256?

dd Esempi di comandi in Linux

Come convertire ISO8859-15 in UTF8?

Converti tutte le estensioni di file in minuscolo

Converti l'output ls in csv