Ciao, penso che non sia necessario scrivere un programma per il tuo scopo, intendo leggere il file pdf in modalità console perché less
comando già fallo per te. Quindi usalo e divertiti.
less "the name of pdf file"
C'è anche il visualizzatore PDF verde. C'è una demo su YouTube.
Ok, hai chiesto di conoscere anche quelli "schifosi". Eccone due (decidi tu stesso sulla loro rispettiva schifezza):
Primo:il txtwrite
di Ghostscript dispositivo di output
gs \
-dBATCH \
-dNOPAUSE \
-sDEVICE=txtwrite \
-sOutputFile=- \
/path/to/your/pdf
Secondo:il pdftotext
di XPDF Utility CLI (migliore di Ghostscript):
pdftotext \
-f 13 \
-l 17 \
-layout \
-opw supersecret \
-upw secret \
-eol unix \
-nopgbrk \
/path/to/your/pdf
- |less
Verrà visualizzato l'intervallo di pagine 13 (f prima pagina) a 17 (l ast), conserva il layout di un file PDF denominato protetto da doppia password (utilizzando password utente e proprietario secret e supersegreto ), con la convenzione Unix EOL, ma senza l'inserimento di interruzioni di pagina tra le pagine PDF, reindirizzate attraverso less...
pdftotext -h
visualizza tutte le opzioni della riga di comando disponibili.
Ovviamente, entrambi gli strumenti funzionano solo per le parti di testo dei PDF (se presenti). Oh, e anche la formula matematica non funzionerà troppo bene...;-)
Modifica: Ho digitato male il comando sopra (originariamente usando pdftops
invece di pdftotext
).