C'è un buon visualizzatore PDF nei sorgenti di Ubuntu che mi consente di selezionare e copiare il testo? Okular per KDE è un'ottima app, poiché ha un numero di strumenti molto maggiore rispetto a Visualizzatore documenti. Vedo che i repository hanno Okular, ma vorrei evitare di installare tutte le dipendenze di KDE che ne derivano. Tuttavia, tutto ciò che devo fare è selezionare e copiare il testo da un pdf. Cosa mi permetterà di farlo?
Risposta accettata:
Come accennato in un commento, se il testo in un documento pdf è selezionabile come testo o meno, dipende dal fatto che il testo sia nel documento come immagine o come testo . In quest'ultimo caso, tutti i pdf
gli spettatori supportano la selezione del testo per quanto ne so.
Nessuna opzione con testo in un'immagine pdf?
Tuttavia, hai alcune opzioni per rendere "leggibile" il testo in un documento
Un'opzione relativamente sconosciuta, ma molto carina per (anche) convertire pdf
immagini in testo è gimageReader
:
Ha una bella interfaccia e legge il testo selezionato, visualizzato accanto al tuo documento pdf.
per installare, usa il suo ppa:
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader
Nota
Potrebbe essere necessario/volere installare inoltre tesseract
strumenti ocr per linguaggi specifici da utilizzare:
sudo apt-get install tesseract-ocr
e lingue specifiche, ad es.
sudo apt-get install tesseract-ocr-eng
È inoltre possibile selezionare facilmente lingue specifiche utilizzando synaptic
.
Modifica
(almeno) Dal 18.04, gImageReader è nei repository, quindi non è più necessario aggiungere manualmente il ppa.