Esistono numerosi lettori OCR per Linux in grado di convertire da immagine a testo. Guarda le seguenti opzioni:
- GOCR:pagina Wikipedia
- Ocrad:pagina Wikipedia
- ocropus:pagina Wikipedia
- tesseract-ocr:pagina di Wikipedia
Tutto quanto sopra, eccetto ocropus, è presente nel repository di Ubuntu in un pacchetto con lo stesso nome.
Diversi lettori supportano diversi formati di immagine, quindi potresti essere limitato nelle tue opzioni dal formato di file in cui si trova il tuo documento. In alternativa, puoi utilizzare lo strumento di conversione di ImageMagick per modificare il formato se desideri utilizzare un particolare lettore OCR.
Adattato dalla mia risposta qui.