Ho una situazione in cui ho bisogno di estrarre immagini da molti file PDF e visualizzarle su un sito web. I miei PDF hanno immagini "normali" e molti grafici.
Ho usato pdf2xml e estrae le immagini nei formati jpeg, ppm, pbm e vec. Vedo che le immagini "normali" vengono estratte (per la maggior parte) come jpeg/ppm/pbm, ma non vedo i grafici presenti, quindi suppongo che pdf2xml le stia memorizzando come file .vec.
Quindi la domanda è come ottengo i miei grafici? Ho usato convert
che viene fornito con imagemagick per convertire .vec in jpeg/png ecc ma senza alcun risultato.
Risposta accettata:
Non ho mai provato pdf2xml, ma sfogliando i suoi file su SourceForge, ho trovato vec2svg-2.py, che sembra essere uno script Python per convertire i file .vec in .svg. Non dovresti avere difficoltà a convertire SVG nel formato di cui hai bisogno.
python vec2svg-2.py -i file.vec -o file.svg