Sto avendo un dilemma se modificare un file javascript o meno. Quando lo apro con gedit, mostra il seguente avviso:
Il file che hai aperto contiene alcuni caratteri non validi. Se continui
a modificare questo file potresti danneggiare questo documento. Puoi anche scegliere
un'altra codifica dei caratteri e riprovare.
La codifica corrente è UTF-8. Poiché il file contiene oltre 100.000 righe di codice, esiste un modo rapido per cercare i caratteri non validi?
Risposta accettata:
Poiché il file è UTF-8, puoi eseguire isutf8. Un pacchetto di utilità aggiuntivo.
Ti fornisce sia riga, carattere che offset per byte danneggiati.
Quindi usa xxd, hexdump o simili per analizzare.
Purtroppo si ferma al primo crash. Ma poi di nuovo dipende dal file. Potrebbe
esserci solo un byte danneggiato 😉
Avere del codice C che esegua un'analisi simile ma per l'intero file. È su
un disco da qualche parte dimenticato da tempo. Potrebbe provare a trovarlo se necessario.
Altrimenti sì, il veloce e non quello modo sporco sarebbe fare un diff tra
una copia salvata con gedit – come proposto dal buon mr. @vonbrand.