GNU/Linux >> Linux Esercitazione >  >> Linux

Come rimuovere parole duplicate da un file di testo normale usando il comando linux

Supponendo che le parole siano una per riga e che il file sia già ordinato:

uniq filename

Se il file non è ordinato:

sort filename | uniq

Se non sono uno per riga e non ti dispiace che siano uno per riga:

tr -s [:space:] \\n < filename | sort | uniq

Ciò non rimuove la punteggiatura, quindi forse vuoi:

tr -s [:space:][:punct:] \\n < filename | sort | uniq

Ma questo rimuove il trattino dalle parole con trattino. "man tr" per ulteriori opzioni.


ruby -pi.bak -e '$_.split(",").uniq.join(",")' filename ?

Devo ammettere che i due tipi di citazioni sono brutti.


Linux
  1. Come scrivere testo sull'immagine usando il comando Linux

  2. Come rimuovere le righe duplicate all'interno di un file di testo?

  3. 7 Esempi di comandi Linux Uniq per rimuovere le righe duplicate dal file

  4. Come dividere iso o file usando il comando "split" in Linux

  5. Come creare file sparsi in Linux usando il comando 'dd'

Come bloccare un file di testo in Linux usando il comando flock

Come stampare righe duplicate in un file di testo in Linux

Come rimuovere un comando dalla cronologia in Linux

Come rimuovere le righe da un file usando il comando Sed

Come rimuovere (^M) caratteri da un file in Linux

Come rimuovere gli spazi dai nomi dei file in Linux