GNU/Linux >> Linux Esercitazione >  >> Linux

Perché uniq conta le parole identiche come diverse?

Prova prima a ordinare:

cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt

Oppure usa "sort -u" che elimina anche i duplicati. Vedi qui.


La dimensione del file non ha nulla a che fare con ciò che stai vedendo. Dalla pagina man di uniq(1):

Nota:'uniq' non rileva le righe ripetute a meno che non siano adiacenti. Potresti voler ordinare prima l'input o usare 'sort -u' senza 'uniq'. Inoltre, i confronti rispettano le regole specificate da 'LC_COLLATE'.`

Quindi esegui uniq su

a
b
a

restituirà:

a
b
a

Linux
  1. Perché una nuova directory ha un numero di collegamenti fisici pari a 2 prima che venga aggiunto qualcosa?

  2. Utilizzo di Uniq su testo Unicode?

  3. Perché l'uomo stampa "gimme Gimme Gimme" alle 00:30?

  4. Linux – Perché Setuid non funziona??

  5. Perché Unix Time inizia al 1970-01-01?

Comando Linux WC per contare il numero di righe, parole e caratteri

Perché `esce &` non funziona?

Ottenere il conteggio delle occorrenze delle parole nel file di testo di tutte le parole e l'output di stampa ordinato?

Perché Ctrl + Freccia sinistra non salta le parole?

Perché Ls -l genera una dimensione diversa da Ls -s?

Perché top mostra un numero diverso di core rispetto a cpuinfo?