Sto cercando un modo semplice (un comando o una serie di comandi, probabilmente che coinvolgono find
) per trovare file duplicati in due directory e sostituire i file in una directory con collegamenti reali dei file nell'altra directory.
Ecco la situazione:questo è un file server su cui più persone archiviano file audio, ogni utente ha la propria cartella. A volte più persone hanno copie degli stessi identici file audio. In questo momento, questi sono duplicati. Mi piacerebbe fare in modo che siano hardlink, per risparmiare spazio sul disco rigido.
Risposta accettata:
C'è uno script perl su http://cpansearch.perl.org/src/ANDK/Perl-Repository-APC-2.002/eg/trimtrees.pl che fa esattamente quello che vuoi:
Attraversa tutte le directory nominate sulla riga di comando
, calcola i checksum MD5
e trova i file con MD5 identico. SE
sono uguali, fai un confronto reale
se sono davvero uguali, sostituisci il
secondo di due file con un collegamento fisico
al primo.