Questa funzione è chiamata deduplicazione . Nessuno dei popolari filesystem Linux (ext*) lo supporta, ma a quanto pare ZFS lo supporta parzialmente. C'è anche una tabella di filesystem che elenca, tra gli altri, la deduplicazione, ma non sembrano esserci scelte popolari - è comunque una funzionalità pianificata per Btrfs.
Immagino che controllare periodicamente il tuo filesystem e creare hard link appropriati sia la cosa migliore che puoi fare al momento, anche se ciò non implica il copy-on-write.
La parola chiave principale che vuoi cercare è "copia su scrittura". BTRFS ha un'operazione di clonazione che fa esattamente quello che vuoi, e cp --reflink
farà quello che stai cercando, a condizione che il tuo sistema abbia un kernel abbastanza moderno e coreutils 7.5. Fonte Wiki Inoltre, bedup è uno strumento che unirà i duplicati su un intero volume. CoW è anche la caratteristica trainante della tecnologia di snapshot di btrfs, IIRC.
Esiste un file system online S3QL progettato per i backup con grande capacità di deduplicazione.