Reading time: 1 – 2 minutes
Sovint costa trobar eines o petits scripts que fassin coses aparenment tan estupides com la comentada. De fet per windows he trobat alguns programes que tenen bona pinta tot i que no els he provat encara. Però per linux m’ha costat una mica més fins que he trobat el fdupes (local). Esta programat en C i realment és molt senzill d’usar i força potent.
També he trobat un petit script en bash que fa una busqueda força rudimentaria però útil en alguns casos:
OUTF=rem-duplicates.sh; echo "#! /bin/sh" > $OUTF; find "$@" -type f -print0 | xargs -0 -n1 md5sum | sort --key=1,32 | uniq -w 32 -d --all-repeated=separate | sed -r 's/^[0-9a-f]*( )*//;s/([^a-zA-Z0-9./_-])/\\\1/g;s/(.+)/#rm \1/' >> $OUTF; chmod a+x $OUTF; ls -l $OUTF
La pàgina on he trobat aquest script és Unix shell script for removing duplicate files.
0 thoughts on “Buscar fitxers amb el contingut duplicat en linux…”
Jo utilitzo la comanda 'repeats' per buscar fitxers duplicats, està inclosa dins de littleutils, que encara no está a gentoo. Vaig fer l'ebuild fa temps però encara no l'han inclos al portage. Pots veure'l aquí:
http://bugs.gentoo.org/show_bug.cgi?id=109072…