Pour trouver des images en double dans un répertoire sous Debian, vous pouvez utiliser plusieurs méthodes basées sur l’empreinte de fichiers, la comparaison des métadonnées ou même le contenu visuel des images. Voici quelques solutions populaires pour automatiser cela sur un système Debian :
Méthode 1 : Utilisation de fdupes
(pour détecter les doublons par contenu de fichier)
fdupes
est un outil de ligne de commande qui recherche les fichiers en double dans un répertoire en comparant leur contenu binaire.
Installation de fdupes
:
sudo apt update
sudo apt install fdupes
Utilisation de fdupes
pour rechercher les doublons :
fdupes -r /chemin/vers/le/repertoire
- Option
-r
: Recherche récursive dans les sous-dossiers. - Vous pouvez également utiliser l’option
-d
pour supprimer les doublons ou-s
pour n’afficher que les résumés.
Exemple :
fdupes -r /home/user/images
Méthode 2 : Utilisation de rdfind
(pour les doublons de fichiers en général)
rdfind
est un autre outil qui détecte les doublons dans un répertoire. Il compare les fichiers en fonction de leur taille, de leurs métadonnées et de leur contenu.
Installation de rdfind
:
sudo apt update
sudo apt install rdfind
Utilisation de rdfind
:
rdfind /chemin/vers/le/repertoire
Par défaut, rdfind
détecte les fichiers en double et génère un rapport dans le terminal.
Exemple :
rdfind /home/user/images
Si vous voulez remplacer automatiquement les doublons par des liens symboliques pour économiser de l’espace disque, utilisez l’option :
rdfind -makehardlinks true /chemin/vers/le/repertoire
Méthode 3 : Utilisation de dupeGuru
(pour les doublons d’images, y compris les visuels similaires)
dupeGuru
est un outil avancé qui détecte les fichiers en double, y compris les images qui sont visuellement similaires mais pas forcément identiques au niveau des octets (par exemple, redimensionnées ou compressées).
Installation de dupeGuru
:
dupeGuru
n’est pas disponible directement via apt
, mais vous pouvez l’installer via un paquet .deb
ou en utilisant Python.
- Téléchargez le fichier
.deb
depuis le site officiel de dupeGuru ou via la commande suivante pour une installation via APT :
sudo apt install python3-pyqt5 python3-sip
wget https://github.com/arsenetar/dupeguru/releases/download/4.3.1/dupeguru_4.3.1_amd64.deb
sudo dpkg -i dupeguru_4.3.1_amd64.deb
sudo apt --fix-broken install
- Une fois installé, vous pouvez l’utiliser soit en mode graphique, soit en ligne de commande pour scanner les doublons dans votre répertoire d’images.
Utilisation :
- Lancez
dupeGuru
en mode graphique via le menu ou via la commande suivante :
dupeguru
- Sélectionnez le mode « Image » et ajoutez le dossier à scanner. L’outil peut comparer les images en fonction de leur contenu visuel, même si elles ont des différences mineures.
Méthode 4 : Utilisation de findimagedupes
(basé sur la similarité des images)
findimagedupes
est un outil Perl qui compare les images en fonction de leur contenu visuel pour trouver les doublons. Il utilise l’analyse des pixels pour détecter les images similaires.
Installation de findimagedupes
:
- Installez les dépendances :
sudo apt update
sudo apt install findimagedupes libjpeg-progs
- Utilisation pour rechercher des images similaires :
findimagedupes /chemin/vers/le/repertoire
Cela vous permet de trouver non seulement des images identiques, mais aussi des images qui sont visuellement similaires.
Conclusion
- fdupes et rdfind sont parfaits pour détecter les fichiers identiques par leur contenu binaire (idéal pour les fichiers d’images strictement en double).
- dupeGuru est plus puissant pour détecter les images qui sont visuellement similaires, même avec des différences mineures.
- findimagedupes est idéal pour une recherche plus précise basée sur les pixels.
Ces outils vous permettent de gérer les doublons d’images sous Debian en fonction de vos besoins.
fdupes trouve plus de doublons que rdfind