본문 바로가기
업무/유용한 도구

중복 파일 정리 프로그램 끝판왕, dupeGuru 완벽 가이드

by 일상지식적립중 2025. 8. 25.

중복 파일 정리 끝판왕, dupeGuru 완벽 가이드

사진과 동영상이 폭증하고, 클라우드 동기화와 백업을 반복하다 보면 어느새 중복 파일이 하드디스크 곳곳을 점령한다. 저장 공간은 줄고 인덱싱·백업 속도는 느려진다. 이때 필요한 게 바로 중복 파일 관리 앱 dupeGuru이다.


1) dupeGuru 한눈에 보기

  • 목적: 파일 이름 또는 내용(바이너리) 을 기준으로 중복을 찾아 묶어 준다.
  • 운영체제: Windows, macOS(10.12+), Ubuntu(Linux)
  • 구현: 핵심은 Python 3. macOS는 Objective-C + Cocoa UI, Windows/Linux는 Qt5 기반 UI를 사용한다.
  • 특화 모드: Music(음악 태그 인식), Picture(유사 이미지 판별), Standard(일반 파일)
  • 안전장치: Reference Directory(참조 디렉터리)와 그룹화로 원본 보존을 돕는다.
  • 처리 방식: 삭제 외에도 이동/복사, 결과 필터·정렬 제공
  • 다국어: English, French, German, Simplified Chinese, Czech, Italian, Armenian, Russian, Ukrainian, Brazilian Portuguese, Vietnamese 지원

2) 설치와 준비

다운로드

  • 공식 페이지의 Latest Downloads에서 Windows(x64/x32), macOS(10.12+), Ubuntu(x64/x32) 중 선택한다.
  • 포터블/소스(zip, tar.gz)도 제공한다.

 

 

dupeGuru

dupeGuru is a cross-platform (Linux, OS X, Windows) GUI tool to find duplicate files in a system. It’s written mostly in Python 3 and has the peculiarity of using multiple GUI toolkits, all using the same core Python code. On OS X, the UI layer is writte

dupeguru.voltaicideas.net

 

설치 팁

  • Windows: 기본 설치 후 바로 실행 가능. 관리자 권한 폴더를 정리하려면 관리자 권한으로 실행한다.
  • macOS: 첫 실행 차단 시 ‘시스템 설정 > 보안 및 개인정보 보호’에서 허용한다.
  • Ubuntu: 배포판 패키지 또는 AppImage/소스 설치를 활용한다.

시작 전 체크리스트

  • 정리 대상 볼륨의 백업 또는 스냅샷을 확보한다(특히 외장 드라이브).
  • “삭제는 휴지통으로” 옵션을 우선 사용한다.
  • 기준이 될 Reference Directory(마스터 폴더)를 정해 둔다(예: ‘정리 완료된 사진 라이브러리’).

3) 첫 사용: 기본 흐름(5단계)

  1. 모드 선택
    • Standard: 일반 문서·압축·영상 등 범용
    • Music: MP3/FLAC 등 태그(아티스트/앨범/트랙) 기반 비교
    • Picture: 유사 이미지 판별(리사이즈/보정본도 탐지 가능)
  2. 스캔 범위 지정
    • + 버튼으로 폴더(복수) 추가
    • 기준이 되는 폴더를 Reference로 지정(그룹 내 우선 보존 대상)
  3. 스캔 방식과 민감도 설정
    • Filenames vs Contents: 이름(빠름, 유사 이름 판별) / 내용(정확, 느릴 수 있음)
    • Fuzzy matching 임계값(유사도 퍼센트)을 조정
    • 확장자/크기/날짜 등 필터(화이트/블랙리스트) 설정
  4. 결과 검토
    • 결과는 그룹으로 묶여 표시된다(각 그룹은 동일/유사 파일 묶음).
    • 컬럼 정렬: 경로·크기·수정일·태그 일치 여부 등으로 정렬
    • 의심스러운 매칭은 미리보기(특히 Picture/Music 모드)로 확인
  5. 처리 실행
    • 삭제(휴지통 권장) / 이동 / 복사 중 선택
    • 저민감도 스캔에서 생길 수 있는 오탐은 필터링·정렬로 솎아낸다.

4) 모드별 깊이 있는 활용

A. Standard 모드(문서/일반 파일)

  • 언제: 다운로드 폴더, 백업 폴더, 프로젝트 산출물 정리
  • 권장 설정
    • 이름 기반 + Fuzzy 80~90%로 1차,
    • 내용 기반으로 2차 검증(시간 더 걸리지만 정확도 상승)
  • 전략
    • 동일 크기·해시인 경우 ‘확정 중복’으로 분류
    • 버전 디렉터리(v1, v2)나 압축본(.zip/.7z)은 그룹별로 최신 수정일 또는 가장 짧은 경로 기준 보존

B. Music 모드(오디오 라이브러리)

  • 언제: 앨범 여러 소스 병합, 태그 정리 전/후 중복 제거
  • 핵심 포인트
    • 태그 우선 비교(아티스트/앨범/트랙/길이/비트레이트)
    • 파일명만 다른 동일곡, 초반 무음 편집본 등 변형도 매칭
  • 권장 루틴
    1. 태그 정제(MusicBrainz Picard 등) →
    2. dupeGuru Music 스캔 →
    3. 비트레이트/샘플레이트 기준으로 품질 낮은 항목을 삭제하거나 보존 정책 적용

C. Picture 모드(이미지/사진)

  • 언제: 스마트폰/카메라/메신저 저장본이 뒤섞인 사진 폴더
  • 핵심 포인트
    • 리사이즈/워터마크/노출 보정본도 유사 이미지로 집계
    • 썸네일/미리보기 파일도 걸러낼 수 있다
  • 권장 전략
    • 유사도 임계값을 보수적으로 시작(예: 85~90%) → 결과 확인 후 단계적 하향
    • 한 그룹에서 해상도·파일 크기가 가장 큰 원본을 Reference로 보존
    • 연속 촬영(버스트)이나 노이즈 제거본이 섞인 경우는 미리보기로 육안 확인

5) 안전하게 정리하는 실전 전략

  • Reference Directory 지정: “마스터 라이브러리”를 참조로 고정해 항상 보존되도록 한다.
  • 휴지통으로 삭제: 초기에는 절대 영구 삭제를 쓰지 않는다. 되살릴 수 있어야 한다.
  • 화이트/블랙리스트:
    • 화이트리스트: 절대 손대지 않을 폴더(원본 RAW, 계약 보관함 등)
    • 블랙리스트: 캐시/썸네일/Temp 같은 소모성 폴더
  • 대상 축소 후 확대: 먼저 Downloads/, Desktop/, Pictures/Imported/처럼 안전한 영역부터 → 검증 후 업무 드라이브로 확대
  • 내용 스캔은 선별적으로: 느리므로 대용량 볼륨은 이름(또는 크기+해시 조건)으로 1차 필터 후 필요 그룹만 내용 재검사
  • 버전 관리 폴더 예외: .git, .venv, node_modules 등은 제외(오탐·오래 걸림)

6) 예시 워크플로 3가지

예시 1) Downloads 폴더 대청소(10분)

  1. Standard 모드, Filenames + Fuzzy 85%
  2. 확장자 필터: .exe .msi .zip .pdf .jpg .mp4 우선 정리
  3. 결과에서 파일 크기↓ 정렬 → 작은 설치 파일/썸네일 위주 삭제
  4. 나머지는 Contents로 소규모 재검사 → 확정 중복만 영구 처리

예시 2) 사진 합본 라이브러리 구축

  1. Picture 모드, iPhone/DCIM, Camera/RAW, Google Photos Export를 스캔
  2. 유사도 90%로 시작 → 그룹별 해상도/용량 최댓값 보존
  3. 편집본(워터마크/리사이즈)은 별도 폴더로 이동
  4. 마지막에 휴지통 검토 후 비우기

예시 3) 음악 태그 정리 + 중복 제거

  1. MusicBrainz Picard로 태그 통일
  2. dupeGuru Music 모드로 스캔(태그+길이 기준)
  3. 그룹에서 비트레이트/형식(FLAC>ALAC>MP3) 기준으로 하나만 보존
  4. 스트리밍 다운로드 잔여물은 블랙리스트 처리

7) 성능 최적화 팁

  • SSD 대상부터 스캔하면 초반 체감 속도가 좋아진다.
  • 네트워크 드라이브(NAS)는 이름 스캔으로 1차, 필요한 그룹만 내용 재검사한다.
  • 사진 대량 폴더는 썸네일 캐시를 미리 생성해 미리보기 지연을 줄인다.
  • 결과 창은 그룹 단위로만 조작한다(불필요한 개별 클릭 최소화).

8) 문제 해결(트러블슈팅)

  • 삭제가 되지 않음: 권한 문제. 관리자 권한으로 실행하거나 소유권/ACL을 조정한다.
  • 아주 느림: 내용 스캔 범위를 좁히고, 시스템·가상환경 폴더 제외, 임계값 상향 조정한다.
  • 오탐이 많음: Fuzzy 임계값을 올리고, 확장자/크기 하한 필터를 둔다.
  • 같은 사진인데 다른 파일로 인식: RAW↔JPEG 동반 저장 케이스. Picture 모드 유사도 하향(예: 85%) 후 재검사한다.
  • 클라우드 폴더 충돌: 동기화 중에는 작업하지 않는다. 동기화 일시 중지 후 실행한다.

9) 자주 묻는 질문(FAQ)

Q. 삭제가 안전한가

A. 기본적으로 그룹 + Reference 개념과 휴지통 삭제로 안전성을 높인다. 최종 삭제 전 반드시 결과를 확인한다.

Q. 내용 스캔과 이름 스캔 중 무엇이 좋은가

A. 정확도는 내용 스캔, 속도는 이름 스캔이 앞선다. 보통 이름 스캔으로 1차 후보를 만들고 민감 그룹만 내용 재검사한다.

Q. 유사 이미지 판단은 믿을 만한가

A. 리사이즈/보정본을 잘 잡아내지만, 합성·크롭 등 강한 편집은 놓칠 수 있다. 임계값을 조절하고 미리보기로 확인한다.

Q. 상용으로 써도 되는가

A. 오픈소스이므로 라이선스 조건(LGPL)을 준수하면 업무용으로도 사용할 수 있다.


10) 체크리스트(요약 정리표)

항목 권장값/전략

최초 실행 휴지통 삭제 우선, 백업/스냅샷 확보
모드 선택 Standard / Music / Picture 상황에 맞게
스캔 방식 Filenames(Fuzzy 85~90%) → 필요 그룹만 Contents 재검사
Reference 마스터 폴더를 참조로 지정해 원본 보존
필터 화이트리스트(보존), 블랙리스트(캐시·Temp) 설정
정렬 기준 크기·해상도·수정일·품질(음악 비트레이트)
처리 삭제 외 이동/복사 활용, 단계적으로 진행
회피 폴더 .git, .venv, node_modules 등 개발/시스템 폴더 제외
네트워크 이름 스캔 1차 후 국지적 내용 재검사
검수 그룹별 미리보기 확인 후 최종 처리

마무리

중복 정리는 “한 번에 대청소”보다 빈도 높게, 범위를 작게 가져갈수록 안전하고 빠르다. dupeGuru는 모드별 전문성(음악/사진)강력한 유사도 엔진, 안전한 그룹·참조 설계로 초보자도 실수 없이 공간을 회수하도록 돕는다

 

 

 

 

직장인 필수앱 모음집-생산성툴 모음! 윈도우 추천 앱

1. 수많은 업무 파일 속에서 꼭 필요한 파일을 1초만에 찾아주는 검색 툴 프로그램.Everything 말도 안 되게 빠른 속도로 검색한다. 이거 없었으면, 매일 혼났을 듯.... 믿고 쓰는 파일 검색 도구, Voidt

nothingcat.tistory.com

 

 

무료이면서 강력한 파일 탐색기 대체 프로그램, Q-Dir 리뷰

무료이면서 강력한 파일 탐색기 대체 프로그램, Q-Dir 리뷰Windows 11을 사용하면서도 기본 파일 탐색기(File Explorer)의 아쉬움을 느끼는 사용자가 많다. 이에 따라 다양한 파일 탐색기 대체 프로그램

nothingcat.tistory.com

 

 

윈도우 생산성 극대화 가이드 — 초보자도 바로 따라할 수 있는 15가지 핵심 팁

윈도우 생산성 극대화 가이드 — 초보자도 바로 따라할 수 있는 15가지 핵심 팁윈도우는 단순한 운영체제 그 이상이다.많은 사람들이 “윈도우는 기본 기능만 있다”고 생각하지만, 사실은 생산

nothingcat.tistory.com

 

 

만능 텍스트 에디터 Notepad++ 자주 쓰이는 실전 활용법

Notepad++ 자주 쓰이는 실전 활용법: 찾아바꾸기, 정규식, 텍스트 정리까지Notepad++는 단순히 ‘글을 쓰는 텍스트 편집기’ 그 이상이다. 특히 찾아바꾸기 기능(Find and Replace), 정규식(Regular Expression),

nothingcat.tistory.com

 

 

Google Keep 단순하지만 강력한 노트 앱-메모 앱 추천

요즘은 수많은 노트 앱들이 넘쳐난다. 기능도 다양하고, 구조도 정교하다. 하지만 나는 여전히 Google Keep을 메인 노트 앱 중 하나로 쓰고 있다. 이유는 간단하다. 빠르고, 직관적이고, 내가 원하는

nothingcat.tistory.com

 

반응형