중복 파일 정리 끝판왕, dupeGuru 완벽 가이드
사진과 동영상이 폭증하고, 클라우드 동기화와 백업을 반복하다 보면 어느새 중복 파일이 하드디스크 곳곳을 점령한다. 저장 공간은 줄고 인덱싱·백업 속도는 느려진다. 이때 필요한 게 바로 중복 파일 관리 앱 dupeGuru이다.
1) dupeGuru 한눈에 보기
- 목적: 파일 이름 또는 내용(바이너리) 을 기준으로 중복을 찾아 묶어 준다.
- 운영체제: Windows, macOS(10.12+), Ubuntu(Linux)
- 구현: 핵심은 Python 3. macOS는 Objective-C + Cocoa UI, Windows/Linux는 Qt5 기반 UI를 사용한다.
- 특화 모드: Music(음악 태그 인식), Picture(유사 이미지 판별), Standard(일반 파일)
- 안전장치: Reference Directory(참조 디렉터리)와 그룹화로 원본 보존을 돕는다.
- 처리 방식: 삭제 외에도 이동/복사, 결과 필터·정렬 제공
- 다국어: English, French, German, Simplified Chinese, Czech, Italian, Armenian, Russian, Ukrainian, Brazilian Portuguese, Vietnamese 지원
2) 설치와 준비
다운로드
- 공식 페이지의 Latest Downloads에서 Windows(x64/x32), macOS(10.12+), Ubuntu(x64/x32) 중 선택한다.
- 포터블/소스(zip, tar.gz)도 제공한다.
dupeGuru
dupeGuru is a cross-platform (Linux, OS X, Windows) GUI tool to find duplicate files in a system. It’s written mostly in Python 3 and has the peculiarity of using multiple GUI toolkits, all using the same core Python code. On OS X, the UI layer is writte
dupeguru.voltaicideas.net
설치 팁
- Windows: 기본 설치 후 바로 실행 가능. 관리자 권한 폴더를 정리하려면 관리자 권한으로 실행한다.
- macOS: 첫 실행 차단 시 ‘시스템 설정 > 보안 및 개인정보 보호’에서 허용한다.
- Ubuntu: 배포판 패키지 또는 AppImage/소스 설치를 활용한다.
시작 전 체크리스트
- 정리 대상 볼륨의 백업 또는 스냅샷을 확보한다(특히 외장 드라이브).
- “삭제는 휴지통으로” 옵션을 우선 사용한다.
- 기준이 될 Reference Directory(마스터 폴더)를 정해 둔다(예: ‘정리 완료된 사진 라이브러리’).
3) 첫 사용: 기본 흐름(5단계)
- 모드 선택
- Standard: 일반 문서·압축·영상 등 범용
- Music: MP3/FLAC 등 태그(아티스트/앨범/트랙) 기반 비교
- Picture: 유사 이미지 판별(리사이즈/보정본도 탐지 가능)
- 스캔 범위 지정
- + 버튼으로 폴더(복수) 추가
- 기준이 되는 폴더를 Reference로 지정(그룹 내 우선 보존 대상)
- 스캔 방식과 민감도 설정
- Filenames vs Contents: 이름(빠름, 유사 이름 판별) / 내용(정확, 느릴 수 있음)
- Fuzzy matching 임계값(유사도 퍼센트)을 조정
- 확장자/크기/날짜 등 필터(화이트/블랙리스트) 설정
- 결과 검토
- 결과는 그룹으로 묶여 표시된다(각 그룹은 동일/유사 파일 묶음).
- 컬럼 정렬: 경로·크기·수정일·태그 일치 여부 등으로 정렬
- 의심스러운 매칭은 미리보기(특히 Picture/Music 모드)로 확인
- 처리 실행
- 삭제(휴지통 권장) / 이동 / 복사 중 선택
- 저민감도 스캔에서 생길 수 있는 오탐은 필터링·정렬로 솎아낸다.
4) 모드별 깊이 있는 활용
A. Standard 모드(문서/일반 파일)
- 언제: 다운로드 폴더, 백업 폴더, 프로젝트 산출물 정리
- 권장 설정
- 이름 기반 + Fuzzy 80~90%로 1차,
- 내용 기반으로 2차 검증(시간 더 걸리지만 정확도 상승)
- 전략
- 동일 크기·해시인 경우 ‘확정 중복’으로 분류
- 버전 디렉터리(v1, v2)나 압축본(.zip/.7z)은 그룹별로 최신 수정일 또는 가장 짧은 경로 기준 보존
B. Music 모드(오디오 라이브러리)
- 언제: 앨범 여러 소스 병합, 태그 정리 전/후 중복 제거
- 핵심 포인트
- 태그 우선 비교(아티스트/앨범/트랙/길이/비트레이트)
- 파일명만 다른 동일곡, 초반 무음 편집본 등 변형도 매칭
- 권장 루틴
- 태그 정제(MusicBrainz Picard 등) →
- dupeGuru Music 스캔 →
- 비트레이트/샘플레이트 기준으로 품질 낮은 항목을 삭제하거나 보존 정책 적용
C. Picture 모드(이미지/사진)
- 언제: 스마트폰/카메라/메신저 저장본이 뒤섞인 사진 폴더
- 핵심 포인트
- 리사이즈/워터마크/노출 보정본도 유사 이미지로 집계
- 썸네일/미리보기 파일도 걸러낼 수 있다
- 권장 전략
- 유사도 임계값을 보수적으로 시작(예: 85~90%) → 결과 확인 후 단계적 하향
- 한 그룹에서 해상도·파일 크기가 가장 큰 원본을 Reference로 보존
- 연속 촬영(버스트)이나 노이즈 제거본이 섞인 경우는 미리보기로 육안 확인
5) 안전하게 정리하는 실전 전략
- Reference Directory 지정: “마스터 라이브러리”를 참조로 고정해 항상 보존되도록 한다.
- 휴지통으로 삭제: 초기에는 절대 영구 삭제를 쓰지 않는다. 되살릴 수 있어야 한다.
- 화이트/블랙리스트:
- 화이트리스트: 절대 손대지 않을 폴더(원본 RAW, 계약 보관함 등)
- 블랙리스트: 캐시/썸네일/Temp 같은 소모성 폴더
- 대상 축소 후 확대: 먼저 Downloads/, Desktop/, Pictures/Imported/처럼 안전한 영역부터 → 검증 후 업무 드라이브로 확대
- 내용 스캔은 선별적으로: 느리므로 대용량 볼륨은 이름(또는 크기+해시 조건)으로 1차 필터 후 필요 그룹만 내용 재검사
- 버전 관리 폴더 예외: .git, .venv, node_modules 등은 제외(오탐·오래 걸림)
6) 예시 워크플로 3가지
예시 1) Downloads 폴더 대청소(10분)
- Standard 모드, Filenames + Fuzzy 85%
- 확장자 필터: .exe .msi .zip .pdf .jpg .mp4 우선 정리
- 결과에서 파일 크기↓ 정렬 → 작은 설치 파일/썸네일 위주 삭제
- 나머지는 Contents로 소규모 재검사 → 확정 중복만 영구 처리
예시 2) 사진 합본 라이브러리 구축
- Picture 모드, iPhone/DCIM, Camera/RAW, Google Photos Export를 스캔
- 유사도 90%로 시작 → 그룹별 해상도/용량 최댓값 보존
- 편집본(워터마크/리사이즈)은 별도 폴더로 이동
- 마지막에 휴지통 검토 후 비우기
예시 3) 음악 태그 정리 + 중복 제거
- MusicBrainz Picard로 태그 통일
- dupeGuru Music 모드로 스캔(태그+길이 기준)
- 그룹에서 비트레이트/형식(FLAC>ALAC>MP3) 기준으로 하나만 보존
- 스트리밍 다운로드 잔여물은 블랙리스트 처리
7) 성능 최적화 팁
- SSD 대상부터 스캔하면 초반 체감 속도가 좋아진다.
- 네트워크 드라이브(NAS)는 이름 스캔으로 1차, 필요한 그룹만 내용 재검사한다.
- 사진 대량 폴더는 썸네일 캐시를 미리 생성해 미리보기 지연을 줄인다.
- 결과 창은 그룹 단위로만 조작한다(불필요한 개별 클릭 최소화).
8) 문제 해결(트러블슈팅)
- 삭제가 되지 않음: 권한 문제. 관리자 권한으로 실행하거나 소유권/ACL을 조정한다.
- 아주 느림: 내용 스캔 범위를 좁히고, 시스템·가상환경 폴더 제외, 임계값 상향 조정한다.
- 오탐이 많음: Fuzzy 임계값을 올리고, 확장자/크기 하한 필터를 둔다.
- 같은 사진인데 다른 파일로 인식: RAW↔JPEG 동반 저장 케이스. Picture 모드 유사도 하향(예: 85%) 후 재검사한다.
- 클라우드 폴더 충돌: 동기화 중에는 작업하지 않는다. 동기화 일시 중지 후 실행한다.
9) 자주 묻는 질문(FAQ)
Q. 삭제가 안전한가
A. 기본적으로 그룹 + Reference 개념과 휴지통 삭제로 안전성을 높인다. 최종 삭제 전 반드시 결과를 확인한다.
Q. 내용 스캔과 이름 스캔 중 무엇이 좋은가
A. 정확도는 내용 스캔, 속도는 이름 스캔이 앞선다. 보통 이름 스캔으로 1차 후보를 만들고 민감 그룹만 내용 재검사한다.
Q. 유사 이미지 판단은 믿을 만한가
A. 리사이즈/보정본을 잘 잡아내지만, 합성·크롭 등 강한 편집은 놓칠 수 있다. 임계값을 조절하고 미리보기로 확인한다.
Q. 상용으로 써도 되는가
A. 오픈소스이므로 라이선스 조건(LGPL)을 준수하면 업무용으로도 사용할 수 있다.
10) 체크리스트(요약 정리표)
항목 권장값/전략
최초 실행 | 휴지통 삭제 우선, 백업/스냅샷 확보 |
모드 선택 | Standard / Music / Picture 상황에 맞게 |
스캔 방식 | Filenames(Fuzzy 85~90%) → 필요 그룹만 Contents 재검사 |
Reference | 마스터 폴더를 참조로 지정해 원본 보존 |
필터 | 화이트리스트(보존), 블랙리스트(캐시·Temp) 설정 |
정렬 기준 | 크기·해상도·수정일·품질(음악 비트레이트) |
처리 | 삭제 외 이동/복사 활용, 단계적으로 진행 |
회피 폴더 | .git, .venv, node_modules 등 개발/시스템 폴더 제외 |
네트워크 | 이름 스캔 1차 후 국지적 내용 재검사 |
검수 | 그룹별 미리보기 확인 후 최종 처리 |
마무리
중복 정리는 “한 번에 대청소”보다 빈도 높게, 범위를 작게 가져갈수록 안전하고 빠르다. dupeGuru는 모드별 전문성(음악/사진) 과 강력한 유사도 엔진, 안전한 그룹·참조 설계로 초보자도 실수 없이 공간을 회수하도록 돕는다
직장인 필수앱 모음집-생산성툴 모음! 윈도우 추천 앱
1. 수많은 업무 파일 속에서 꼭 필요한 파일을 1초만에 찾아주는 검색 툴 프로그램.Everything 말도 안 되게 빠른 속도로 검색한다. 이거 없었으면, 매일 혼났을 듯.... 믿고 쓰는 파일 검색 도구, Voidt
nothingcat.tistory.com
무료이면서 강력한 파일 탐색기 대체 프로그램, Q-Dir 리뷰
무료이면서 강력한 파일 탐색기 대체 프로그램, Q-Dir 리뷰Windows 11을 사용하면서도 기본 파일 탐색기(File Explorer)의 아쉬움을 느끼는 사용자가 많다. 이에 따라 다양한 파일 탐색기 대체 프로그램
nothingcat.tistory.com
윈도우 생산성 극대화 가이드 — 초보자도 바로 따라할 수 있는 15가지 핵심 팁
윈도우 생산성 극대화 가이드 — 초보자도 바로 따라할 수 있는 15가지 핵심 팁윈도우는 단순한 운영체제 그 이상이다.많은 사람들이 “윈도우는 기본 기능만 있다”고 생각하지만, 사실은 생산
nothingcat.tistory.com
만능 텍스트 에디터 Notepad++ 자주 쓰이는 실전 활용법
Notepad++ 자주 쓰이는 실전 활용법: 찾아바꾸기, 정규식, 텍스트 정리까지Notepad++는 단순히 ‘글을 쓰는 텍스트 편집기’ 그 이상이다. 특히 찾아바꾸기 기능(Find and Replace), 정규식(Regular Expression),
nothingcat.tistory.com
Google Keep 단순하지만 강력한 노트 앱-메모 앱 추천
요즘은 수많은 노트 앱들이 넘쳐난다. 기능도 다양하고, 구조도 정교하다. 하지만 나는 여전히 Google Keep을 메인 노트 앱 중 하나로 쓰고 있다. 이유는 간단하다. 빠르고, 직관적이고, 내가 원하는
nothingcat.tistory.com
'업무 > 유용한 도구' 카테고리의 다른 글
RunCat 365 귀여운 CPU 사용량 측정기-윈도우 반려 프로그램 (0) | 2025.09.14 |
---|---|
하드디스크 공간 부족할 때 해결 방법-초고속 디스크 분석 도구 WizTree 완벽 가이드 (1) | 2025.08.25 |
불필요한 빈 폴더 정리, 무료 툴 RED(Remove Empty Directories) 리뷰 (1) | 2025.08.25 |
Ninite – 윈도우 포맷 후 필수 프로그램 한 번에 재설치하는 방법 (0) | 2025.08.22 |
윈도우 생산성 극대화 가이드 — 초보자도 바로 따라할 수 있는 15가지 핵심 팁 (3) | 2025.08.21 |