重複ファイル検出
ハッシュ値を比較して重複ファイルを検出し削除候補を一覧表示するツール。hashlib・os活用。
1. アプリ概要
ハッシュ値を比較して重複ファイルを検出し削除候補を一覧表示するツール。hashlib・os活用。
このアプリはfileカテゴリの実践的なPythonアプリです。使用ライブラリは tkinter(標準ライブラリ)、難易度は ★★★ です。
Pythonの豊富なライブラリを活用することで、実用的なアプリを短いコードで実装できます。ソースコードをコピーして実行し、仕組みを理解したうえでカスタマイズに挑戦してみてください。
GUIアプリ開発はプログラミングの楽しさを実感できる最も効果的な学習方法のひとつです。変数・関数・クラス・イベント処理などの重要な概念が自然と身につきます。
2. 機能一覧
- 重複ファイル検出のメイン機能
- 直感的なGUIインターフェース
- 入力値のバリデーション
- エラーハンドリング
- 結果の見やすい表示
- クリア機能付き
3. 事前準備・環境
Python 3.10 以上 / Windows・Mac・Linux すべて対応
以下の環境で動作確認しています。
- Python 3.10 以上
- OS: Windows 10/11・macOS 12+・Ubuntu 20.04+
4. 完全なソースコード
右上の「コピー」ボタンをクリックするとコードをクリップボードにコピーできます。
import tkinter as tk
from tkinter import ttk, messagebox, filedialog
import os
import hashlib
import threading
from collections import defaultdict
class App053:
"""重複ファイル検出"""
def __init__(self, root):
self.root = root
self.root.title("重複ファイル検出")
self.root.geometry("860x580")
self.root.configure(bg="#1e1e1e")
self._scanning = False
self._build_ui()
def _build_ui(self):
header = tk.Frame(self.root, bg="#252526", pady=6)
header.pack(fill=tk.X)
tk.Label(header, text="🔍 重複ファイル検出",
font=("Noto Sans JP", 12, "bold"),
bg="#252526", fg="#4fc3f7").pack(side=tk.LEFT, padx=12)
# フォルダ選択
top = tk.Frame(self.root, bg="#1e1e1e", pady=4)
top.pack(fill=tk.X, padx=8)
tk.Label(top, text="スキャン対象:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT)
self.folder_var = tk.StringVar()
ttk.Entry(top, textvariable=self.folder_var,
width=50).pack(side=tk.LEFT, padx=4)
ttk.Button(top, text="参照",
command=self._pick_folder).pack(side=tk.LEFT)
# オプション
opt = tk.Frame(self.root, bg="#1e1e1e", pady=2)
opt.pack(fill=tk.X, padx=8)
self.recurse_var = tk.BooleanVar(value=True)
tk.Checkbutton(opt, text="サブフォルダも含める",
variable=self.recurse_var,
bg="#1e1e1e", fg="#ccc", selectcolor="#3c3c3c",
activebackground="#1e1e1e").pack(side=tk.LEFT)
tk.Label(opt, text="比較方法:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT, padx=(12, 4))
self.method_var = tk.StringVar(value="md5")
ttk.Combobox(opt, textvariable=self.method_var,
values=["md5", "sha256", "サイズ+名前"],
state="readonly", width=12).pack(side=tk.LEFT)
ttk.Button(opt, text="▶ スキャン開始",
command=self._start_scan).pack(side=tk.LEFT, padx=12)
ttk.Button(opt, text="🗑 選択削除",
command=self._delete_selected).pack(side=tk.LEFT)
# 結果ツリー
result_f = tk.Frame(self.root, bg="#1e1e1e")
result_f.pack(fill=tk.BOTH, expand=True, padx=8, pady=4)
self.tree = ttk.Treeview(result_f, columns=("path", "size", "hash"),
show="tree headings", selectmode="extended")
self.tree.heading("#0", text="グループ / ファイル")
self.tree.heading("path", text="パス")
self.tree.heading("size", text="サイズ")
self.tree.heading("hash", text="ハッシュ/識別子")
self.tree.column("#0", width=220, anchor="w")
self.tree.column("path", width=340, anchor="w")
self.tree.column("size", width=80, anchor="e")
self.tree.column("hash", width=120, anchor="w")
sb = ttk.Scrollbar(result_f, command=self.tree.yview)
self.tree.configure(yscrollcommand=sb.set)
sb.pack(side=tk.RIGHT, fill=tk.Y)
self.tree.pack(fill=tk.BOTH, expand=True)
self.tree.tag_configure("group", foreground="#ffd700", font=("Arial", 9, "bold"))
self.tree.tag_configure("dup", foreground="#f48771")
# 進捗
self.progress = ttk.Progressbar(self.root, mode="indeterminate")
self.progress.pack(fill=tk.X, padx=8)
self.status_var = tk.StringVar(value="フォルダを選択してスキャンしてください")
tk.Label(self.root, textvariable=self.status_var,
bg="#252526", fg="#858585", font=("Arial", 9),
anchor="w", padx=8).pack(fill=tk.X, side=tk.BOTTOM)
def _pick_folder(self):
folder = filedialog.askdirectory()
if folder:
self.folder_var.set(folder)
def _start_scan(self):
folder = self.folder_var.get().strip()
if not folder or not os.path.isdir(folder):
messagebox.showerror("エラー", "有効なフォルダを指定してください")
return
self.progress.start()
self.status_var.set("スキャン中...")
threading.Thread(target=self._do_scan, args=(folder,),
daemon=True).start()
def _do_scan(self, folder):
try:
files = []
if self.recurse_var.get():
for dirpath, _, filenames in os.walk(folder):
for fn in filenames:
files.append(os.path.join(dirpath, fn))
else:
files = [os.path.join(folder, f)
for f in os.listdir(folder)
if os.path.isfile(os.path.join(folder, f))]
method = self.method_var.get()
groups = defaultdict(list)
for path in files:
try:
key = self._file_key(path, method)
groups[key].append(path)
except Exception:
pass
duplicates = {k: v for k, v in groups.items() if len(v) > 1}
self.root.after(0, self._show_results, duplicates, len(files))
except Exception as e:
self.root.after(0, self._on_error, str(e))
def _file_key(self, path, method):
size = os.path.getsize(path)
if method == "サイズ+名前":
return f"{size}_{os.path.basename(path)}"
algo = hashlib.md5() if method == "md5" else hashlib.sha256()
with open(path, "rb") as f:
for chunk in iter(lambda: f.read(65536), b""):
algo.update(chunk)
return algo.hexdigest()
def _show_results(self, duplicates, total):
self.progress.stop()
self.tree.delete(*self.tree.get_children())
total_dup = sum(len(v) for v in duplicates.values())
total_groups = len(duplicates)
for i, (key, paths) in enumerate(duplicates.items(), 1):
size = os.path.getsize(paths[0])
size_str = self._fmt_size(size)
wasted = self._fmt_size(size * (len(paths) - 1))
group_node = self.tree.insert(
"", tk.END,
text=f"グループ {i} ({len(paths)} 件, 無駄: {wasted})",
values=("", "", key[:16]),
tags=("group",), open=True)
for path in paths:
self.tree.insert(group_node, tk.END,
text=os.path.basename(path),
values=(path, size_str, ""),
tags=("dup",))
self.status_var.set(
f"スキャン完了: {total} 件中 {total_dup} 件の重複を検出 "
f"({total_groups} グループ)")
def _on_error(self, msg):
self.progress.stop()
messagebox.showerror("エラー", msg)
self.status_var.set("エラーが発生しました")
def _delete_selected(self):
sel = self.tree.selection()
if not sel:
return
to_delete = []
for iid in sel:
path = self.tree.set(iid, "path")
if path and os.path.isfile(path):
to_delete.append(path)
if not to_delete:
messagebox.showinfo("情報", "削除対象のファイルが選択されていません")
return
if not messagebox.askyesno(
"削除確認",
f"{len(to_delete)} 件のファイルを削除します。\n"
"この操作は元に戻せません。よろしいですか?"):
return
ok = err = 0
for path in to_delete:
try:
os.remove(path)
ok += 1
except Exception:
err += 1
self.status_var.set(f"削除完了: {ok} 件成功 / {err} 件失敗")
self._start_scan()
@staticmethod
def _fmt_size(size):
for unit in ("B", "KB", "MB", "GB"):
if size < 1024:
return f"{size:.1f} {unit}"
size /= 1024
return f"{size:.1f} TB"
if __name__ == "__main__":
root = tk.Tk()
app = App053(root)
root.mainloop()
5. コード解説
重複ファイル検出のコードを詳しく解説します。クラスベースの設計で各機能を整理して実装しています。
クラス設計とコンストラクタ
App053クラスにアプリの全機能をまとめています。__init__でウィンドウ設定、_build_ui()でUI構築、process()でメイン処理を担当します。責任の分離により、コードが読みやすくなります。
import tkinter as tk
from tkinter import ttk, messagebox, filedialog
import os
import hashlib
import threading
from collections import defaultdict
class App053:
"""重複ファイル検出"""
def __init__(self, root):
self.root = root
self.root.title("重複ファイル検出")
self.root.geometry("860x580")
self.root.configure(bg="#1e1e1e")
self._scanning = False
self._build_ui()
def _build_ui(self):
header = tk.Frame(self.root, bg="#252526", pady=6)
header.pack(fill=tk.X)
tk.Label(header, text="🔍 重複ファイル検出",
font=("Noto Sans JP", 12, "bold"),
bg="#252526", fg="#4fc3f7").pack(side=tk.LEFT, padx=12)
# フォルダ選択
top = tk.Frame(self.root, bg="#1e1e1e", pady=4)
top.pack(fill=tk.X, padx=8)
tk.Label(top, text="スキャン対象:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT)
self.folder_var = tk.StringVar()
ttk.Entry(top, textvariable=self.folder_var,
width=50).pack(side=tk.LEFT, padx=4)
ttk.Button(top, text="参照",
command=self._pick_folder).pack(side=tk.LEFT)
# オプション
opt = tk.Frame(self.root, bg="#1e1e1e", pady=2)
opt.pack(fill=tk.X, padx=8)
self.recurse_var = tk.BooleanVar(value=True)
tk.Checkbutton(opt, text="サブフォルダも含める",
variable=self.recurse_var,
bg="#1e1e1e", fg="#ccc", selectcolor="#3c3c3c",
activebackground="#1e1e1e").pack(side=tk.LEFT)
tk.Label(opt, text="比較方法:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT, padx=(12, 4))
self.method_var = tk.StringVar(value="md5")
ttk.Combobox(opt, textvariable=self.method_var,
values=["md5", "sha256", "サイズ+名前"],
state="readonly", width=12).pack(side=tk.LEFT)
ttk.Button(opt, text="▶ スキャン開始",
command=self._start_scan).pack(side=tk.LEFT, padx=12)
ttk.Button(opt, text="🗑 選択削除",
command=self._delete_selected).pack(side=tk.LEFT)
# 結果ツリー
result_f = tk.Frame(self.root, bg="#1e1e1e")
result_f.pack(fill=tk.BOTH, expand=True, padx=8, pady=4)
self.tree = ttk.Treeview(result_f, columns=("path", "size", "hash"),
show="tree headings", selectmode="extended")
self.tree.heading("#0", text="グループ / ファイル")
self.tree.heading("path", text="パス")
self.tree.heading("size", text="サイズ")
self.tree.heading("hash", text="ハッシュ/識別子")
self.tree.column("#0", width=220, anchor="w")
self.tree.column("path", width=340, anchor="w")
self.tree.column("size", width=80, anchor="e")
self.tree.column("hash", width=120, anchor="w")
sb = ttk.Scrollbar(result_f, command=self.tree.yview)
self.tree.configure(yscrollcommand=sb.set)
sb.pack(side=tk.RIGHT, fill=tk.Y)
self.tree.pack(fill=tk.BOTH, expand=True)
self.tree.tag_configure("group", foreground="#ffd700", font=("Arial", 9, "bold"))
self.tree.tag_configure("dup", foreground="#f48771")
# 進捗
self.progress = ttk.Progressbar(self.root, mode="indeterminate")
self.progress.pack(fill=tk.X, padx=8)
self.status_var = tk.StringVar(value="フォルダを選択してスキャンしてください")
tk.Label(self.root, textvariable=self.status_var,
bg="#252526", fg="#858585", font=("Arial", 9),
anchor="w", padx=8).pack(fill=tk.X, side=tk.BOTTOM)
def _pick_folder(self):
folder = filedialog.askdirectory()
if folder:
self.folder_var.set(folder)
def _start_scan(self):
folder = self.folder_var.get().strip()
if not folder or not os.path.isdir(folder):
messagebox.showerror("エラー", "有効なフォルダを指定してください")
return
self.progress.start()
self.status_var.set("スキャン中...")
threading.Thread(target=self._do_scan, args=(folder,),
daemon=True).start()
def _do_scan(self, folder):
try:
files = []
if self.recurse_var.get():
for dirpath, _, filenames in os.walk(folder):
for fn in filenames:
files.append(os.path.join(dirpath, fn))
else:
files = [os.path.join(folder, f)
for f in os.listdir(folder)
if os.path.isfile(os.path.join(folder, f))]
method = self.method_var.get()
groups = defaultdict(list)
for path in files:
try:
key = self._file_key(path, method)
groups[key].append(path)
except Exception:
pass
duplicates = {k: v for k, v in groups.items() if len(v) > 1}
self.root.after(0, self._show_results, duplicates, len(files))
except Exception as e:
self.root.after(0, self._on_error, str(e))
def _file_key(self, path, method):
size = os.path.getsize(path)
if method == "サイズ+名前":
return f"{size}_{os.path.basename(path)}"
algo = hashlib.md5() if method == "md5" else hashlib.sha256()
with open(path, "rb") as f:
for chunk in iter(lambda: f.read(65536), b""):
algo.update(chunk)
return algo.hexdigest()
def _show_results(self, duplicates, total):
self.progress.stop()
self.tree.delete(*self.tree.get_children())
total_dup = sum(len(v) for v in duplicates.values())
total_groups = len(duplicates)
for i, (key, paths) in enumerate(duplicates.items(), 1):
size = os.path.getsize(paths[0])
size_str = self._fmt_size(size)
wasted = self._fmt_size(size * (len(paths) - 1))
group_node = self.tree.insert(
"", tk.END,
text=f"グループ {i} ({len(paths)} 件, 無駄: {wasted})",
values=("", "", key[:16]),
tags=("group",), open=True)
for path in paths:
self.tree.insert(group_node, tk.END,
text=os.path.basename(path),
values=(path, size_str, ""),
tags=("dup",))
self.status_var.set(
f"スキャン完了: {total} 件中 {total_dup} 件の重複を検出 "
f"({total_groups} グループ)")
def _on_error(self, msg):
self.progress.stop()
messagebox.showerror("エラー", msg)
self.status_var.set("エラーが発生しました")
def _delete_selected(self):
sel = self.tree.selection()
if not sel:
return
to_delete = []
for iid in sel:
path = self.tree.set(iid, "path")
if path and os.path.isfile(path):
to_delete.append(path)
if not to_delete:
messagebox.showinfo("情報", "削除対象のファイルが選択されていません")
return
if not messagebox.askyesno(
"削除確認",
f"{len(to_delete)} 件のファイルを削除します。\n"
"この操作は元に戻せません。よろしいですか?"):
return
ok = err = 0
for path in to_delete:
try:
os.remove(path)
ok += 1
except Exception:
err += 1
self.status_var.set(f"削除完了: {ok} 件成功 / {err} 件失敗")
self._start_scan()
@staticmethod
def _fmt_size(size):
for unit in ("B", "KB", "MB", "GB"):
if size < 1024:
return f"{size:.1f} {unit}"
size /= 1024
return f"{size:.1f} TB"
if __name__ == "__main__":
root = tk.Tk()
app = App053(root)
root.mainloop()
UIレイアウトの構築
LabelFrameで入力エリアと結果エリアを視覚的に分けています。pack()で縦に並べ、expand=Trueで結果エリアが画面いっぱいに広がるよう設定しています。
import tkinter as tk
from tkinter import ttk, messagebox, filedialog
import os
import hashlib
import threading
from collections import defaultdict
class App053:
"""重複ファイル検出"""
def __init__(self, root):
self.root = root
self.root.title("重複ファイル検出")
self.root.geometry("860x580")
self.root.configure(bg="#1e1e1e")
self._scanning = False
self._build_ui()
def _build_ui(self):
header = tk.Frame(self.root, bg="#252526", pady=6)
header.pack(fill=tk.X)
tk.Label(header, text="🔍 重複ファイル検出",
font=("Noto Sans JP", 12, "bold"),
bg="#252526", fg="#4fc3f7").pack(side=tk.LEFT, padx=12)
# フォルダ選択
top = tk.Frame(self.root, bg="#1e1e1e", pady=4)
top.pack(fill=tk.X, padx=8)
tk.Label(top, text="スキャン対象:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT)
self.folder_var = tk.StringVar()
ttk.Entry(top, textvariable=self.folder_var,
width=50).pack(side=tk.LEFT, padx=4)
ttk.Button(top, text="参照",
command=self._pick_folder).pack(side=tk.LEFT)
# オプション
opt = tk.Frame(self.root, bg="#1e1e1e", pady=2)
opt.pack(fill=tk.X, padx=8)
self.recurse_var = tk.BooleanVar(value=True)
tk.Checkbutton(opt, text="サブフォルダも含める",
variable=self.recurse_var,
bg="#1e1e1e", fg="#ccc", selectcolor="#3c3c3c",
activebackground="#1e1e1e").pack(side=tk.LEFT)
tk.Label(opt, text="比較方法:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT, padx=(12, 4))
self.method_var = tk.StringVar(value="md5")
ttk.Combobox(opt, textvariable=self.method_var,
values=["md5", "sha256", "サイズ+名前"],
state="readonly", width=12).pack(side=tk.LEFT)
ttk.Button(opt, text="▶ スキャン開始",
command=self._start_scan).pack(side=tk.LEFT, padx=12)
ttk.Button(opt, text="🗑 選択削除",
command=self._delete_selected).pack(side=tk.LEFT)
# 結果ツリー
result_f = tk.Frame(self.root, bg="#1e1e1e")
result_f.pack(fill=tk.BOTH, expand=True, padx=8, pady=4)
self.tree = ttk.Treeview(result_f, columns=("path", "size", "hash"),
show="tree headings", selectmode="extended")
self.tree.heading("#0", text="グループ / ファイル")
self.tree.heading("path", text="パス")
self.tree.heading("size", text="サイズ")
self.tree.heading("hash", text="ハッシュ/識別子")
self.tree.column("#0", width=220, anchor="w")
self.tree.column("path", width=340, anchor="w")
self.tree.column("size", width=80, anchor="e")
self.tree.column("hash", width=120, anchor="w")
sb = ttk.Scrollbar(result_f, command=self.tree.yview)
self.tree.configure(yscrollcommand=sb.set)
sb.pack(side=tk.RIGHT, fill=tk.Y)
self.tree.pack(fill=tk.BOTH, expand=True)
self.tree.tag_configure("group", foreground="#ffd700", font=("Arial", 9, "bold"))
self.tree.tag_configure("dup", foreground="#f48771")
# 進捗
self.progress = ttk.Progressbar(self.root, mode="indeterminate")
self.progress.pack(fill=tk.X, padx=8)
self.status_var = tk.StringVar(value="フォルダを選択してスキャンしてください")
tk.Label(self.root, textvariable=self.status_var,
bg="#252526", fg="#858585", font=("Arial", 9),
anchor="w", padx=8).pack(fill=tk.X, side=tk.BOTTOM)
def _pick_folder(self):
folder = filedialog.askdirectory()
if folder:
self.folder_var.set(folder)
def _start_scan(self):
folder = self.folder_var.get().strip()
if not folder or not os.path.isdir(folder):
messagebox.showerror("エラー", "有効なフォルダを指定してください")
return
self.progress.start()
self.status_var.set("スキャン中...")
threading.Thread(target=self._do_scan, args=(folder,),
daemon=True).start()
def _do_scan(self, folder):
try:
files = []
if self.recurse_var.get():
for dirpath, _, filenames in os.walk(folder):
for fn in filenames:
files.append(os.path.join(dirpath, fn))
else:
files = [os.path.join(folder, f)
for f in os.listdir(folder)
if os.path.isfile(os.path.join(folder, f))]
method = self.method_var.get()
groups = defaultdict(list)
for path in files:
try:
key = self._file_key(path, method)
groups[key].append(path)
except Exception:
pass
duplicates = {k: v for k, v in groups.items() if len(v) > 1}
self.root.after(0, self._show_results, duplicates, len(files))
except Exception as e:
self.root.after(0, self._on_error, str(e))
def _file_key(self, path, method):
size = os.path.getsize(path)
if method == "サイズ+名前":
return f"{size}_{os.path.basename(path)}"
algo = hashlib.md5() if method == "md5" else hashlib.sha256()
with open(path, "rb") as f:
for chunk in iter(lambda: f.read(65536), b""):
algo.update(chunk)
return algo.hexdigest()
def _show_results(self, duplicates, total):
self.progress.stop()
self.tree.delete(*self.tree.get_children())
total_dup = sum(len(v) for v in duplicates.values())
total_groups = len(duplicates)
for i, (key, paths) in enumerate(duplicates.items(), 1):
size = os.path.getsize(paths[0])
size_str = self._fmt_size(size)
wasted = self._fmt_size(size * (len(paths) - 1))
group_node = self.tree.insert(
"", tk.END,
text=f"グループ {i} ({len(paths)} 件, 無駄: {wasted})",
values=("", "", key[:16]),
tags=("group",), open=True)
for path in paths:
self.tree.insert(group_node, tk.END,
text=os.path.basename(path),
values=(path, size_str, ""),
tags=("dup",))
self.status_var.set(
f"スキャン完了: {total} 件中 {total_dup} 件の重複を検出 "
f"({total_groups} グループ)")
def _on_error(self, msg):
self.progress.stop()
messagebox.showerror("エラー", msg)
self.status_var.set("エラーが発生しました")
def _delete_selected(self):
sel = self.tree.selection()
if not sel:
return
to_delete = []
for iid in sel:
path = self.tree.set(iid, "path")
if path and os.path.isfile(path):
to_delete.append(path)
if not to_delete:
messagebox.showinfo("情報", "削除対象のファイルが選択されていません")
return
if not messagebox.askyesno(
"削除確認",
f"{len(to_delete)} 件のファイルを削除します。\n"
"この操作は元に戻せません。よろしいですか?"):
return
ok = err = 0
for path in to_delete:
try:
os.remove(path)
ok += 1
except Exception:
err += 1
self.status_var.set(f"削除完了: {ok} 件成功 / {err} 件失敗")
self._start_scan()
@staticmethod
def _fmt_size(size):
for unit in ("B", "KB", "MB", "GB"):
if size < 1024:
return f"{size:.1f} {unit}"
size /= 1024
return f"{size:.1f} TB"
if __name__ == "__main__":
root = tk.Tk()
app = App053(root)
root.mainloop()
イベント処理
ボタンのcommand引数でクリックイベントを、bind('
import tkinter as tk
from tkinter import ttk, messagebox, filedialog
import os
import hashlib
import threading
from collections import defaultdict
class App053:
"""重複ファイル検出"""
def __init__(self, root):
self.root = root
self.root.title("重複ファイル検出")
self.root.geometry("860x580")
self.root.configure(bg="#1e1e1e")
self._scanning = False
self._build_ui()
def _build_ui(self):
header = tk.Frame(self.root, bg="#252526", pady=6)
header.pack(fill=tk.X)
tk.Label(header, text="🔍 重複ファイル検出",
font=("Noto Sans JP", 12, "bold"),
bg="#252526", fg="#4fc3f7").pack(side=tk.LEFT, padx=12)
# フォルダ選択
top = tk.Frame(self.root, bg="#1e1e1e", pady=4)
top.pack(fill=tk.X, padx=8)
tk.Label(top, text="スキャン対象:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT)
self.folder_var = tk.StringVar()
ttk.Entry(top, textvariable=self.folder_var,
width=50).pack(side=tk.LEFT, padx=4)
ttk.Button(top, text="参照",
command=self._pick_folder).pack(side=tk.LEFT)
# オプション
opt = tk.Frame(self.root, bg="#1e1e1e", pady=2)
opt.pack(fill=tk.X, padx=8)
self.recurse_var = tk.BooleanVar(value=True)
tk.Checkbutton(opt, text="サブフォルダも含める",
variable=self.recurse_var,
bg="#1e1e1e", fg="#ccc", selectcolor="#3c3c3c",
activebackground="#1e1e1e").pack(side=tk.LEFT)
tk.Label(opt, text="比較方法:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT, padx=(12, 4))
self.method_var = tk.StringVar(value="md5")
ttk.Combobox(opt, textvariable=self.method_var,
values=["md5", "sha256", "サイズ+名前"],
state="readonly", width=12).pack(side=tk.LEFT)
ttk.Button(opt, text="▶ スキャン開始",
command=self._start_scan).pack(side=tk.LEFT, padx=12)
ttk.Button(opt, text="🗑 選択削除",
command=self._delete_selected).pack(side=tk.LEFT)
# 結果ツリー
result_f = tk.Frame(self.root, bg="#1e1e1e")
result_f.pack(fill=tk.BOTH, expand=True, padx=8, pady=4)
self.tree = ttk.Treeview(result_f, columns=("path", "size", "hash"),
show="tree headings", selectmode="extended")
self.tree.heading("#0", text="グループ / ファイル")
self.tree.heading("path", text="パス")
self.tree.heading("size", text="サイズ")
self.tree.heading("hash", text="ハッシュ/識別子")
self.tree.column("#0", width=220, anchor="w")
self.tree.column("path", width=340, anchor="w")
self.tree.column("size", width=80, anchor="e")
self.tree.column("hash", width=120, anchor="w")
sb = ttk.Scrollbar(result_f, command=self.tree.yview)
self.tree.configure(yscrollcommand=sb.set)
sb.pack(side=tk.RIGHT, fill=tk.Y)
self.tree.pack(fill=tk.BOTH, expand=True)
self.tree.tag_configure("group", foreground="#ffd700", font=("Arial", 9, "bold"))
self.tree.tag_configure("dup", foreground="#f48771")
# 進捗
self.progress = ttk.Progressbar(self.root, mode="indeterminate")
self.progress.pack(fill=tk.X, padx=8)
self.status_var = tk.StringVar(value="フォルダを選択してスキャンしてください")
tk.Label(self.root, textvariable=self.status_var,
bg="#252526", fg="#858585", font=("Arial", 9),
anchor="w", padx=8).pack(fill=tk.X, side=tk.BOTTOM)
def _pick_folder(self):
folder = filedialog.askdirectory()
if folder:
self.folder_var.set(folder)
def _start_scan(self):
folder = self.folder_var.get().strip()
if not folder or not os.path.isdir(folder):
messagebox.showerror("エラー", "有効なフォルダを指定してください")
return
self.progress.start()
self.status_var.set("スキャン中...")
threading.Thread(target=self._do_scan, args=(folder,),
daemon=True).start()
def _do_scan(self, folder):
try:
files = []
if self.recurse_var.get():
for dirpath, _, filenames in os.walk(folder):
for fn in filenames:
files.append(os.path.join(dirpath, fn))
else:
files = [os.path.join(folder, f)
for f in os.listdir(folder)
if os.path.isfile(os.path.join(folder, f))]
method = self.method_var.get()
groups = defaultdict(list)
for path in files:
try:
key = self._file_key(path, method)
groups[key].append(path)
except Exception:
pass
duplicates = {k: v for k, v in groups.items() if len(v) > 1}
self.root.after(0, self._show_results, duplicates, len(files))
except Exception as e:
self.root.after(0, self._on_error, str(e))
def _file_key(self, path, method):
size = os.path.getsize(path)
if method == "サイズ+名前":
return f"{size}_{os.path.basename(path)}"
algo = hashlib.md5() if method == "md5" else hashlib.sha256()
with open(path, "rb") as f:
for chunk in iter(lambda: f.read(65536), b""):
algo.update(chunk)
return algo.hexdigest()
def _show_results(self, duplicates, total):
self.progress.stop()
self.tree.delete(*self.tree.get_children())
total_dup = sum(len(v) for v in duplicates.values())
total_groups = len(duplicates)
for i, (key, paths) in enumerate(duplicates.items(), 1):
size = os.path.getsize(paths[0])
size_str = self._fmt_size(size)
wasted = self._fmt_size(size * (len(paths) - 1))
group_node = self.tree.insert(
"", tk.END,
text=f"グループ {i} ({len(paths)} 件, 無駄: {wasted})",
values=("", "", key[:16]),
tags=("group",), open=True)
for path in paths:
self.tree.insert(group_node, tk.END,
text=os.path.basename(path),
values=(path, size_str, ""),
tags=("dup",))
self.status_var.set(
f"スキャン完了: {total} 件中 {total_dup} 件の重複を検出 "
f"({total_groups} グループ)")
def _on_error(self, msg):
self.progress.stop()
messagebox.showerror("エラー", msg)
self.status_var.set("エラーが発生しました")
def _delete_selected(self):
sel = self.tree.selection()
if not sel:
return
to_delete = []
for iid in sel:
path = self.tree.set(iid, "path")
if path and os.path.isfile(path):
to_delete.append(path)
if not to_delete:
messagebox.showinfo("情報", "削除対象のファイルが選択されていません")
return
if not messagebox.askyesno(
"削除確認",
f"{len(to_delete)} 件のファイルを削除します。\n"
"この操作は元に戻せません。よろしいですか?"):
return
ok = err = 0
for path in to_delete:
try:
os.remove(path)
ok += 1
except Exception:
err += 1
self.status_var.set(f"削除完了: {ok} 件成功 / {err} 件失敗")
self._start_scan()
@staticmethod
def _fmt_size(size):
for unit in ("B", "KB", "MB", "GB"):
if size < 1024:
return f"{size:.1f} {unit}"
size /= 1024
return f"{size:.1f} TB"
if __name__ == "__main__":
root = tk.Tk()
app = App053(root)
root.mainloop()
Textウィジェットでの結果表示
tk.Textウィジェットをstate=DISABLED(読み取り専用)で作成し、更新時はNORMALに変更してinsert()で内容を書き込み、再びDISABLEDに戻します。
import tkinter as tk
from tkinter import ttk, messagebox, filedialog
import os
import hashlib
import threading
from collections import defaultdict
class App053:
"""重複ファイル検出"""
def __init__(self, root):
self.root = root
self.root.title("重複ファイル検出")
self.root.geometry("860x580")
self.root.configure(bg="#1e1e1e")
self._scanning = False
self._build_ui()
def _build_ui(self):
header = tk.Frame(self.root, bg="#252526", pady=6)
header.pack(fill=tk.X)
tk.Label(header, text="🔍 重複ファイル検出",
font=("Noto Sans JP", 12, "bold"),
bg="#252526", fg="#4fc3f7").pack(side=tk.LEFT, padx=12)
# フォルダ選択
top = tk.Frame(self.root, bg="#1e1e1e", pady=4)
top.pack(fill=tk.X, padx=8)
tk.Label(top, text="スキャン対象:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT)
self.folder_var = tk.StringVar()
ttk.Entry(top, textvariable=self.folder_var,
width=50).pack(side=tk.LEFT, padx=4)
ttk.Button(top, text="参照",
command=self._pick_folder).pack(side=tk.LEFT)
# オプション
opt = tk.Frame(self.root, bg="#1e1e1e", pady=2)
opt.pack(fill=tk.X, padx=8)
self.recurse_var = tk.BooleanVar(value=True)
tk.Checkbutton(opt, text="サブフォルダも含める",
variable=self.recurse_var,
bg="#1e1e1e", fg="#ccc", selectcolor="#3c3c3c",
activebackground="#1e1e1e").pack(side=tk.LEFT)
tk.Label(opt, text="比較方法:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT, padx=(12, 4))
self.method_var = tk.StringVar(value="md5")
ttk.Combobox(opt, textvariable=self.method_var,
values=["md5", "sha256", "サイズ+名前"],
state="readonly", width=12).pack(side=tk.LEFT)
ttk.Button(opt, text="▶ スキャン開始",
command=self._start_scan).pack(side=tk.LEFT, padx=12)
ttk.Button(opt, text="🗑 選択削除",
command=self._delete_selected).pack(side=tk.LEFT)
# 結果ツリー
result_f = tk.Frame(self.root, bg="#1e1e1e")
result_f.pack(fill=tk.BOTH, expand=True, padx=8, pady=4)
self.tree = ttk.Treeview(result_f, columns=("path", "size", "hash"),
show="tree headings", selectmode="extended")
self.tree.heading("#0", text="グループ / ファイル")
self.tree.heading("path", text="パス")
self.tree.heading("size", text="サイズ")
self.tree.heading("hash", text="ハッシュ/識別子")
self.tree.column("#0", width=220, anchor="w")
self.tree.column("path", width=340, anchor="w")
self.tree.column("size", width=80, anchor="e")
self.tree.column("hash", width=120, anchor="w")
sb = ttk.Scrollbar(result_f, command=self.tree.yview)
self.tree.configure(yscrollcommand=sb.set)
sb.pack(side=tk.RIGHT, fill=tk.Y)
self.tree.pack(fill=tk.BOTH, expand=True)
self.tree.tag_configure("group", foreground="#ffd700", font=("Arial", 9, "bold"))
self.tree.tag_configure("dup", foreground="#f48771")
# 進捗
self.progress = ttk.Progressbar(self.root, mode="indeterminate")
self.progress.pack(fill=tk.X, padx=8)
self.status_var = tk.StringVar(value="フォルダを選択してスキャンしてください")
tk.Label(self.root, textvariable=self.status_var,
bg="#252526", fg="#858585", font=("Arial", 9),
anchor="w", padx=8).pack(fill=tk.X, side=tk.BOTTOM)
def _pick_folder(self):
folder = filedialog.askdirectory()
if folder:
self.folder_var.set(folder)
def _start_scan(self):
folder = self.folder_var.get().strip()
if not folder or not os.path.isdir(folder):
messagebox.showerror("エラー", "有効なフォルダを指定してください")
return
self.progress.start()
self.status_var.set("スキャン中...")
threading.Thread(target=self._do_scan, args=(folder,),
daemon=True).start()
def _do_scan(self, folder):
try:
files = []
if self.recurse_var.get():
for dirpath, _, filenames in os.walk(folder):
for fn in filenames:
files.append(os.path.join(dirpath, fn))
else:
files = [os.path.join(folder, f)
for f in os.listdir(folder)
if os.path.isfile(os.path.join(folder, f))]
method = self.method_var.get()
groups = defaultdict(list)
for path in files:
try:
key = self._file_key(path, method)
groups[key].append(path)
except Exception:
pass
duplicates = {k: v for k, v in groups.items() if len(v) > 1}
self.root.after(0, self._show_results, duplicates, len(files))
except Exception as e:
self.root.after(0, self._on_error, str(e))
def _file_key(self, path, method):
size = os.path.getsize(path)
if method == "サイズ+名前":
return f"{size}_{os.path.basename(path)}"
algo = hashlib.md5() if method == "md5" else hashlib.sha256()
with open(path, "rb") as f:
for chunk in iter(lambda: f.read(65536), b""):
algo.update(chunk)
return algo.hexdigest()
def _show_results(self, duplicates, total):
self.progress.stop()
self.tree.delete(*self.tree.get_children())
total_dup = sum(len(v) for v in duplicates.values())
total_groups = len(duplicates)
for i, (key, paths) in enumerate(duplicates.items(), 1):
size = os.path.getsize(paths[0])
size_str = self._fmt_size(size)
wasted = self._fmt_size(size * (len(paths) - 1))
group_node = self.tree.insert(
"", tk.END,
text=f"グループ {i} ({len(paths)} 件, 無駄: {wasted})",
values=("", "", key[:16]),
tags=("group",), open=True)
for path in paths:
self.tree.insert(group_node, tk.END,
text=os.path.basename(path),
values=(path, size_str, ""),
tags=("dup",))
self.status_var.set(
f"スキャン完了: {total} 件中 {total_dup} 件の重複を検出 "
f"({total_groups} グループ)")
def _on_error(self, msg):
self.progress.stop()
messagebox.showerror("エラー", msg)
self.status_var.set("エラーが発生しました")
def _delete_selected(self):
sel = self.tree.selection()
if not sel:
return
to_delete = []
for iid in sel:
path = self.tree.set(iid, "path")
if path and os.path.isfile(path):
to_delete.append(path)
if not to_delete:
messagebox.showinfo("情報", "削除対象のファイルが選択されていません")
return
if not messagebox.askyesno(
"削除確認",
f"{len(to_delete)} 件のファイルを削除します。\n"
"この操作は元に戻せません。よろしいですか?"):
return
ok = err = 0
for path in to_delete:
try:
os.remove(path)
ok += 1
except Exception:
err += 1
self.status_var.set(f"削除完了: {ok} 件成功 / {err} 件失敗")
self._start_scan()
@staticmethod
def _fmt_size(size):
for unit in ("B", "KB", "MB", "GB"):
if size < 1024:
return f"{size:.1f} {unit}"
size /= 1024
return f"{size:.1f} TB"
if __name__ == "__main__":
root = tk.Tk()
app = App053(root)
root.mainloop()
例外処理とエラーハンドリング
try-exceptでValueErrorとExceptionを捕捉し、messagebox.showerror()でエラーメッセージを表示します。予期しないエラーも処理することで、アプリの堅牢性が向上します。
import tkinter as tk
from tkinter import ttk, messagebox, filedialog
import os
import hashlib
import threading
from collections import defaultdict
class App053:
"""重複ファイル検出"""
def __init__(self, root):
self.root = root
self.root.title("重複ファイル検出")
self.root.geometry("860x580")
self.root.configure(bg="#1e1e1e")
self._scanning = False
self._build_ui()
def _build_ui(self):
header = tk.Frame(self.root, bg="#252526", pady=6)
header.pack(fill=tk.X)
tk.Label(header, text="🔍 重複ファイル検出",
font=("Noto Sans JP", 12, "bold"),
bg="#252526", fg="#4fc3f7").pack(side=tk.LEFT, padx=12)
# フォルダ選択
top = tk.Frame(self.root, bg="#1e1e1e", pady=4)
top.pack(fill=tk.X, padx=8)
tk.Label(top, text="スキャン対象:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT)
self.folder_var = tk.StringVar()
ttk.Entry(top, textvariable=self.folder_var,
width=50).pack(side=tk.LEFT, padx=4)
ttk.Button(top, text="参照",
command=self._pick_folder).pack(side=tk.LEFT)
# オプション
opt = tk.Frame(self.root, bg="#1e1e1e", pady=2)
opt.pack(fill=tk.X, padx=8)
self.recurse_var = tk.BooleanVar(value=True)
tk.Checkbutton(opt, text="サブフォルダも含める",
variable=self.recurse_var,
bg="#1e1e1e", fg="#ccc", selectcolor="#3c3c3c",
activebackground="#1e1e1e").pack(side=tk.LEFT)
tk.Label(opt, text="比較方法:", bg="#1e1e1e", fg="#ccc",
font=("Arial", 9)).pack(side=tk.LEFT, padx=(12, 4))
self.method_var = tk.StringVar(value="md5")
ttk.Combobox(opt, textvariable=self.method_var,
values=["md5", "sha256", "サイズ+名前"],
state="readonly", width=12).pack(side=tk.LEFT)
ttk.Button(opt, text="▶ スキャン開始",
command=self._start_scan).pack(side=tk.LEFT, padx=12)
ttk.Button(opt, text="🗑 選択削除",
command=self._delete_selected).pack(side=tk.LEFT)
# 結果ツリー
result_f = tk.Frame(self.root, bg="#1e1e1e")
result_f.pack(fill=tk.BOTH, expand=True, padx=8, pady=4)
self.tree = ttk.Treeview(result_f, columns=("path", "size", "hash"),
show="tree headings", selectmode="extended")
self.tree.heading("#0", text="グループ / ファイル")
self.tree.heading("path", text="パス")
self.tree.heading("size", text="サイズ")
self.tree.heading("hash", text="ハッシュ/識別子")
self.tree.column("#0", width=220, anchor="w")
self.tree.column("path", width=340, anchor="w")
self.tree.column("size", width=80, anchor="e")
self.tree.column("hash", width=120, anchor="w")
sb = ttk.Scrollbar(result_f, command=self.tree.yview)
self.tree.configure(yscrollcommand=sb.set)
sb.pack(side=tk.RIGHT, fill=tk.Y)
self.tree.pack(fill=tk.BOTH, expand=True)
self.tree.tag_configure("group", foreground="#ffd700", font=("Arial", 9, "bold"))
self.tree.tag_configure("dup", foreground="#f48771")
# 進捗
self.progress = ttk.Progressbar(self.root, mode="indeterminate")
self.progress.pack(fill=tk.X, padx=8)
self.status_var = tk.StringVar(value="フォルダを選択してスキャンしてください")
tk.Label(self.root, textvariable=self.status_var,
bg="#252526", fg="#858585", font=("Arial", 9),
anchor="w", padx=8).pack(fill=tk.X, side=tk.BOTTOM)
def _pick_folder(self):
folder = filedialog.askdirectory()
if folder:
self.folder_var.set(folder)
def _start_scan(self):
folder = self.folder_var.get().strip()
if not folder or not os.path.isdir(folder):
messagebox.showerror("エラー", "有効なフォルダを指定してください")
return
self.progress.start()
self.status_var.set("スキャン中...")
threading.Thread(target=self._do_scan, args=(folder,),
daemon=True).start()
def _do_scan(self, folder):
try:
files = []
if self.recurse_var.get():
for dirpath, _, filenames in os.walk(folder):
for fn in filenames:
files.append(os.path.join(dirpath, fn))
else:
files = [os.path.join(folder, f)
for f in os.listdir(folder)
if os.path.isfile(os.path.join(folder, f))]
method = self.method_var.get()
groups = defaultdict(list)
for path in files:
try:
key = self._file_key(path, method)
groups[key].append(path)
except Exception:
pass
duplicates = {k: v for k, v in groups.items() if len(v) > 1}
self.root.after(0, self._show_results, duplicates, len(files))
except Exception as e:
self.root.after(0, self._on_error, str(e))
def _file_key(self, path, method):
size = os.path.getsize(path)
if method == "サイズ+名前":
return f"{size}_{os.path.basename(path)}"
algo = hashlib.md5() if method == "md5" else hashlib.sha256()
with open(path, "rb") as f:
for chunk in iter(lambda: f.read(65536), b""):
algo.update(chunk)
return algo.hexdigest()
def _show_results(self, duplicates, total):
self.progress.stop()
self.tree.delete(*self.tree.get_children())
total_dup = sum(len(v) for v in duplicates.values())
total_groups = len(duplicates)
for i, (key, paths) in enumerate(duplicates.items(), 1):
size = os.path.getsize(paths[0])
size_str = self._fmt_size(size)
wasted = self._fmt_size(size * (len(paths) - 1))
group_node = self.tree.insert(
"", tk.END,
text=f"グループ {i} ({len(paths)} 件, 無駄: {wasted})",
values=("", "", key[:16]),
tags=("group",), open=True)
for path in paths:
self.tree.insert(group_node, tk.END,
text=os.path.basename(path),
values=(path, size_str, ""),
tags=("dup",))
self.status_var.set(
f"スキャン完了: {total} 件中 {total_dup} 件の重複を検出 "
f"({total_groups} グループ)")
def _on_error(self, msg):
self.progress.stop()
messagebox.showerror("エラー", msg)
self.status_var.set("エラーが発生しました")
def _delete_selected(self):
sel = self.tree.selection()
if not sel:
return
to_delete = []
for iid in sel:
path = self.tree.set(iid, "path")
if path and os.path.isfile(path):
to_delete.append(path)
if not to_delete:
messagebox.showinfo("情報", "削除対象のファイルが選択されていません")
return
if not messagebox.askyesno(
"削除確認",
f"{len(to_delete)} 件のファイルを削除します。\n"
"この操作は元に戻せません。よろしいですか?"):
return
ok = err = 0
for path in to_delete:
try:
os.remove(path)
ok += 1
except Exception:
err += 1
self.status_var.set(f"削除完了: {ok} 件成功 / {err} 件失敗")
self._start_scan()
@staticmethod
def _fmt_size(size):
for unit in ("B", "KB", "MB", "GB"):
if size < 1024:
return f"{size:.1f} {unit}"
size /= 1024
return f"{size:.1f} TB"
if __name__ == "__main__":
root = tk.Tk()
app = App053(root)
root.mainloop()
6. ステップバイステップガイド
このアプリをゼロから自分で作る手順を解説します。コードをコピーするだけでなく、実際に手順を追って自分で書いてみましょう。
-
1ファイルを作成する
新しいファイルを作成して app053.py と保存します。
-
2クラスの骨格を作る
App053クラスを定義し、__init__とmainloop()の最小構成を作ります。
-
3タイトルバーを作る
Frameを使ってカラーバー付きのタイトルエリアを作ります。
-
4入力フォームを実装する
LabelFrameとEntryウィジェットで入力エリアを作ります。
-
5処理ロジックを実装する
_execute()メソッドにメインロジックを実装します。
-
6結果表示を実装する
TextウィジェットかLabelに結果を表示する_show_result()を実装します。
-
7エラー処理を追加する
try-exceptとmessageboxでエラーハンドリングを追加します。
7. カスタマイズアイデア
基本機能を習得したら、以下のカスタマイズに挑戦してみましょう。
💡 ダークモードを追加する
bg色・fg色を辞書で管理し、ボタン1つでダークモード・ライトモードを切り替えられるようにしましょう。
💡 データの保存機能
処理結果をCSV・TXTファイルに保存する機能を追加しましょう。filedialog.asksaveasfilename()でファイル保存ダイアログが使えます。
💡 設定ダイアログ
フォントサイズや色などの設定をユーザーが変更できるオプションダイアログを追加しましょう。
8. よくある問題と解決法
❌ 日本語フォントが表示されない
原因:システムに日本語フォントが見つからない場合があります。
解決法:font引数を省略するかシステムに合ったフォントを指定してください。
❌ ライブラリのインポートエラー
原因:必要なライブラリがインストールされていません。
解決法:pip install コマンドで必要なライブラリをインストールしてください。
❌ ウィンドウサイズが合わない
原因:画面解像度や表示スケールによって異なる場合があります。
解決法:root.geometry()で適切なサイズに調整してください。
9. 練習問題
アプリの理解を深めるための練習問題です。
-
課題1:機能拡張
重複ファイル検出に新しい機能を1つ追加してみましょう。
-
課題2:UIの改善
色・フォント・レイアウトを変更して、より使いやすいUIにカスタマイズしましょう。
-
課題3:保存機能の追加
処理結果をファイルに保存する機能を追加しましょう。