星期日, 11月 16, 2025

EPUB 批次簡體中文轉繁體中文 + 結構及封面修復工具

https://drive.google.com/file/d/1wCpXbbwenkdc6Mq7miO51eW7jnU3xtHb/

最近叫AI寫的  基本上就是AI的本事

功能:

1.修復大部分常見,而且適合用腳本自動修復的EPUB 錯誤。

2.修復封面 - 處理如果原始檔案的封面頁寫得很雜,結果電子書閱讀器的書架沒辦法抓到封面,明明檔案裡有封面但書架就是空白的情況。

3.簡體轉繁體,使用OPENCC套件,預設是S2TWP (轉換台灣用語)模式 可以自己去改


以下使用說明


epub_convfix.py 是一個用來批次修復 EPUB 結構、路徑、封面、語法、錯誤引用,並可選擇執行簡繁轉換的工具。
把 EPUB 丟進輸入資料夾後,腳本會自動處理並輸出修正版。


1. 系統需求

你需要安裝下列 Python 套件:

lxml opencc-python-reimplemented

快速安裝方式:

pip install lxml opencc-python-reimplemented

腳本本身不需要 chardet。


2. 檔案放置結構

腳本執行前,必須確認下列路徑設定:

INPUT_FOLDER = r"G:\WORK\EPUBWAIT" OUTPUT_FOLDER = r"G:\WORK\EPUB"

請將所有要修復的 EPUB 放到 INPUT_FOLDER
修復後的 EPUB 會輸出到 OUTPUT_FOLDER


3. 三大功能開關(最重要)

腳本最主要的三個設定是:

ENABLE_CONVERSION = True # 簡繁轉換 AUTO_FIX_COVER = True # 自動修復封面 metadata REPAIR_MODE = 'standard' # 修復模式

你通常只需要調整這三項。

ENABLE_CONVERSION

是否將內容簡繁互轉。
True 表示啟用,False 不轉換。

AUTO_FIX_COVER

是否自動找出封面圖片並建立 metadata。

REPAIR_MODE(主要修復強度)

可用模式:

模式說明
minimal只修致命錯誤,不動內容
safe修路徑和連結,不改 HTML
standard(預設)綜合模式,修語法但不破版
strict為通過檢查而強制改 HTML(可能破版)
custom完全依照你底下的細部設定

一般建議用 standard


4. 執行步驟

Step 1

將要處理的 EPUB 放入 INPUT_FOLDER

Step 2

依需求調整腳本「最上方的 USER CONFIG」。

Step 3

執行:

python epub_convfix.py

Step 4

處理完成後,你會在 OUTPUT_FOLDER 找到修復後的檔案。

輸出的檔名會加上後綴:

OUTPUT_SUFFIX = "_tw_fixed"

例如:

MyBook.epub → MyBook_tw_fixed.epub

5. 常見情境建議設定

若你只想修結構、路徑、封面,不碰內容:

ENABLE_CONVERSION = False REPAIR_MODE = 'safe'

若你要大量 EPUB 清理與修正(推薦):

ENABLE_CONVERSION = True REPAIR_MODE = 'standard'

若你一定要讓 EPUBCHECK 過關:

REPAIR_MODE = 'strict'

6. 執行結果檢視

腳本最後會顯示一份摘要,包括:

  • 修復了哪些項目

  • 哪些文件跳過(如 DRM)

  • 有無轉換錯誤

  • resource mapping、死連結、invalid id、缺失圖片等修復的次數

你不需要解讀技術細節,只要看最後顯示是否發生嚴重錯誤。


沒有留言: