开源电子书，PDF 翻译支持所有电子书格式的多语言电子书处理工具。具有在线和离线翻译功能，同时保留原始布局。建议使用 Doubao 、 Qwen 、 deepseek v3 、 gpt4-o-mini

载开源（电子书，PDF 翻译）支持所有电子书格式的多语言电子书处理工具。具有在线和离线翻译功能，同时保留原始布局。与扫描的 PDF 和数字 PDF 兼容。优雅的用户界面。性能最高的开源布局保留电子书翻译器。llms 已被添加为首选的翻译 API，建议使用 Doubao 、 Qwen 、 deepseek v3 、 gpt4-o-mini。可以通过填充 PDF 文件中的白色区域来解决色彩空间错误。

struggle2025

2254人浏览 · 2025-03-09 10:13:44

struggle2025 · 2025-03-09 10:13:44 发布

一、软件介绍

文末提供程序及源码下载

开源（电子书，PDF 翻译）支持所有电子书格式的多语言电子书处理工具。具有在线和离线翻译功能，同时保留原始布局。与扫描的 PDF 和数字 PDF 兼容。优雅的用户界面。性能最高的开源布局保留电子书翻译器。llms 已被添加为首选的翻译 API，建议使用 Doubao 、 Qwen 、 deepseek v3 、 gpt4-o-mini。可以通过填充 PDF 文件中的白色区域来解决色彩空间错误。此外，考虑增加 arxiv 搜索功能，并在 latex 翻译后渲染 arxiv 论文。

二、中文 LLM API 应用

Doubao & Deepseek

通过 Volcengine 平台申请：

应用网址：Volcengine-Doubao
可用型号：Doubao、Deepseek 系列型号

同义 Qwen

通过阿里云平台申请：

应用网址：阿里云-统邑Qwen
可用型号：Qwen-Max、Qwen-Plus 系列型号

概述

PolyglotPDF 是一种高级 PDF 处理工具，它采用专门的技术在 PDF 文档中实现超快速的文本、表格和公式识别，通常在 1 秒内完成处理。它具有 OCR 功能和布局保留翻译功能，通常在 10 秒内完成完整的文档翻译（速度可能因翻译 API 提供商而异）。

三、软件特征

超快速识别：在 ~1 秒内处理 PDF 中的文本、表格和公式
Layout-Preserving Translation：在翻译内容时保持原始文档格式
OCR 支持：高效处理扫描的文档
基于文本的 PDF：无需 GPU
快速翻译：在大约 10 秒内完成 PDF 翻译
灵活的 API 集成：与各种翻译服务提供商兼容
基于 Web 的比较界面：原始文档和翻译文档的并排比较
增强的 OCR 功能：提高文本识别和处理的准确性
支持离线翻译：使用较小的翻译模型

四、安装和设置

克隆存储库：

git clone https://github.com/CBIhalsen/PolyglotPDF.git
cd polyglotpdf

安装所需的软件包：

pip install -r requirements.txt

在 config.json 中配置 API 密钥。不建议使用阿里云翻译 API。
运行应用程序：

python app.py

访问 Web 界面：打开浏览器并导航到 http://127.0.0.1:8000

要求

Python 3.8+ 版
深度 = 1.17.0
Flask==2.0.1
Flask-Cors==5.0.0
langdetect==1.0.9
枕头==10.2.0
PyMuPDF==1.24.0
pytesseract==0.3.10
请求 = =2.31.0
抖音令牌==0.6.0
工具 ==2.0.1

确认

该项目利用 PyMuPDF 的功能进行高效的 PDF 处理和布局保留。

五、软件下载

夸克网盘分享

本文信息来源于GitHub作者地址：GitHub - CBIhalsen/PolyglotPDF: (eBook，PDFs Translation) A multilingual eBook processing tool supporting all eBook formats. Features online and offline translation while preserving original layouts. Compatible with both scanned and digital PDFs. Elegant user interface. The world's highest-performing open-source layout-preserving eBook translator.

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

企业微信如何使用deepseek-最简单的方法

DeepSeek技术社区

deepseek 关闭思考，在ollama中，在代码中

DeepSeek技术社区

第38次CCF-CSP认证——月票发行（chatgpt5 vs deepseekv3.1）

DeepSeek技术社区

所有评论(0)

查看更多评论

struggle2025

@struggle2025

已为社区贡献27条内容

开源电子书，PDF 翻译支持所有电子书格式的多语言电子书处理工具。具有在线和离线翻译功能，同时保留原始布局。建议使用 Doubao 、 Qwen 、 deepseek v3 、 gpt4-o-mini

struggle2025

一、软件介绍

二、中文 LLM API 应用

Doubao & Deepseek

同义 Qwen

概述

三、软件特征

四、安装和设置

要求

确认

五、软件下载

所有评论(0)

温馨提示：您尚未绑定手机号

struggle2025