
开源电子书,PDF 翻译支持所有电子书格式的多语言电子书处理工具。具有在线和离线翻译功能,同时保留原始布局。建议使用 Doubao 、 Qwen 、 deepseek v3 、 gpt4-o-mini
载开源(电子书,PDF 翻译)支持所有电子书格式的多语言电子书处理工具。具有在线和离线翻译功能,同时保留原始布局。与扫描的 PDF 和数字 PDF 兼容。优雅的用户界面。性能最高的开源布局保留电子书翻译器。llms 已被添加为首选的翻译 API,建议使用 Doubao 、 Qwen 、 deepseek v3 、 gpt4-o-mini。可以通过填充 PDF 文件中的白色区域来解决色彩空间错误。
·
一、软件介绍
文末提供程序及源码下载
开源(电子书,PDF 翻译)支持所有电子书格式的多语言电子书处理工具。具有在线和离线翻译功能,同时保留原始布局。与扫描的 PDF 和数字 PDF 兼容。优雅的用户界面。性能最高的开源布局保留电子书翻译器。llms 已被添加为首选的翻译 API,建议使用 Doubao 、 Qwen 、 deepseek v3 、 gpt4-o-mini。可以通过填充 PDF 文件中的白色区域来解决色彩空间错误。此外,考虑增加 arxiv 搜索功能,并在 latex 翻译后渲染 arxiv 论文。
二、中文 LLM API 应用
Doubao & Deepseek
通过 Volcengine 平台申请:
- 应用网址:Volcengine-Doubao
- 可用型号:Doubao、Deepseek 系列型号
同义 Qwen
通过阿里云平台申请:
- 应用网址:阿里云-统邑Qwen
- 可用型号:Qwen-Max、Qwen-Plus 系列型号
概述
PolyglotPDF 是一种高级 PDF 处理工具,它采用专门的技术在 PDF 文档中实现超快速的文本、表格和公式识别,通常在 1 秒内完成处理。它具有 OCR 功能和布局保留翻译功能,通常在 10 秒内完成完整的文档翻译(速度可能因翻译 API 提供商而异)。
三、软件特征
- 超快速识别:在 ~1 秒内处理 PDF 中的文本、表格和公式
- Layout-Preserving Translation:在翻译内容时保持原始文档格式
- OCR 支持:高效处理扫描的文档
- 基于文本的 PDF:无需 GPU
- 快速翻译:在大约 10 秒内完成 PDF 翻译
- 灵活的 API 集成:与各种翻译服务提供商兼容
- 基于 Web 的比较界面:原始文档和翻译文档的并排比较
- 增强的 OCR 功能:提高文本识别和处理的准确性
- 支持离线翻译:使用较小的翻译模型
四、安装和设置
- 克隆存储库:
git clone https://github.com/CBIhalsen/PolyglotPDF.git
cd polyglotpdf
- 安装所需的软件包:
pip install -r requirements.txt
-
在 config.json 中配置 API 密钥。不建议使用阿里云翻译 API。
-
运行应用程序:
python app.py
- 访问 Web 界面:打开浏览器并导航到
http://127.0.0.1:8000
要求
- Python 3.8+ 版
- 深度 = 1.17.0
- Flask==2.0.1
- Flask-Cors==5.0.0
- langdetect==1.0.9
- 枕头==10.2.0
- PyMuPDF==1.24.0
- pytesseract==0.3.10
- 请求 = =2.31.0
- 抖音令牌==0.6.0
- 工具 ==2.0.1
确认
该项目利用 PyMuPDF 的功能进行高效的 PDF 处理和布局保留。
五、软件下载
更多推荐
所有评论(0)