一、软件介绍

文末提供程序及源码下载

       开源(电子书,PDF 翻译)支持所有电子书格式的多语言电子书处理工具。具有在线和离线翻译功能,同时保留原始布局。与扫描的 PDF 和数字 PDF 兼容。优雅的用户界面。性能最高的开源布局保留电子书翻译器。llms 已被添加为首选的翻译 API,建议使用 Doubao 、 Qwen 、 deepseek v3 、 gpt4-o-mini。可以通过填充 PDF 文件中的白色区域来解决色彩空间错误。此外,考虑增加 arxiv 搜索功能,并在 latex 翻译后渲染 arxiv 论文。

二、中文 LLM API 应用

Doubao & Deepseek

通过 Volcengine 平台申请:

  • 应用网址:Volcengine-Doubao
  • 可用型号:Doubao、Deepseek 系列型号

 同义 Qwen

通过阿里云平台申请:

  • 应用网址:阿里云-统邑Qwen
  • 可用型号:Qwen-Max、Qwen-Plus 系列型号

 概述

PolyglotPDF 是一种高级 PDF 处理工具,它采用专门的技术在 PDF 文档中实现超快速的文本、表格和公式识别,通常在 1 秒内完成处理。它具有 OCR 功能和布局保留翻译功能,通常在 10 秒内完成完整的文档翻译(速度可能因翻译 API 提供商而异)。

三、软件特征

  • 超快速识别:在 ~1 秒内处理 PDF 中的文本、表格和公式
  • Layout-Preserving Translation:在翻译内容时保持原始文档格式
  • OCR 支持:高效处理扫描的文档
  • 基于文本的 PDF:无需 GPU
  • 快速翻译:在大约 10 秒内完成 PDF 翻译
  • 灵活的 API 集成:与各种翻译服务提供商兼容
  • 基于 Web 的比较界面:原始文档和翻译文档的并排比较
  • 增强的 OCR 功能:提高文本识别和处理的准确性
  • 支持离线翻译:使用较小的翻译模型

四、安装和设置

  1.  克隆存储库:
git clone https://github.com/CBIhalsen/PolyglotPDF.git
cd polyglotpdf
  1. 安装所需的软件包:
pip install -r requirements.txt
  1. 在 config.json 中配置 API 密钥。不建议使用阿里云翻译 API。

  2.  运行应用程序:

python app.py
  1. 访问 Web 界面:打开浏览器并导航到 http://127.0.0.1:8000

 要求

  •  Python 3.8+ 版
  •  深度 = 1.17.0
  • Flask==2.0.1
  • Flask-Cors==5.0.0
  • langdetect==1.0.9
  •  枕头==10.2.0
  • PyMuPDF==1.24.0
  • pytesseract==0.3.10
  •  请求 = =2.31.0
  •  抖音令牌==0.6.0
  •  工具 ==2.0.1

 确认

该项目利用 PyMuPDF 的功能进行高效的 PDF 处理和布局保留。

五、软件下载

夸克网盘分享

本文信息来源于GitHub作者地址:GitHub - CBIhalsen/PolyglotPDF: (eBook,PDFs Translation) A multilingual eBook processing tool supporting all eBook formats. Features online and offline translation while preserving original layouts. Compatible with both scanned and digital PDFs. Elegant user interface. The world's highest-performing open-source layout-preserving eBook translator.

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐