BabelDOC 是一款开源的智能 PDF 翻译工具,专为科学论文和复杂文档翻译设计。它用先进的排版保持技术,能提供专业的双语对照翻译。不管是前沿学术论文,还是商业分析报告,都能帮你轻松跨越语言障碍,还能完美呈现原文档的排版。
功能特点
精准双语对照:通过智能布局分析,准确识别文档结构和段落布局,翻译和原文对齐,方便阅读理解。
智能公式和文本排版:支持数学公式和文本的复杂排版,公式内容不变,文本部分智能翻译。
原生风格呈现:保留原文的字体、颜色、间距等设计元素,支持悬挂标点、自适应缩放等专业排版功能。
智能处理复杂排版:借助深度学习布局分析,轻松处理多栏布局、表格和列表等复杂排版。
支持多种翻译引擎:兼容 Bing 翻译、OpenAI 系列模型(如 GPT-4、GPT-3.5 等),用户也能自定义翻译模型。
批量处理:可以同时翻译多个 PDF 文件,还能指定翻译特定页面。
灵活部署:支持本地部署,也提供在线服务。
BabelDOC 的使用方法:
在线服务使用
访问网站:打开BabelDOC 网站(https://app.immersivetranslate.com/babel-doc/)。
上传文件:点击上传按钮,选需要翻译的 PDF 文件,文件大小和页数要在免费额度(1000 页 / 月)内。
选择语言:默认支持英文到中文翻译,上传后系统自动处理。
开始翻译:点击 “立即翻译”,等翻译完成。
下载结果:翻译完成后,点击下载按钮获取文件,结果会原文和译文并排显示。
安装 Zotero 插件
安装 BabelDOC 插件到 Zotero 的步骤:
准备工作
确保安装了 Zotero 7 或更高版本,因为插件只支持 Zotero 7。
确保有沉浸式翻译(Immersive Translate)的 Pro 会员资格,目前插件只对 Pro 会员开放。
下载插件
访问 沉浸式翻译 Zotero 插件的 GitHub 页面。
在 Releases 页面下载最新的 .xpi 文件。
安装插件
打开 Zotero,点击菜单栏的 工具 -> 插件。
在插件管理页面,点击右上角的齿轮图标,选 从本地文件安装插件。
选择下载好的 .xpi 文件,安装并启用。
获取授权码
登录 沉浸式翻译官网,进入个人主页获取 Zotero 授权码。
配置插件
在 Zotero 的插件设置页面,找到沉浸式翻译插件的设置项。
把获取到的 Zotero 授权码粘贴到对应位置,点击 测试 按钮。显示 测试成功,就说明配置好了。
在设置页面配置目标语言、翻译模型、翻译模式等参数。
使用插件
在 Zotero 的文献管理页面,选中要翻译的 PDF 文档(必须是 PDF 格式)。
右键点击文件,选 使用沉浸式翻译。
在弹出的窗口确认翻译任务,之后会出现任务管理窗口,显示翻译进度。
适用场景
学术论文翻译:期刊论文、会议论文、研究报告等。
电子书:书籍、技术手册等(表格比例较低)。
不适用场景
扫描PDF:包括经过 OCR 处理的文档。
学术投稿:不建议直接用于论文投稿。
优势
精准排版还原:独特的版面分析技术,完整保留原文档的排版细节,包括字体、颜色、间距等。
智能公式处理:先进公式识别技术,确保数学公式与文本完美混排。
专业领域优化:针对学术论文等专业文献特殊优化,翻译效果更准确。
常见问题
BabelDOC 与 沉浸式翻译现有 PDF 翻译有什么区别?
主要区别在:
排版保留:BabelDOC 专注完整保留原文档排版,包括字体、颜色、间距等细节,不重排。
公式混排支持:能智能处理数学公式混排,确保公式与文本的混排效果。
专业领域支持:特别优化了学术论文等专业文献的翻译效果。
为什么导出 PDF 很慢
因为最后导出 PDF 时要执行绘制指令清理,这个操作耗时多,可能会卡顿,还请耐心等待。
注意:
单个文件不超过 500MB
单次 PDF 文件最多允许 500 页
不支持扫描文件(包括 OCR 版)
免费用户每月限量 1000 页,Pro 会员限量 10000 页。
BabelDOC 已正式开源,项目在 GitHub (https://github.com/funstory-ai/BabelDOC)上。欢迎访问项目仓库,给我们点个 Star,一起支持这个开源项目。