Paper2Slides 是一款基于 RAG 技术和大型语言模型(LLM)的开源工具,可以一键把学术论文、研究报告和各类文档转成专业的演示文稿(PPT)或学术海报。它想解决的是从零开始做幻灯片的麻烦事,让用户把时间花在更重要的思考和创作上。

Paper2Slides(图1)

✨ Paper2Slides功能特征

📄 多格式文档支持:支持 PDF、Word (.docx)、Excel (.xlsx)、PowerPoint (.pptx)、Markdown (.md) 等格式,可以同时处理多个文件

🎯 精准内容提取:用 RAG 技术抓取关键论点、数据图表和核心发现,不会漏掉重要信息

🔗 源链接可追溯:生成的内容和原始文档直接关联,可以轻松回到原文段落,保证学术严谨性

🎨 自定义样式自由:内置多种专业主题,也可以用自然语言描述风格(比如"哆啦A梦风格"、"吉卜力动画风格"等)

⚡ 快速生成:即时预览,可以快速尝试和实时调整

💾 无缝会话管理:自动保存进度,支持断点续传、随时暂停/恢复/切换主题

🖼️ 专业视觉效果:生成符合出版标准的幻灯片和海报,支持幻灯片(Slides)和海报(Poster)两种形式

🔧 Paper2Slides技术原理

Paper2Slides 分四步处理:

  1. RAG 解析与索引 — 建立文档智能索引

  2. 结构抽取 — 识别章节、论点、图表

  3. 内容规划 — 制定内容组织和排版策略

  4. 视觉渲染 — 生成最终幻灯片/海报

  5. 每一步都自动保存检查点,支持断点续跑。

🎯 Paper2Slides应用场景

  • 学术报告与论文展示 — 快速做组会汇报、学术会议演讲材料

  • 科研成果汇报 — 把研究论文转成答辩 PPT 或项目评审材料

  • 教学课件制作 — 教师把教案、论文快速转成课堂演示文稿

  • 会议海报制作 — 自动生成学术会议墙报(Poster)

  • 企业内部分享 — 技术报告、产品文档快速可视化

  • 个人学习与总结 — 快速整理阅读笔记和文献综述

Paper2Slides(图2)

🚀Paper2Slides 使用方法

环境搭建

# 克隆仓库
git clone https://github.com/HKUDS/Paper2Slides.git
cd Paper2Slides
# 创建并激活 conda 环境
conda create -n paper2slides python=3.12 -y
conda activate paper2slides
# 安装依赖
pip install -r requirements.txt

在 paper2slides/ 目录下创建 .env 文件,配置大模型 API Key(支持 OpenAI、Google Gemini 等)

命令行使用

# 基础用法 - 生成幻灯片
python -m paper2slides --input paper.pdf --output slides --length medium
# 生成海报并自定义样式
python -m paper2slides --input paper.pdf --output poster --style "minimalist with blue theme" --density medium
# 快速模式(适合短文本)
python -m paper2slides --input paper.pdf --output slides --fast
# 并行生成(默认2个worker)
python -m paper2slides --input paper.pdf --output slides --parallel 2
# 查看所有处理过的输出
python -m paper2slides --list

自定义风格示例

# 哆啦A梦风格
python -m paper2slides --input paper.pdf --output slides --style doraemon --length medium
# 吉卜力动画风格(详细描述)
--style "Studio Ghibli anime style with warm whimsical aesthetic. Use soft watercolor Morandi tones with light cream background, muted sage green and dusty pink accents. Totoro character can appear as a friendly guide relating to the content, with nature elements like soft clouds or leaves."

Web 界面使用

启动后访问 http://localhost:5173(默认端口),通过可视化界面操作,无需编程基础

❓ 常见问题

Paper2Slides支持哪些文档格式?

PDF、Word、Excel、PowerPoint、Markdown 等,支持多文件同时处理

Paper2Slides生成质量是否达到专业水准?

是的,内置学术风格符合国际会议规范,自定义风格取决于描述和图像生成模型能力

Paper2Slides需要编程基础吗?

不需要。Web 界面完全可视化;命令行提供示例,复制粘贴即可使用

可以单独修改某张幻灯片吗?

目前侧重自动化生成,建议把生成的 PDF 导入 PowerPoint/Keynote 微调,或者调整参数重新生成

文件保存在哪里?

 所有生成文件和检查点保存在项目根目录的 outputs/ 文件夹中

处理过程中断怎么办?

支持断点续传,重新运行相同命令会自动从上次中断处继续

使用什么技术确保内容准确?

采用 RAG(检索增强生成)机制,直接从文档提取内容,避免信息漂移

Paper2Slides 适合需要经常做学术演示的科研人员、研究生和高校教师,能省下不少排版时间。