AutoFigure简介  

AutoFigure 是西湖大学团队做的可以把长科学论文自动变成能直接用的插图工具。做科研的人都知道,画好图很费时间,这个工具就是解决这事。  

它的办法是分层处理。先看懂文章内容,拿出关键信息,再让几个AI一起画图。团队还做了个叫 FigureBench 的测试集,有3300个样本,专门测这种插图生成工具好不好用。  

AutoFigure(图1)

AutoFigure功能特征  

  • 三层架构  

  • 内容理解层:读文章,抓重点,把方法和数据流理明白。  

  • 布局优化层:两个AI互相挑毛病,一个设计,一个审核,反复调对齐、间距这些细节。  

  • 视觉渲染层:生成高清图,还能按文档类型换风格。  

  • 文字修复技术:AI画图常把字弄糊或写错。AutoFigure 这么干:先把字擦掉,用OCR认出位置和文字,对照原设计核对,最后用矢量格式重画,保证清楚好读。  

  • 自动换风格:学术论文变正式严谨,教科书变活泼生动(这个效果最好,准确率97.5%),技术博客变现代友好。  

  • 可编辑功能:新版能把论文方法部分转成可编辑的SVG,还能在线微调。  

AutoFigure应用场景  

  • 学术论文:把复杂的方法、模型架构、实验流程变成能发表的图表。  

  • 教科书:给教材配直观插图(这个场景做得最好)。  

  • 技术博客/综述:快速生成技术概念的可视化说明。  

  • 跨学科研究:现在主要在计算机领域试过,方法能用到生物、化学、经济这些领域。  

  • 科研教学:帮学生懂复杂概念,以后可能按读者情况调详细程度。  

  • 实测数据:在 FigureBench 测试里,66.7%的生成图被认为能直接发表。  

AutoFigure使用方法  

  • 云端API:一张图约17分钟,约0.2美元。好处是不用部署,直接用。  

  • 本地部署(推荐):一张图约9分钟,几乎不花钱(用开源模型)。好处是快、省钱、数据安全。  

  • 操作步骤:  

    上传论文的方法部分,AI自动解析核心概念,设计师AI和评论家AI多轮商量定布局,生成高清图像,自动修复文字,输出能直接发的图(支持SVG编辑)。  

AutoFigure常见问题  

Q1:支持哪些文档类型?  

学术论文、技术博客、综述、教科书都行。系统会自动调风格。教科书效果最好,学术论文难点。  

Q2:时间和费用?  

云端17分钟加0.2美元一张,本地9分钟几乎免费。比人工做几天快多了。  

Q3:质量怎么保证?  

有三关:AI互相审核优化布局、专业渲染、文字修复技术。66.7%的图能直接用。  

Q4:能编辑吗?  

新版支持SVG格式,可以在线改。  

Q5:有什么局限?  

现在主要在计算机领域测;学术论文的复杂和创新对AI还是难;不能完全代替人的创造力。  

Q6:以后怎么发展?  

团队想做个性化和交互式插图(比如动画),扩到更多学科,按读者情况调详细程度。  

AutoFigure 变了科研人做图的方式。它像个“视觉翻译”,把文字变图,省时间,降门槛。等AI技术再发展,这类工具可能成科研必备。