PaperBanana：谷歌开源学术插图自动生成框架

PaperBanana是什么？

PaperBanana是谷歌云AI研究院和北京大学一起做的开源工具，能帮AI科研人员自动做论文配图。

PaperBanana(图1)

PaperBanana是个多智能体协作的系统，5个专业AI分工，把文字描述变成符合NeurIPS这类顶会标准的学术插图：

PaperBanana是参考驱动的“智能代理框架”，靠5个专业代理把原始文字或数据变成能直接用的学术插图。

系统让5个智能体一起干活：先检索，在参考库找和用户主题、想做的图匹配的现有图表；再规划，结合源文字和找的参考，写目标插图的详细文字描述，说清组件和逻辑；然后定风格，让图看着专业好看；接着可视化，把改好的文字描述变成图；最后审核，查质量。

它把逻辑规划和美学渲染分开，还加了评审环节，所以生成的图在忠实度、简洁性、美观度上，比普通“黑盒”图像生成模型好很多。

另外，它还能从原始表格或代码生成统计图表。代码模式适合要准的任务，用Python（比如Matplotlib）画，不会“编”数据；图像模式适合优先好看的简单图，可能数据有点小误差。

在PaperBanana Bench（292个跨领域测试）里，它在忠实度、简洁性、可读性、美观性上，比现有模型都好，整体提升17%，简洁性升了37.2%。人类盲测里，72.7%的研究人员说它比传统方法好。

要注意，PaperBanana是2026年1月刚出的早期项目，现在主要优化AI和计算机科学的方法图，其他学科支持还在完善。官方代码和数据集计划2周内发，现在GitHub有社区做的非官方版能试。