OpenLens AI是清华大学自动化系索津莉课题组推出的首个医疗信息学全自主AI研究框架。

OpenLens AI框架采用模块化设计,由五个智能体组成完整科研流水线,包括主管模块、文献综述者、数据分析者、编码器和LaTeX写作器。它加入医学专用质量控制方法,通过学术严谨性检查、证据可追溯性检查、文献检查和视觉语言反馈四个机制,能生成可直接发表的高质量论文,将科研周期从数月缩短到几小时。

OpenLens AI(图1)

OpenLens AI核心功能:

  • 文献综述:系统用ReAct推理框架自动检索整理最新研究论文,智能分析后生成详细综述报告。

  • 数据分析:处理多阶段数据流程,把原始医学数据(包括时间序列和基因组信息)转为结构化可解读的内容,生成含可视化图表、统计摘要和文字说明的综合报告。

  • 代码生成:把实验方案变成可运行代码,通过视觉语言模型检查代码质量,保证程序正确且符合科学要求。

  • 手稿准备:汇总各模块结果,生成符合出版要求的论文,通过视觉语言反馈确保图表和格式统一。

OpenLens AI原理:

OpenLens AI框架由五个智能体组成完整科研流水线:

  • 主管模块:负责协调,把用户需求拆成具体小任务,保证研究过程清晰易懂。

  • 文献综述者:自主构建知识探索路径,用ReAct推理框架检索整理文献,为研究打好理论基础。

  • 数据分析者:处理多阶段数据流程,把原始医学数据转为结构化可解读的内容。

  • 编码器:把实验方案变成可运行代码,通过视觉语言模型检查代码质量。

  • LaTeX写作者:汇总各模块结果,生成符合出版要求的论文。

OpenLens AI应用场景:

OpenLens AI主要用在健康信息学研究领域,能明显提高医学研究效率和可重复性。首次实现从文献挖掘到完成投稿论文的全流程自动化,把传统医学研究周期从数月缩短到几小时。

质量控制:

OpenLens AI集成四个质量控制机制:

  • 学术严谨性检查:自动验证实验方法是否合理,发现数据泄露、错误性能指标等问题,保证结果可靠。

  • 证据可追溯性检查:把每个研究结论和原始证据关联,生成可追溯的报告,确保研究透明且能复现。

  • 文献检查:核对引用文献,确认文献信息准确,删除无法验证的内容,保证学术依据可靠。

  • 视觉语言反馈:在关键步骤评估图表质量,给出直观反馈,提升结果可读性和科学性。

OpenLens AI测试表现

研究团队在MIMIC-IV和eICU两个权威医学数据集测试,设计了18个难度递增的任务。结果显示系统能可靠完成多数任务,对低至中等难度的任务效果尤其好。

GitHub项目地址:https://github.com/jarrycyx/openlens-ai