斯坦福华人研究火了:45分钟让你的论文变身AI智能体!
新智元报道
编辑:元宇
【新智元导读】斯坦福大学研究人员提出了Paper2Agent,将静态论文转化为可交互的福华分钟AI智能体,让学术成果可以直接被「调用」,人研让为科研知识传播开辟了新模式,究火并为构建AI共研生态奠定基础。论文
把论文,变身变成会动的斯坦智能体?
这样论文就不再是静态的PDF文件,研究成果不仅可以「开口说话」,福华分钟还能主动帮你把事做了。人研让
传统科研论文的究火阅读门槛很高,往往需要读者投入大量精力去理解论文内容。论文
为了解决这一难题,变身斯坦福大学研究人员提出了Paper2Agent,斯坦让论文一键变身AI智能体。福华分钟
这样一来,人研让学术成果可以直接被「调用」,而不用再经历从阅读、理解再到最终应用的漫长转化过程。
https://arxiv.org/abs/2509.06917
Paper2Agent是一个可将科研论文转化为「研究助手型」AI智能体的自动化框架。
而且,它还可以实现多智能体协同作业。
研究人员利用Paper2Agent成功构建了AlphaGenome智能体,用于解释基因组变异,还做了Scanpy与TISSUE智能体,用于开展单细胞和空间转录组分析。
结果显示,Paper2Agent不仅能复现原论文结果,也能准确处理新的用户请求。
Paper2Agent提供了将科研论文转化为智能体的自动化工作流。
它的核心思路,是把论文封装成一个MCP服务器。
转化流程共分为三步:
识别论文的关键贡献(数据集、方法、模型或工作流)。
将这些关键贡献封装为MCP服务器,并明确其输入、输出与使用说明。
将MCP服务器连接至LLM驱动的智能体,实现自然语言查询与自主执行。
Paper2Agent概述
Paper2Agent生成的论文智能体具有以下特点:
交互便捷:用户可用自然语言执行复杂科学分析,无需编程基础;
可靠易复现:每个论文智能体所使用的工具均会通过示例数据集,与论文代码库中报告的结果与图表进行验证,并锁定配置确保可复现性。
Paper2Agent基于MCP生态系统,构建了两个关键组件:
Paper2MCP:从论文及其代码库中提取信息,用以构建远程MCP服务器;
智能体层:将每个MCP服务器封装为上下文提供者,从而生成针对特定论文的AI智能体(见图1A)。
每个MCP服务器包括三个核心组件:
MCP工具:可执行函数,封装了论文中的方法学创新。这些工具运行在预配置环境中,确保无缝执行。
MCP资源:静态资源仓库,包含论文文本、关联代码库及补充材料,如数据集、表格、图像等。
MCP提示词:精炼的指令模板,引导AI智能体完成从论文文本或代码库中提取的多步骤科学工作流。
研究人员借助Claude Code完成了对Paper2Agent的对接与调用。
整个流程,从识别论文相关的代码库开始(图1B)。
随后,调用两个专用智能体和一个测试智能体。
环境智能体,用于配置所需的软件环境;
提取智能体,用于将核心方法转化为可执行工具。
测试智能体,通过自动测试不断优化代码与环境,直到结果与参考输出一致。
完成验证后,工具与环境将被打包为MCP Python文件,可部署至Hugging Face等远程服务器。
最后,通过将MCP服务器与AI智能体连接,生成一个功能完整的论文智能体,用户就可以通过自然语言访问该论文的方法。
研究人员通过三个案例,来展示Paper2Agent如何将不同类型的科研论文转化为可靠的交互式AI智能体。
AlphaGenome Agent
基因组数据解读
AlphaGenome是一款AI模型,用于预测人类DNA中单核苷酸变异(SNV)或突变对多种基因调控过程的影响。
Paper2Agent将AlphaGenome论文转化为可交互的智能体,使用户能够自动解读基因组数据。
在无人干预的情况下,Paper2Agent在一台普通笔记本上,仅用约3小时便生成了22个AlphaGenome MCP工具,全面覆盖论文中的方法创新。
这些MCP工具可复用于未来应用,它们涵盖了单变异与批量变异评分、序列级预测、组织本体探索以及丰富的可视化功能。
研究人员进一步对AlphaGenome智能体进行了基准测试,评估其在数值与图表输出上的表现,是否可以媲美人类专家手动配置与运行代码的结果(图2C)。
结果显示AlphaGenome智能体在这些查询中均实现100%准确率,所有结果与原报告完全一致。
研究人员还演示了AlphaGenome智能体在GWAS位点解读中的应用能力,并验证了其是否能复现原论文的分析过程。
以使用AlphaGenome来解释「chr1:109274968:G>T与低密度脂蛋白胆固醇(LDL-C)相关的原因」为例(图2D),智能体构建了解决此任务的详细计划,并最终输出一份综合解读报告。
在这一过程中,研究人员还发现了Paper2Agent的重要优势:
只需一个提示词,用户即可基于独立的模型证据重新评估已发表的研究结论。
TISSUE智能体
不确定性感知的单细胞空间转录组分析
TISSUE是一篇近期发表的研究论文,提出了一种用于不确定性感知的单细胞空间转录组分析的新方法(见图3A)。
研究人员通过Paper2Agent自动生成了TISSUE智能体。
这一案例,适用于这样一个常见科研场景:
研究人员希望将新方法应用于自己的数据,但由于时间有限,很难深入理解代码库、配置运行环境,或掌握方法的特性与输入要求。
TISSUE智能体可以提供问答支持,帮助用户准备输入数据、理解方法功能,从而解决了这一难题。
对于TISSUE MCP服务器,Paper2Agent共生成了6个工具,涵盖空间基因表达预测、预测区间构建,以及面向不确定性的下游分析等(见图3A)。
值得注意的是,TISSUE智能体还可作为交互式指南使用(见图3B)。
研究人员评估了TISSUE智能体在构建空间转录组预测的预测区间方面的能力,发现智能体无需用户额外干预,便自动执行了整个TISSUE流程(见图3C)。
这说明智能体不仅能使用单个工具,还能独立完成从数据加载、预处理、插补到不确定性估计的整套分析流程。
最后,研究人员还展示了如何通过将TISSUE论文中的「数据可用性」部分转化为结构化注册表,来进一步利用MCP资源(见图3D)。
用户可以通过查询筛选出特定物种的数据集,而无需手动浏览多个数据仓库。
Scanpy智能体
用于单细胞数据预处理
Scanpy是一个广泛使用、功能强大的单细胞转录组分析工具包。
在实际应用中,研究者往往只用到Scanpy功能的一部分。
Paper2Agent不仅支持将完整方法转化为工具,也能抽取其中的关键部分,以构建更针对性的智能体,聚焦于某一特定分析任务。
研究人员聚焦于Scanpy最常见的使用场景:单细胞数据的预处理与聚类。
Paper2Agent用了约45分钟,便在一台笔记本电脑上生成了7个工具(见图4A)。
通过这些工具,用户可以通过自然语言提示让Scanpy智能体对其单细胞数据进行质控处理。
许多用户偏好从头到尾的预处理与聚类流程,即工具按既定顺序依次执行。
这类分析流程不仅常见于单细胞研究,也普遍存在于科学领域的其他复杂数据处理中。
然而,执行这些流程通常很具挑战性:AI智能体要么必须「预先知道」正确的执行顺序,要么依赖用户输入结构化良好的提示词明确指定步骤。
为解决这个问题,研究人员使用MCP提示词来规范流程。
MCP提示词提供了一种标准化方法,这些提示词由Paper2Agent直接从论文和代码库中自动推理得出,无需人工整理。
这种机制显著提高了复杂分析任务的可复现性与易用性。
例如,Scanpy智能体的MCP提示词就完整编码了一套标准的预处理与聚类流程,包括质控、标准化、特征选择、降维、图构建、聚类和细胞类型注释,并确保其按正确顺序执行(见图4B)。
研究人员使用三个公开单细胞数据集对Scanpy智能体的性能进行了评估,结果显示智能体输出的结果与人类研究者处理同样数据时的结果一致(图4C)。
这表明基于MCP提示词驱动的Scanpy智能体,能够流畅运行完整流程,使先进的单细胞分析更加易用和可复现。
作者简介
Jiacheng Miao
Jiacheng Miao现为斯坦福大学博士后,与Jonathan Pritchard和James Zou合作。在这份工作中,Jiacheng Miao与其他研究者共同提出了Paper2Agent。
2025年,Jiacheng Miao在威斯康星大学麦迪逊分校获得博士学位,导师是Qiongshi Lu和Lauren Schmitz。2019年,Jiacheng Miao在南京大学数学系完成了本科学业。
Jiacheng Miao的研究方向是构建可靠的AI co-scientists以加速科学发现,并使用Perturb-seq解释与疾病相关的基因。
2025年,Jiacheng Miao获得了NOMIS & Science青年探索者奖。
参考资料:
https://arxiv.org/abs/2509.06917
(责任编辑:探索)
-
雷速体育10月9日讯 北京时间明天凌晨,世欧预第7轮将迎来奥地利对阵圣马力诺的比赛,赛前奥地利球星阿拉巴在发布会上谈到了效力拜仁的莱默尔。阿拉巴表示:“莱默尔的表现一如既往的出色,对我们来说,他是非常 ...[详细]
-
来源:参考消息埃及总统:新一轮加沙停火谈判“取得积极进展”据埃及媒体报道,埃及总统塞西8日表示,正在埃及海滨城市沙姆沙伊赫进行的新一轮加沙停火谈判“取得积极进展”。记者姚兵)来源 | 新华社点击进入专 ...[详细]
-
小米 17 Pro 系列手机中秋限定背屏壁纸上线,6 款可选
IT之家 10 月 5 日消息,小米手机宣布,小米 17 Pro 系列中秋限定背屏壁纸今日已上线,6 款可选。设置路径:设置-妙享背屏-背屏个性化-更多推荐。IT之家注意到,小米 17 Pro 系列手 ...[详细]
-
26日下午,泉州市防控疫情应急指挥部医疗救治组会同鲤城区、丰泽区、洛江区、泉州开发区组织开展中心市区大规模人群核酸检测应急演练,查找漏洞与短板,补强要素,完善预案,提高泉州市实战处置能力。昨日下午4时 ...[详细]
-
来源:财联社财联社10月9日电,国家发展改革委、市场监管总局近日发布关于治理价格无序竞争维护良好市场价格秩序的公告,价格竞争是市场竞争的重要方式之一,但无序竞争会对行业发展、产品创新、质量安全等造成负 ...[详细]
-
ALPINA新设计主管称将推“令人兴奋的”车型,消息称基于宝马7系
IT之家 10 月 5 日消息,宝马集团在 2022 年初收购 ALPINA,不过并非收购这家家族企业本身,而是获得了 ALPINA 品牌使用权,计划在未来高端车型上沿用这一传奇标识。首批重点可能放在 ...[详细]
-
微软公布10月Visual Studio AI发展路线图,多项功能待改进
IT之家 10 月 5 日消息,微软公布了最新的 10 月份 Visual Studio 人工智能发展路线图,重点介绍了未来将在集成开发环境中推出的 AI 功能改进与新特性。微软表示,将持续通过更智能 ...[详细]
-
闽南网9月15日讯闽南网记者 尤燕姿 通讯员 陈玮铭 何毓慧 黄玲艳)疫情袭来,星夜集结,出征支援。他们奔赴莆田与泉港抗击疫情一线……连日来,泉州卫健系统涌现出了一批又一批 ...[详细]
-
由于受副热带高压加强西伸影响,未来几天泉州温度将继续上升,午后有阵雨或雷雨,部分乡镇最高气温逐步上升至35至37℃以上,市民朋友们注意尽量避免午后高温时段的户外活动。雨后“珍珠&rdquo ...[详细]
-
谷歌推出Nest智能摄像头、门铃,内置能理解自然语言的Gemini AI
IT之家 10 月 5 日消息,据彭博社报道,谷歌发布了多款 Nest 品牌智能家居设备。此次发布的新品包括两款摄像头、一款门铃和一台可全向发声的小型音箱。三款摄像设备包括第三代 Nest Cam I ...[详细]