Anthropic首次公开多智能体系统架构,性能较以往提升90%

文曲星2025-06-16 16:17:329

近日,网易科技报道,人工智能公司Anthropic披露其王牌产品Claude的重大升级,通过构建多智能体“研究团队”,Claude在复杂研究任务上较单智能体系统实现90.2%的性能提升,标志AI迈向“协同智能”新阶段。

新功能“Research”核心是多智能体系统,“主导智能体”规划拆解任务,创建“子智能体”并行执行检索分析,模仿人类团队协作,攻克传统AI难题。该文由Anthropic核心团队撰写,剖析系统构建全貌。

多智能体系统优势明显,研究工作的开放性使AI适合此类任务,子智能体并行探索、压缩信息、分离关注点。内部评测显示,多智能体系统在“广度优先型”查询上表现出色,能大幅提升性能,但也存在token消耗快、不适用于部分任务等问题。

Research系统采用“协调者 - 执行者”架构,主导智能体协调并分派任务,子智能体检索信息。与传统检索方法相比,该架构采用多步搜索,能动态调整策略,给出高质量答案。

在提示词工程方面,团队总结了站在智能体角度思考、指导分工、动态分配资源等原则,并行工具调用可提升速度和表现。评估智能体时,采用小样本开始、LLM为判官、人工评估等方法,理解智能体互动模式也很重要。

生产环境中,智能体系统面临可靠性与工程挑战,如状态累积错误、调试困难等。团队通过设计可恢复系统、新调试方法等应对。尽管挑战众多,多智能体系统在开放性研究任务中价值巨大,注重工程细节可实现可靠运行。

原文链接:https://www.163.com/tech/article/K260AR5A00097U7T.html

扫一扫二维码,添加客服微信