Anthropic首次公开多智能体系统架构，性能较以往提升90%

文曲星2025-06-16 16:17:32114

近日，网易科技报道，人工智能公司Anthropic披露其王牌产品Claude的重大升级，通过构建多智能体“研究团队”，Claude在复杂研究任务上较单智能体系统实现90.2%的性能提升，标志AI迈向“协同智能”新阶段。

新功能“Research”核心是多智能体系统，“主导智能体”规划拆解任务，创建“子智能体”并行执行检索分析，模仿人类团队协作，攻克传统AI难题。该文由Anthropic核心团队撰写，剖析系统构建全貌。

多智能体系统优势明显，研究工作的开放性使AI适合此类任务，子智能体并行探索、压缩信息、分离关注点。内部评测显示，多智能体系统在“广度优先型”查询上表现出色，能大幅提升性能，但也存在token消耗快、不适用于部分任务等问题。

Research系统采用“协调者 - 执行者”架构，主导智能体协调并分派任务，子智能体检索信息。与传统检索方法相比，该架构采用多步搜索，能动态调整策略，给出高质量答案。

在提示词工程方面，团队总结了站在智能体角度思考、指导分工、动态分配资源等原则，并行工具调用可提升速度和表现。评估智能体时，采用小样本开始、LLM为判官、人工评估等方法，理解智能体互动模式也很重要。

生产环境中，智能体系统面临可靠性与工程挑战，如状态累积错误、调试困难等。团队通过设计可恢复系统、新调试方法等应对。尽管挑战众多，多智能体系统在开放性研究任务中价值巨大，注重工程细节可实现可靠运行。