性能飙升 90%！Anthropic 首度揭秘多智能体系统构建完整流程

文曲星2025-06-16 16:17:3285

近日，人工智能公司Anthropic披露其王牌产品Claude的重大升级，通过构建“研究团队”（多个AI智能体组成），在复杂研究任务上较单智能体系统提升90.2%，标志AI迈向“协同智能”新阶段。

新功能“Research”核心是多智能体系统，“主导智能体”规划拆解任务，创建“子智能体”并行检索分析，模仿人类专家协作，攻克传统AI难题。本文由Anthropic核心团队撰写，剖析系统构建全貌。

多智能体系统优势明显，研究工作开放性强，AI智能体适合此类任务，能动态决策。子智能体并行运行、压缩信息，实现关注点分离，提升调研全面性。内部评测显示，多智能体系统在“广度优先型”查询上表现出色。

“Research”系统采用“协调者 - 执行者”架构，主导智能体分配任务，子智能体并行检索。系统工作流程包括创建主研究者智能体、子智能体检索、引文智能体处理等步骤。

在提示词工程方面，需站在智能体角度思考，指导协调者分工，动态分配资源，选对工具，让智能体自我改进，采用先广后深策略，引导思考过程，并行调用工具。评估方法要灵活，从小样本开始评估，用LLM判官评分，结合人工评估。

生产环境中，智能体系统面临可靠性和工程挑战，如状态累积错误、调试困难、部署协调、同步执行瓶颈等。不过，多智能体系统在开放性研究任务中价值巨大，注重工程细节可实现规模化可靠运行。