性能飙升 90%！Anthropic 首度揭秘多智能体系统构建完整流程

文曲星2025-06-17 15:22:44190

6月16日消息，人工智能公司Anthropic披露了其王牌产品Claude的重大升级。通过构建“研究团队”（由多个AI智能体组成），Claude在复杂研究任务上的表现较单智能体系统提升了90.2%，标志着AI迈向“协同智能”新阶段。

新功能“Research”核心是多智能体系统，“主导智能体”像项目经理，规划拆解任务后创建“子智能体”并行检索分析。该模式模仿人类专家协作，攻克传统AI难题。本文由Anthropic核心团队撰写，剖析系统构建全貌。

多智能体系统优势明显。研究工作开放性强、不可预测，AI智能体适合此类任务。子智能体并行运行探索不同方面，汇总信息给主导智能体，实现关注点分离。内部评测显示，多智能体系统在“广度优先型”查询上表现出色，能有效扩展性能，但token消耗快，适用于高并行度、信息量大的任务。

“Research”采用“协调者 - 执行者”架构，主导智能体协调流程、分派任务。用户查询后，主导智能体分析并生成子智能体检索信息，与传统检索方法不同，能动态调整策略。

在提示词工程与评估方面，多智能体系统与单智能体有本质区别，需站在智能体角度思考，指导协调者分工，动态分配资源，选对工具，让智能体自我改进等。评估时要从小样本开始，采用LLM为判官的方法，结合人工评估。

生产环境下，智能体系统面临可靠性与工程挑战，如状态累积错误、调试难、部署协调复杂等。不过，多智能体系统在开放性研究任务中价值巨大，注重工程细节可实现可靠运行。