性能飙升 90%!Anthropic 首度揭秘多智能体系统构建完整流程
近日,人工智能公司Anthropic披露其王牌产品Claude的重大升级,通过构建“研究团队”(多个AI智能体组成),在复杂研究任务上较单智能体系统提升90.2%,标志AI迈向“协同智能”新阶段。
新功能“Research”核心是多智能体系统,“主导智能体”规划拆解任务,创建“子智能体”并行检索分析,模仿人类专家协作,攻克传统AI难题。本文由Anthropic核心团队撰写,剖析系统构建全貌。
多智能体系统优势明显,研究工作开放性强,AI智能体适合此类任务,能动态决策。子智能体并行运行、压缩信息,实现关注点分离,提升调研全面性。内部评测显示,多智能体系统在“广度优先型”查询上表现出色。
“Research”系统采用“协调者 - 执行者”架构,主导智能体分配任务,子智能体并行检索。系统工作流程包括创建主研究者智能体、子智能体检索、引文智能体处理等步骤。
在提示词工程方面,需站在智能体角度思考,指导协调者分工,动态分配资源,选对工具,让智能体自我改进,采用先广后深策略,引导思考过程,并行调用工具。评估方法要灵活,从小样本开始评估,用LLM判官评分,结合人工评估。
生产环境中,智能体系统面临可靠性和工程挑战,如状态累积错误、调试困难、部署协调、同步执行瓶颈等。不过,多智能体系统在开放性研究任务中价值巨大,注重工程细节可实现规模化可靠运行。