性能飙升 90%!Anthropic 首度揭秘多智能体系统构建完整流程
6月16日消息,人工智能公司Anthropic披露了其王牌产品Claude的重大升级。通过构建“研究团队”(由多个AI智能体组成),Claude在复杂研究任务上的表现较单智能体系统提升了90.2%,标志着AI迈向“协同智能”新阶段。
新功能“Research”核心是多智能体系统,“主导智能体”像项目经理,规划拆解任务后创建“子智能体”并行检索分析。该模式模仿人类专家协作,攻克传统AI难题。本文由Anthropic核心团队撰写,剖析系统构建全貌。
多智能体系统优势明显。研究工作开放性强、不可预测,AI智能体适合此类任务。子智能体并行运行探索不同方面,汇总信息给主导智能体,实现关注点分离。内部评测显示,多智能体系统在“广度优先型”查询上表现出色,能有效扩展性能,但token消耗快,适用于高并行度、信息量大的任务。
“Research”采用“协调者 - 执行者”架构,主导智能体协调流程、分派任务。用户查询后,主导智能体分析并生成子智能体检索信息,与传统检索方法不同,能动态调整策略。
在提示词工程与评估方面,多智能体系统与单智能体有本质区别,需站在智能体角度思考,指导协调者分工,动态分配资源,选对工具,让智能体自我改进等。评估时要从小样本开始,采用LLM为判官的方法,结合人工评估。
生产环境下,智能体系统面临可靠性与工程挑战,如状态累积错误、调试难、部署协调复杂等。不过,多智能体系统在开放性研究任务中价值巨大,注重工程细节可实现可靠运行。