游戏百科

2025年AI圈的最热词,应该就是AI Agents。AI Agents简单说就

2025年AI圈的最热词,应该就是AI Agents。

AI Agents简单说就是给AI一个目标,它自己用工具、写代码、查资料,最后把活儿干完。不用你一步步教,也不用你盯着它每个动作。

Anthropic的研究员Erik最近透露,现在的AI Agents已经相当成熟了。

他甚至还用Claude Code帮自己规划过约会,约会效果Erik的评价也是相当不错。

没错,AI现在已经开始插手人类的感情生活了。

原因很简单:一个会写代码的AI,理论上什么都能干。

需要搜索就调API,需要排行程就生成表格。编码能力就像是AI的基础设施,其他技能都是在这个地基上长出来的花花草草。

Anthropic的训练策略也很直接,先把最难的编码任务练透,其他领域自然水到渠成。

AI Agents和传统工作流最大的区别在哪?循环反馈。

现在的AI Agents写完SQL之后会自己跑一遍,看看结果对不对。

不对没关系,再改再试,直到数据正确了才进入下一步。

Erik把这种新模式叫做工作流中的Agents,每个环节都是一个闭环,每个闭环里的AI都能自己折腾到满意为止。

这种架构的好处显而易见:容错率高、质量稳定、不用人工盯着。

当然代价也有,就是延迟变高(毕竟AI要来回试好几次)。

如果说单个AI Agent已经够厉害,那多个Agent协作会发生什么?

Anthropic的深度研究功能给出了答案:一个主Agent把任务拆成几块,分配给多个sub agents并行处理,最后汇总结果,这套玩法在搜索场景特别好用。

在编码场景里,sub agents的作用更微妙。

假如需要在几万行代码里找某个类的实现,这活儿费token又费时间。主Agent可以把这个任务扔给sub agents,sub agents翻完代码只返回关键信息,

听起来很美好,但Erik发现AI当管理者的表现其实挺菜的。

Claude给sub agents布置任务时,经常犯新手主管的毛病:指令含糊、信息不全、默认对方啥都懂。结果sub agents一脸懵,干出来的活儿也不对路。

经过专门训练后,Claude学会了当个合格的老板。

它开始给子代理写长篇大论的背景介绍,把前因后果交代清楚,确保对方有足够的上下文。

这和人类管理学的规律完全一致:好的管理者不是甩手掌柜,而是清晰的沟通者。

AI代理的能力越强,开发者塞给它的工具就越多。有些企业直接给AI配了一两百个工具接口,以为这样就能包打天下。

结果适得其反,工具太多反而让AI无所适从。

Erik观察到一个有效的解决方案:把工具按功能分类,每类工具配一个专门的子代理。

主AI只需要知道我要用哪类工具,具体操作交给对应的子代理。这样每个子代理只管20来个工具,效率反而更高。

这个思路其实很像企业的组织架构,没人会让一个部门管所有业务,分工协作才是正道。

AI的世界也一样,专业的代理干专业的事。

但Erik也提醒,多代理系统容易过度设计。AI之间聊得热火朝天,实际进展却慢如蜗牛。

如何在协作效率和沟通成本之间找平衡,是个值得研究的课题。

很多开发者有个误区:把API接口直接映射成AI工具,比如Slack的API有三个端点,分别获取对话内容、用户名、频道名,那就给AI配三个工具。

Erik说这是大错特错,AI是用户,不是程序员。

你给人类用户设计界面时,会把所有信息一次性展示好,不会让用户点三次才能看完整。AI也一样,最好一个工具就把相关信息全部返回,省得它来回调用浪费token。

这个建议的核心是换位思考,站在AI的角度,看看它实际收到的提示词、工具描述、返回结果,确保信息足够完整。

Erik建议开发者养成习惯,定期翻看AI的原始日志,看看它到底看到了什么、做了什么,这种透明度对调试至关重要。

Anthropic最近推出了Skills功能。

以前给AI提供指令,只能写文字说明,现在你可以直接给它模板文件、代码库、图片素材。

比如公司要做演示文稿,把PPT模板和领导层照片都扔给AI,它就知道该怎么排版、用哪些素材。这些资源可以重复使用,不用每次都重新解释。

这个功能的价值在于,它把AI从执行者变成了拥有资源库的专家。就像一个设计师不仅懂审美,手头还有一堆高质量素材随时调用。

AI有了Skills之后,做事的完整度和专业度都会提升一大截。

Erik还透露正在研究一个有趣的方向:让多个Claude同时解决一个问题,就像多人头脑风暴,看看集体智慧能不能超越单兵作战。

技术在进步,AI在变强,但底层逻辑没变:工具服务于目标,复杂度服从于可控性,最终一切还是为了把事情做好。至于AI会不会有一天完全取代人类工作,那就是另一个话题了。