2025年AI圈的最热词，应该就是AI Agents。AI Agents简单说就

2025年AI圈的最热词，应该就是AI Agents。

AI Agents简单说就是给AI一个目标，它自己用工具、写代码、查资料，最后把活儿干完。不用你一步步教，也不用你盯着它每个动作。

Anthropic的研究员Erik最近透露，现在的AI Agents已经相当成熟了。

他甚至还用Claude Code帮自己规划过约会，约会效果Erik的评价也是相当不错。

没错，AI现在已经开始插手人类的感情生活了。

原因很简单：一个会写代码的AI，理论上什么都能干。

需要搜索就调API，需要排行程就生成表格。编码能力就像是AI的基础设施，其他技能都是在这个地基上长出来的花花草草。

Anthropic的训练策略也很直接，先把最难的编码任务练透，其他领域自然水到渠成。

AI Agents和传统工作流最大的区别在哪？循环反馈。

现在的AI Agents写完SQL之后会自己跑一遍，看看结果对不对。

不对没关系，再改再试，直到数据正确了才进入下一步。

Erik把这种新模式叫做工作流中的Agents，每个环节都是一个闭环，每个闭环里的AI都能自己折腾到满意为止。

这种架构的好处显而易见：容错率高、质量稳定、不用人工盯着。

当然代价也有，就是延迟变高（毕竟AI要来回试好几次）。

如果说单个AI Agent已经够厉害，那多个Agent协作会发生什么？

Anthropic的深度研究功能给出了答案：一个主Agent把任务拆成几块，分配给多个sub agents并行处理，最后汇总结果，这套玩法在搜索场景特别好用。

在编码场景里，sub agents的作用更微妙。

假如需要在几万行代码里找某个类的实现，这活儿费token又费时间。主Agent可以把这个任务扔给sub agents，sub agents翻完代码只返回关键信息，

听起来很美好，但Erik发现AI当管理者的表现其实挺菜的。

Claude给sub agents布置任务时，经常犯新手主管的毛病：指令含糊、信息不全、默认对方啥都懂。结果sub agents一脸懵，干出来的活儿也不对路。

经过专门训练后，Claude学会了当个合格的老板。

它开始给子代理写长篇大论的背景介绍，把前因后果交代清楚，确保对方有足够的上下文。

这和人类管理学的规律完全一致：好的管理者不是甩手掌柜，而是清晰的沟通者。

AI代理的能力越强，开发者塞给它的工具就越多。有些企业直接给AI配了一两百个工具接口，以为这样就能包打天下。

结果适得其反，工具太多反而让AI无所适从。

Erik观察到一个有效的解决方案：把工具按功能分类，每类工具配一个专门的子代理。

主AI只需要知道我要用哪类工具，具体操作交给对应的子代理。这样每个子代理只管20来个工具，效率反而更高。

这个思路其实很像企业的组织架构，没人会让一个部门管所有业务，分工协作才是正道。

AI的世界也一样，专业的代理干专业的事。

但Erik也提醒，多代理系统容易过度设计。AI之间聊得热火朝天，实际进展却慢如蜗牛。

如何在协作效率和沟通成本之间找平衡，是个值得研究的课题。

很多开发者有个误区：把API接口直接映射成AI工具，比如Slack的API有三个端点，分别获取对话内容、用户名、频道名，那就给AI配三个工具。

Erik说这是大错特错，AI是用户，不是程序员。

你给人类用户设计界面时，会把所有信息一次性展示好，不会让用户点三次才能看完整。AI也一样，最好一个工具就把相关信息全部返回，省得它来回调用浪费token。

这个建议的核心是换位思考，站在AI的角度，看看它实际收到的提示词、工具描述、返回结果，确保信息足够完整。

Erik建议开发者养成习惯，定期翻看AI的原始日志，看看它到底看到了什么、做了什么，这种透明度对调试至关重要。

Anthropic最近推出了Skills功能。

以前给AI提供指令，只能写文字说明，现在你可以直接给它模板文件、代码库、图片素材。

比如公司要做演示文稿，把PPT模板和领导层照片都扔给AI，它就知道该怎么排版、用哪些素材。这些资源可以重复使用，不用每次都重新解释。

这个功能的价值在于，它把AI从执行者变成了拥有资源库的专家。就像一个设计师不仅懂审美，手头还有一堆高质量素材随时调用。

AI有了Skills之后，做事的完整度和专业度都会提升一大截。

Erik还透露正在研究一个有趣的方向：让多个Claude同时解决一个问题，就像多人头脑风暴，看看集体智慧能不能超越单兵作战。

技术在进步，AI在变强，但底层逻辑没变：工具服务于目标，复杂度服从于可控性，最终一切还是为了把事情做好。至于AI会不会有一天完全取代人类工作，那就是另一个话题了。

游戏百科