有了MCP，为什么你还需要skills

最近 Anthropic 又刷了一波存在感。作为最早把 MCP 这个概念带火的“开拓者”，他们显然没打算停下来：这两天又提出了一个新概念，叫Skills。更关键的是，Anthropic 还表示会在2025 年 12 月把Agent Skills以开放标准的形式正式发布。

乍一看，MCP（模型上下文协议）和 Skills 就像是给大模型装上的各种“外挂”或者“插件”。既然已经有了 MCP 这种能让 AI 联网、读数据的标准，为什么还要搞出一个叫 Skills 的新概念？这到底是技术真的升级了，还是又一次“换个名字继续讲”的概念膨胀？

其实，搞技术开发的核心目标就三个：能不能方便扩展、靠不靠谱、值不值得（成本是否划算）。很多看起来“新东西”的出现，其实都是围绕这三点在优化。

从这个角度出发，Skills 之所以出现，是因为现有架构在实际落地时暴露了一些明显的痛点，而它正是用来针对这些问题做补齐和改进的。

为什么有了 MCP，还需要 SKILLS？

之所以在 MCP 生态日渐成熟后又引入 SKILLS，核心原因主要归结于以下两点现实约束与定位缺失：

MCP 生态越来越成熟之后，MCP 虽然好用，但随着功能变强，它也变得越来越“臃肿”。引入SKILLS，本质上是为了给模型“减负”和“省钱”。

1) 现实限制：上下文窗口容易“被撑爆”，还显得笨重

比如前段时间探索Playwright MCP，给模型加上浏览器自动化能力。为了让模型“会用”这个工具，往往需要在提示词/上下文里塞进很多东西：

Playwright 一大堆 API 定义

各种参数结构说明

甚至还有当前页面的 DOM 树信息

这些内容一多，上下文窗口很快就被占满，系统也显得笨重、不灵活。

更麻烦的是：工具调用过程中产生的中间结果也要占 token。在典型的 MCP 流程里，模型不仅要做决策，还常常要负责“转发/整理数据”（有点像数据路由器），于是中间数据来来回回，token 消耗就被放大了。

官方举的例子也能说明这个问题：当你让 Agent 执行“从 Google Drive 下载会议记录，并把它附加到 Salesforce 的线索里”这种跨工具任务时，过程中会产生很多步骤和中间信息，而这些都会持续挤占上下文和 token(太费钱了)。

在 MCP 这种模式里，数据的传递方式说白了有点像“人工搬家”，而且是用手扛着着一整套沙发从一楼爬到二十楼那种笨办法：

(1）读取时怎么做：模型先调用 Drive 工具，Drive 不管三七二十一，把一份长达 2 万字的会议纪要整份塞进模型的上下文窗口里。

(2）写入时怎么做：模型把这份长文档读完后，又调用 Salesforce 工具，然后把这2 万字原封不动当作参数再塞进去，重新发送一遍。

结果就是：又贵、又卡、还容易出错。

Token 花费翻倍（贵）：

比如一场 2 小时的销售会议，转录文本可能就有 50,000 个 Token。现在等于“进一次、出一次”，模型要处理两遍大文本，额外多吃掉 100,000+ Token，成本直接飙升。

上下文容易爆掉（卡）：

就算是支持长上下文的模型，遇到更大的文档或更复杂的数据结构，也可能一下子把窗口塞满，导致流程跑到一半直接中断。

稳定性变差（错）：

模型在“手动搬运”海量内容时，就像人 copy-paste 大段文字一样，容易出现幻觉、漏内容、被截断、格式乱等问题。

这种做法不仅让 Token 消耗暴涨（成本更高），还会因为上下文太长、信息太多而分散模型注意力，让它在真正需要思考的关键逻辑上反而“变笨”。

2). 定位缺失：工具和方法“没连起来”

MCP 的核心作用，是把“怎么调用工具”这件事统一成一套标准协议。它最初要解决的问题很现实：如果有N个模型、M 个工具，两两适配会变得特别复杂。

但问题在于：MCP 只规定了“手怎么用工具”（调用方式），却没规定“脑子怎么把事情做完”（业务流程/SOP 怎么编排）。

所以在当前常见架构里，就算 Dify、n8n 这类平台能很方便把 MCP 接进来当“工具库”，真正的业务逻辑往往还是：

藏在大模型的“隐性经验”里（靠模型临场发挥），或

写死在人工配置/硬编码的工作流里。

结果就是：工具本身是“被动提供能力”的，但“怎么组合这些工具完成复杂任务”，缺少一个统一、标准的承载方式。

3). 怎么补这个空？Anthropic 用 Skills 给出答案

为了解决“有工具但缺流程标准”的问题，Anthropic 提出了Skills（技能）。

你可以把 Skill 理解成：把某件事做好的标准操作方法（SOP）打包成一个可复用模块。

打个比方：

大模型像厨师，

工具像锅碗瓢盆和灶台，

Skill 就像一道菜的“标准菜谱”：什么时候切菜、先炒什么、火候多少、用哪些厨具——都写清楚。

因此，Skill 的本质是标准化的 SOP 沉淀：不仅说明“要做什么”，还把“怎么做、需要哪些资源”一起封装进去。

对比一下变化会更直观：

过去：因为模型理解有限，业务流程通常只能用 Python/JS 或 Dify 的 YAML 这类方式“硬编码”出来。

现在：模型理解力更强后，很多流程可以直接用自然语言描述；非程序员也能把自己的经验固化成可复用的流程模块。类似思路早期在 OpenAI 的 GPTs 上出现过，但 Skill 更强调“工程化与标准化”——不局限在某个聊天产品里，而是能成为 Agent 可调用的基础能力单元。

核心理念：别一股脑塞给 AI，要“按需投喂”

虽然现在的 AI 记性越来越好（上下文窗口变大），但如果你把成吨的信息一次性全倒给它，AI 也会“大脑过载”，不仅容易胡言乱语、抓不住重点，而且还特别费钱。

所以，Skill 的设计思路就像**“剥洋葱”或者“看菜单”**：不问不给，问到哪层给哪层。这种专业术语叫“渐进式披露”，说白了就是：只在最需要的时候，给最关键的信息。

为了实现这一点，Skill 把信息分成了三层：

第一层：店招/名片（元数据层 —— 始终亮着）

作用：告诉 AI “我是干嘛的”。

内容：只有技能的名字和一句话简介。

好处：就像店门口的招牌，AI 一眼就能扫到，占用的“脑力”（Token）极少，非常省钱。

第二层：操作手册（指令层 —— 选中后再看）

作用：告诉 AI “这事儿具体怎么办”。

**内容：**详细的步骤、规矩和工作流程（比如SKILL.md 文件）。

好处：只有当 AI 确定要用这个技能时，才会去读这份手册。这样它能集中注意力，把事儿办得更稳妥。

第三层：工具箱/大仓库（资源层 —— 干活时才开）

作用：给 AI 真正干活用的“原材料”。

内容：复杂的代码脚本、厚厚的参考文档、庞大的数据模板。

好处：这是最占内存、最费钱的部分。所以，只有当 AI 真正开始动手干活、非用不可时，才会去仓库里取。

Skill 的标准结构：一个有序的“工作间”

一个标准的 Skill 通常会按“文件夹 + 文件”的方式来组织。你可以把它想成：一个技能包，里面把“说明书、工具、资料、素材”分门别类放好，结构大概是这样：

my-skill/ ├── SKILL.md # [必需] 核心大脑。包含元数据（name、description）和自然语言编写的指令流程 ├── scripts/ # [可选] 执行手脚。存放 Python/Bash 等可执行代码，封装复杂逻辑 ├── references/ # [可选] 知识库。存放模型决策所需的参考文档、API 手册等 └── assets/ # [可选] 静态资源。存放输出报告所需的模板、图片、示例数据等

这种分层设计有什么好处？

更省 Token、上下文更“干净”

模型不会一上来就把所有内容都读进来：

先只看SKILL.md里的元信息来判断“要不要用这个技能”；决定要用之后再读具体流程；真正执行时才去加载scripts或references。

这样可以有效避免上下文越堆越大。

也能解决“中间工具结果把 token 吃光”的问题：在 Skill 模式下，模型更多是下指令让脚本去干活，比如脚本直接从 Google Drive 拉数据并写进 Salesforce，大段会议记录根本不需要塞进模型的上下文窗口。

更稳定、更不容易出错（鲁棒性更强）

把复杂、常用、容易踩坑的操作封装进scripts，就不需要模型每次都“现场写代码、现场调试”。

结果就是：幻觉更少、错误更少、执行更一致。

这也符合很多工具型产品的思路：把高频且容易错的部分固化成“工具/代码”，把需要灵活判断的部分留给模型来做。

简单三步，上手使用 Skill

使用 Skill 的过程非常直观，就像给你的 AI 助手安装了一个“功能插件”。

1). 怎么安装？

你不需要复杂的配置，只需要把写好的skills文件夹，像放文件一样丢进特定的目录即可。

通常有两个地方可以选择：

全局有效：放在你电脑的用户目录下。

**项目有效：**放在你当前工作项目的根目录下，路径通常是.claude/skills。

2). 怎么运行？

如果你习惯用命令行，直接使用Claude Code工具就能调用。如果你更喜欢在编译器里操作，比如Cursor或VS Code，只要符合文件规范，AI 就能自动识别并学会这个新技能。

3). 举个例子：做一份红烧肉

开发一个 Skill 到底有多简单？以“教 AI 做红烧肉”为例：你只需要写清楚步骤和逻辑，保存成文件即可。

这种方式带来了一个巨大的变化——“配置即代码”：

以前：你可能需要在 Dify 这种可视化平台上，像连连看一样拉很多线条、点很多按钮来设计工作流。

现在：你只需要写一段结构化的文字（代码）。

这样做有什么好处？

管理方便：像管理代码文件一样，你可以随时查看修改记录（版本管理）。

轻松分享：把文件发给同事，他粘贴到文件夹里就能直接用。

随处复用：同样的功能，可以在不同的项目中无缝切换。

就一句话，Skill 让 AI 的能力变得“模块化”了——写完即用，复制即学会。

后记

这几个月里，开发者社区一直在分享各种 MCP 工具，大家主要是在解决“怎么把手伸出去干活”的问题——也就是让模型能调用工具、访问资源、完成具体操作。

但从现在开始、以及接下来一段时间，Skill 很可能会成为的方向。因为它不只解决“手”，更在解决两件更关键的事：怎么思考（脑），以及怎么把事情按步骤做完（流程）。

更重要的是，Skill 不只是把工具和资源“收纳起来”，它还能把一套做事方法标准化、流程化。当大模型的推理能力越来越强，Skill 就像补上了“自主智能体”拼图里那块最关键的缺口——让它不止会做事，还会按正确的方法持续把事做成。

游戏百科

有了MCP，为什么你还需要skills

热门分类