重磅!Anthropic内部Skills经验公开了!

2419 words
12 minutes
重磅!Anthropic内部Skills经验公开了!

重磅!Anthropic内部Skills经验公开了!#

来源: Datawhale(微信公众号) 作者: Anthropic团队 发布时间: 2026年6月7日 22:03 浙江 原文链接: https://claude.com/blog/lessons-from-building-claude-code-how-we-use-skills


Anthropic 自己内部是怎么用 Claude Code Skills 的,这次终于公开了。

他们把内部团队的用法做了一次完整复盘:Skills 分成哪 9 类、哪类最值得花力气、怎么写才真的有用。这些经验之前只在 Anthropic 内部流转,现在一次讲清。

今天把这个经验帖的核心干货给你梳理清楚。


一、先把 Skill 理解对#

Anthropic 先纠正了一个很常见的理解。Skill 不只是几段提示词,它更接近一个围绕任务组织起来的文件夹

这个文件夹里可以放 SKILL.md,也可以放参考文档、脚本、模板、示例、hooks,甚至放会被后续任务继续读取的数据。Claude 调用 Skill 时,拿到的其实是一套完成任务所需的工作材料。

这个定义很重要。因为很多团队真正缺的,从来不是”再补一段提示词”,而是把那些已经验证过的做法、容易错的细节、常用脚本和固定流程,一次整理好,后面反复复用。

二、Anthropic 把内部 Skills 归成了 9 类#

Anthropic 盘了一遍内部的 Skills,最后大致分成了 9 类。这 9 类连起来看,其实很像一条完整的软件工作流,从补知识到写代码,再到验证、部署、排障和运维。

前三类:给模型补知识、补验证、补数据#

第一类是 library 和 API reference,给模型解释某个库、CLI 或 SDK 在团队内部到底该怎么用,把容易用错的规则和 gotchas 写清楚。

第二类是 product verification,负责判断产出有没有真的工作,比如在无头浏览器里完整跑一遍注册和结账流程。Anthropic 明说这类对输出质量提升最明显,值得让工程师专门花一周打磨。

第三类是 data fetching and analysis,连着数据仓库和监控系统,把取数方法、字段约定和常见分析路径封装好,模型不用再去猜表结构和字段名。

中间三类:开始接住团队里的日常流程#

第四类是 business process and team automation,把重复发生的团队流程压成一个命令就能跑的工作流,比如只输出相对昨天增量的 standup,或固定格式的周报。

第五类是 code scaffolding and templates,生成那些有固定骨架、但又带着大量自然语言约束的代码,比如新 service 或迁移文件。

第六类是 code quality and review,让代码尽量符合团队的质量标准。典型例子是拉一个”新鲜视角”subagent 来挑错的 adversarial-review,这类能力还能做成 hook 接进 CI。

后三类:已经连到生产环境了#

第七类是 CI/CD and deployment,把代码从开发态推到上线态。比如 babysit-pr 会盯完一个 PR 的全过程,deploy-<service> 会把 build、放量、错误率对比和回滚条件串成一条链路。

第八类是 runbooks,入口不是”我要写什么”,而是”现在出了什么症状”。报警、Slack thread、request ID 进来,它负责映射到该用哪些工具、查哪些路径,最后给出结构化结论。

第九类是 infrastructure operations,处理资源清理、依赖治理和成本排查这类例行操作。这些动作常带破坏性,所以 Skill 里要写清 guardrail,先通知、再确认,最后才真正执行。

三、Anthropic 真正强调的,不只是”会写”,更是”写对”#

好的 Skill,往往都很聚焦#

Anthropic 说得很直接,最好的 Skill 往往都很聚焦。能清楚落进某一类里的 Skill,通常更稳;试图同时覆盖太多目标的 Skill,反而更容易把模型带乱。

所有类型里,他们最看重「验证」#

在所有类型里,Anthropic 特别强调 verification。因为模型最容易给人一种”已经做完了”的错觉,而真正容易掉链子的地方,恰恰是最后那一步验证。

原文甚至建议,值得让工程师单独花一周,把验证类 Skill 做到足够好。

他们还给了两个非常实用的建议:

  1. 让 Claude 录下自己测试过程的视频,这样你能清楚看到它到底测了什么。
  2. 在关键节点加程序化断言。状态有没有变化,事件有没有真正落库,最终页面是不是到了目标状态,都尽量不要只靠”看起来差不多”。

真正有价值的内容,往往是 gotchas#

Anthropic 对 Skill 里的内容优先级也讲得很清楚。最有信号量的部分,通常不是通用步骤,而是 gotchas

因为 Claude 本来就会写代码,也会读代码库。那些”默认它也会做”的东西,写进 Skill 里只会增加上下文,不一定增加价值。

真正值得写的,是那些会把模型从默认思路里拽出来的细节:

  • subscriptions 表是 append-only,要找最高 version,不能只看最新 created_at。
  • 同一个字段,在 API gateway 里叫 @request_id,到了 billing 服务里叫 trace_id。
  • staging 返回 200,也不代表 Stripe webhook 真处理成功了,还得去看 payment_events 里的真实状态。

四、Skill 到底该怎么写#

1. 别把显而易见的话再写一遍#

Skill 不是给人看的摘要,它要补的是模型默认拿不到、或者默认容易走偏的信息。Anthropic 提到过一个前端设计 Skill 的例子——它的价值不在于教 Claude 怎么写前端,而在于补充团队通过和客户反复迭代后沉淀下来的”设计品味”和避坑点。

2. SKILL.md 更像目录,不该写成大杂烩#

更好的做法是让 SKILL.md 做目录和路标,把具体资料按需分发到别的文件里:

  • 任务卡住了,再去读 stuck-jobs.md
  • API 的函数签名和用法示例,拆进 references/api.md
  • 模板放进 assets/
  • 脚本、参考资料、例子分目录放好

这套做法就是 progressive disclosure——文件系统本身,也是一种上下文工程。

3. Skill 不要写得太死#

给 Claude 关键规则,但也要给它足够的适应空间,不然 Skill 一复用,就容易在别的具体情境里卡住。

4. setup 要提前想好#

很多 Skill 真跑起来时,会缺一些来自用户的上下文。原文建议把这类配置放进 config.json,如果配置还没建好,Claude 就先问用户。

5. description 要直接服务触发#

description 是写给模型看的,决定 Skill 会不会被触发。它不是摘要,而是触发条件说明。用户可能会说什么关键词、上传什么文件、什么场景下应该激活这个 Skill,都应该直接写进去。

五、Skill 用深之后,会先长出记忆、脚本和 hooks#

记忆#

像 standup-post 这种 Skill,可以把每次输出都记进 standups.log,下次运行时先读历史,再判断今天和昨天相比到底变了什么。可以用 append-only 文本或 JSON,也可以用 SQLite。

脚本#

Anthropic 的判断很明确——能给 Claude 的最强工具之一,其实就是代码本身。预置常用的数据抓取函数、分析函数或操作脚本,Claude 就能把更多回合花在”怎么编排”和”下一步做什么”上。

on-demand hooks#

它们只在 Skill 被调用时生效,而且只在当前会话里存在。例如:

  • /careful:拦住 rm -rf、DROP TABLE、force-push、kubectl delete 等高风险操作
  • /freeze:阻止对指定目录之外的 Edit 和 Write,适合排障时防止顺手改坏别的地方

六、当团队开始大量用 Skill,后面就是分发和治理#

两条主路线#

  1. repo 内 check-in:把 Skill check in 到 repo 里的 ./.claude/skills,适合规模不大的团队。
  2. 插件 marketplace:用内部的 Claude Code Plugin marketplace 上传和安装,团队一变大优势更明显。

治理流程#

Anthropic 没有一上来就搞中央审批。更常见的方式是:谁有 Skill 想给大家试,就先传到 GitHub 里的 sandbox 文件夹,再发到 Slack 让其他人试用。等这个 Skill 真有了 traction,再由 Skill owner 提 PR,正式移进 marketplace。

Skills 之间也可以互相组合#

比如一个文件上传 Skill,再有一个 CSV 生成 Skill,后者生成完文件后,再去调用前者完成上传。只要在 Skill 里直接引用另一个 Skill 的名字,模型在安装了它们的前提下,照样能把链路串起来。

使用度量#

Anthropic 会用 PreToolUse hook 记录公司内部的 Skill 使用情况,了解哪些 Skill 热门、哪些触发明显不足。


写在最后#

Anthropic 在文章结尾提到一个细节:他们内部最好的 Skills,一开始往往只有几行字和一个 gotcha,用得越多,才补得越完整。

这句话基本可以当成上手指南。写 Skill 不用追求一步到位,先把验证方法写清楚,把真正踩过的坑记下来,脚本、记忆、hooks 和分发,等用起来之后再慢慢补。

如果你也在用 Claude Code,不妨从手头最常重复的那个任务开始。先写几行说明,加上一个 gotcha,剩下的交给时间和使用频率。


本文转载自微信公众号 Datawhale,原标题为”重磅!Anthropic内部Skills经验公开了!“,内容有整理。

Share Article

If this article helped you, please share it with others!

重磅!Anthropic内部Skills经验公开了!
https://estars-blog.pages.dev/posts/外部精选-重磅anthropic内部skills经验公开了/
Author
Estars
Published at
2026-06-11
License
CC BY-NC-SA 4.0
Profile Image of the Author
Estars
这条路要走完,才能看到世界的终点,是海纳百川,还是星火燎原。
公告
欢迎来到我的博客!这是一则示例公告。
Music
Cover

Music

No playing

0:00 0:00
No lyrics available
Categories
Tags
Site Statistics
Posts
91
Categories
5
Tags
44
Total Words
374,063
Running Days
0 days
Last Activity
0 days ago

Table of Contents