Matt Pocock 的 Skills 系统:给 AI 编程助手的"操作手册"
37.4K GitHub stars,3 个月内从 9K 激增。这不是又一个”AI 工具”,而是给 AI 编程助手的一本操作手册。
📋 目录
为什么需要 Skills?
如果你的 AI 编程助手经常出现这些问题:
- 写到一半突然跑偏 —— 本来要实现功能 A,写了两行代码就开始重构整个项目
- 输出冗长且重复 —— 每次回复都是”让我先了解一下…”,然后重复搜索你已经看过三遍的文件
- 代码写完就报错 —— 提交后发现 lint 错误、类型错误、测试失败
- 项目越来越乱 —— 每次重构都引入新的不一致,代码库像熵增一样混乱
这不是 AI 模型的问题,而是缺乏结构化的工作流程。
Matt Pocock 的 skills repo 正是解决这个问题。它的核心理念是:
Skills for Real Engineers — not vibe coding
翻译过来就是:给真正的工程师用的技能系统,不是”感觉来了就写代码”。
四大失败模式
Skills 系统针对 AI 编程助手的四大失败模式设计了对应的解决方案:
| 失败模式 | 症状 | Skills 解决方案 |
|---|---|---|
| Agent Misalignment | AI 写到一半偏离原目标 | grill-me → 澄清意图,确保理解一致 |
| Verbosity | 输出冗长、重复搜索 | caveman → 极简模式,压缩 75% token |
| Broken Code | 代码写完就报错 | tdd → 测试先行,验证再提交 |
| Entropy | 项目越来越混乱 | improve-codebase-architecture → 结构优化 |
22 个技能一览
目前 repo 包含 22 个技能,按功能分类:
🔧 核心工程技能(9 个)
| 技能 | 用途 | 核心价值 |
|---|---|---|
grill-with-docs |
验证计划时同步更新文档 | “single coolest technique” — 创建共享领域语言 |
diagnose |
6 阶段调试循环 | Phase 1 = 先建立反馈循环,再猜测 |
tdd |
测试驱动开发 | 垂直切片/tracer bullets,不是水平分层 |
improve-codebase-architecture |
代码库结构优化 | deep vs shallow 模块,deletion test |
triage |
Issue 工作流管理 | 状态机驱动,角色化处理 |
to-prd |
生成 PRD 文档 | 从对话上下文提取需求规格 |
to-issues |
PRD 转可执行 Issue | tracer-bullet 垂直切片分解 |
zoom-out |
拉远视角看大局 | 当你迷失在代码细节时 |
setup-matt-pocock-skills |
初始化技能配置 | 设置 AGENTS.md 和 issue tracker |
⚡ 生产力技能(3 个)
| 技能 | 用途 |
|---|---|
grill-me |
让 AI 反问澄清需求,最实用技能,甚至可用于非编程场景 |
caveman |
极简输出模式,token 消耗降低 75% |
write-a-skill |
创建新技能的标准模板 |
📚 其他(10 个)
包含 2 个个人技能、4 个杂项工具、4 个已废弃技能。
核心工程技能详解
🎯 grill-with-docs — Pocock 称之为”single coolest technique”
这个技能解决的问题是:AI 和你对项目的理解不一致。
当你提出一个实现方案,AI 会用项目现有的领域语言来”挑战”你的计划:
- 读取 CONTEXT.md — 获取项目已有的领域术语和概念
- 读取 docs/adr/ 目录 — 获取已做出的架构决策
- 挑战你的计划 — 用项目语言指出潜在冲突
- 同步更新文档 — 如果达成共识,立即更新 CONTEXT.md 和 ADR
效果:每次讨论后,项目的”共享知识库”都在增长。下次 AI 和你都站在同一理解基础上。
1 | # CONTEXT.md 示例结构 |
🔍 diagnose — 6 阶段调试循环
传统调试:看到错误 → 猜测原因 → 改代码 → 如果还错就继续猜。
diagnose 的调试流程:
1 | Reproduce → Minimise → Hypothesise → Instrument → Fix → Regression-test |
关键:Phase 1 = 建立反馈循环。
不是先猜测,而是先建立一个能稳定重现错误的测试环境。只有当你能”看到”错误的发生过程,才有资格开始猜测。
🧪 tdd — 垂直切片,不是水平分层
传统 TDD:先写所有单元测试 → 再写所有集成测试 → 最后写 E2E 测试。
Matt 的 TDD:
1 | 功能需求 |
tracer bullet 的比喻:像子弹穿透整个系统,一次验证全栈。不是先验证每一层是否独立工作,而是验证整个路径能否端到端工作。
🏗️ improve-codebase-architecture — deep vs shallow 模块
判断代码质量的一个简单测试:deletion test。
如果一个模块删除起来很痛苦(要改很多地方),说明它是 deep module —— 接口简单,内部复杂,这是好的设计。
如果一个模块删除很轻松(只影响少数地方),说明它是 shallow module —— 接口复杂,内部简单,这通常意味着抽象层太多。
1 | Deep Module(好): |
推荐工作流程
根据 Vibe Sparking 的分析,这套技能有推荐的使用顺序:
1 | 1. grill-me ← 澄清需求,让 AI 反问你 |
不是所有技能都要用。 Matt 建议:根据你的痛点选 2-3 个开始。
| 你的痛点 | 推荐起点 |
|---|---|
| AI 经常跑偏 | grill-me + grill-with-docs |
| 代码总报错 | tdd + diagnose |
| 项目越来越乱 | improve-codebase-architecture + zoom-out |
生态与传播
🔥 病毒式传播
grill-me 技能在 LinkedIn 上爆发:
- David Sancho 引用转发:158K views
- Matt 本人:”grill-me went viral… most useful skill I’ve written, use it even outside coding”
- GitHub stars:3 个月内从 9K → 37.4K(增长 4x)
📦 生态系统
| 工具/平台 | 数据 |
|---|---|
skills.sh CLI |
43.7K weekly installs |
| explainx.ai marketplace | 4.6★, 28 reviews |
| AgentRank | #392 / 7396 |
| Oathe.ai 安全审计 | 92/100 SAFE |
🌐 第三方覆盖
- PyShine:23 分钟教程视频
- Resolve:TDD 深度解析
- Towards AI:”Skills are programs not instructions”
- Pere Villega:”Claude Code is an agent platform”
- AI Engineer YouTube:完整流程演示(Idea → PRD → Issues → Kanban → Ralph Loop → Manual QA)
📚 相关课程
Matt 推出了付费课程 **”Claude Code for Real Engineers”**(2026 cohort,aihero.dev),这套技能是课程的核心内容。
争议与评价
Hacker News 上的争议
批评声音:有人称之为 “snake oil”(蛇油,指过度营销但无实效的产品)
辩护观点: specificity matters。这不是泛泛的”AI 能帮你”,而是具体的操作流程:
- 不是”AI 会帮你写更好的代码”
- 而是”AI 在 Phase 1 先建立反馈循环,Phase 2 提出最小化假设…”
- 不是”AI 会问你问题”
- 而是”AI 按状态机顺序问你 5 个特定问题…”
社区认可
- 多个 fork 和适配版本
- 被 sanity-io/sanity、pingcap/ossinsight、literat/awesome-agents 等项目引用
- GitHub 排名:长期占据 AI tools 搜索前列
如何开始
安装
1 | # 使用官方 CLI |
推荐起点
不要一次安装全部 22 个技能。 建议:
- 根据痛点选 2-3 个
- 先用熟练(用 3-5 次再加新技能)
- 结合实际项目(不要用 toy project 测试)
学习资源
- GitHub Repo
- 官方课程(付费)
- PyShine YouTube 教程(免费)
- AI Engineer YouTube 完整演示(免费)
延伸阅读
- Superpowers 入门指南 — 类似的 AI 开发技能系统
- Karpathy Guidelines — Andrej Karpathy 的 LLM 编程建议
- Claude Code 官方文档 — Anthropic 官方指南
一句话总结:这套技能不是让 AI 更聪明,而是给 AI 一本操作手册。就像给一个聪明但没纪律的工程师明确的流程规范。
Comments