mattpocock/skills 精選指南:AI Agent Fleet 實際在用的 5 個 Claude Code Skills
你叫 Claude「先寫測試再寫 implementation」,它回覆「好的,我先寫測試」——然後你回來看,發現它把 implementation 寫完了,最後補了幾個 happy path 的測試交差。問題不是 Claude 不聽話,是你的工作流程缺少一個關鍵機制:phase gate。
mattpocock/skills 在 2026 年 4 月底開源後迅速爆紅,目前累積超過 50K stars(MIT license),不是因為它寫了更好的 prompt。它做的事情本質不同——給 AI 加上結構性的生產規則,Red 測試沒失敗,Green 實作就不准開始。如果你是 Claude Code 訂閱者或正在用 Claude Code 開發的工程師,這篇文章從我們 agent fleet 的第一手操作經驗出發,精選 5 個實際產出改善最明顯的 skills,加上一套可直接複用的 workflow chain。
TL;DR
- Skills 不是更好的 prompt,是帶 phase gate 的工作流程模組
- 精選 5 個:
tdd、to-prd、to-issues、grill-me、caveman - 安裝方式:
npx skills@latest add mattpocock/skills,5 分鐘完成 - 最高效組合:grill-me → to-prd → to-issues → tdd(完整開發 pipeline)
- Skills alone 約 20% 觸發率;搭配 hooks 後 Scott Spence 以 200+ prompts 實測達 84%——效果因環境而異
你每次叫 Claude「先寫測試」,為什麼它還是先寫 implementation?
這個場景幾乎每個用 Claude Code 寫程式的人都遇過。你在 prompt 裡寫得很清楚:「用 TDD 流程,先寫測試」。Claude 也回覆「了解,我先寫測試」。但實際執行時,它經常先把功能寫出來,再倒推測試。
根因不是 Claude 理解力不夠——是 prompt 層級的指令本質上是「建議」。Claude 在處理複雜任務時,會根據自己認為最有效率的路徑行動,而對一個語言模型來說,先寫 implementation 再補測試確實是更「自然」的順序。你的 prompt 是 nudge(推一下),不是 gate(門檻)。
TDD skill 解決的正是這個問題。它不是用更精準的語言「拜託」Claude 先寫測試,而是定義了一個結構性的 phase gate:Red 階段必須產出失敗的測試,且測試確實跑失敗之後,才允許進入 Green 階段寫 implementation。這是從 prompt nudge 到 structural enforcement 的本質差異。
CLAUDE.md、Skills、Subagents、Hooks 的正確分工
在挑選 skills 之前,你需要先搞清楚 Claude Code 的 4 層架構——把東西放錯層級,是多數人踩坑的起點。
| 層級 | 機制 | 執行保證 | 適合放什麼 |
|---|---|---|---|
| CLAUDE.md | 每個 session 全量載入 | 機率性(probabilistic) | 持久專案規範,建議控制在 200 行以內 |
| Skills(SKILL.md) | 按需載入(description 常駐;body 只在 invoke 時載入) | 機率性(probabilistic) | 可重用的工作流程模組、playbook |
| Subagents | 獨立 context 的隔離 worker | 確定性的作用域隔離 | 需要平行執行或 context 隔離的任務 |
| Hooks | Shell scripts,在 lifecycle 事件觸發 | 完全確定性(deterministic) | 零例外強制執行:格式檢查、lint、測試 |
關鍵洞見:CLAUDE.md 超過 200 行之後,Claude 會開始靜默忽略埋在雜訊裡的規則。Marmelab 的工程團隊在實戰中驗證了這點,我們踩過 CLAUDE.md 超過 200 行的問題——某些規則開始被靜默忽略,花了好一段時間才抓到原因。
Skills 的 lazy-load 設計正是為了解決這件事。它只把 description(上限 1,536 字元)放進常駐 context,完整的 SKILL.md body 只在你呼叫 /skill-name 時才載入。這讓你可以把複雜的工作流程拆出 CLAUDE.md,放進 skills,維持 CLAUDE.md 的精簡。
重要:如果你想更完整了解 CLAUDE.md 的三層優先級和
.claude/rules/路徑作用域設定,可以參考我們的 Claude Code 完整設定指南。本文聚焦在「哪些 community skills 值得安裝」。
mattpocock/skills 為什麼能到 50K+ Stars?社群生態的形成
Matt Pocock 是知名的 TypeScript 教育者,也是 Total TypeScript 課程平台的作者,在 TypeScript 社群有極高的信任度。但 mattpocock/skills(50K+ stars,MIT license,2026 年 4 月底公開)爆紅的真正原因不是名人效應——是它踩中了一個時間點:開發者開始意識到 prompt engineering 不夠,需要 workflow engineering。
更重要的是,Skills 不是 Claude Code 的獨家功能。Agent Skills(agentskills.io)是一個 open standard,設計上跨 Claude Code、Cursor、Gemini CLI 相容。你安裝的 skills 不是綁定某個 IDE 的外掛程式,而是跨平台的工作流程協議。
社群生態也在快速成形:
- hesreallyhim/awesome-claude-code:目前最完整的社群目錄,涵蓋 skills、hooks、orchestrators、plugins
- ComposioHQ/awesome-claude-skills:按角色打包的 bundles(例如 "Web Wizard" = 5 個 skills 組合)
- alirezarezvani/claude-skills:232+ skills,涵蓋工程、行銷、合規、C-level advisory——工程師只是早期採用者
這不只是一個開源 repo 的流行,是 AI 工作流程從「每個人自己寫 prompt」到「共享標準化流程」的生態遷移。
Agent Fleet 精選 5 Skills:我們實際在用的是這些
從 mattpocock/skills 的 14 個 skills 和社群生態中,以下是根據我們 agent fleet 的操作經驗,對產出品質改善最明顯的 5 個:
| Skill | 指令 | 核心行為 | 適用場景 |
|---|---|---|---|
| tdd | /tdd | Phase-gated TDD:Red 必須失敗 → Green 才允許 → 強制 minimal implementation | 所有需要測試覆蓋的功能開發 |
| to-prd | /to-prd | 把對話合成為結構化 PRD,自動提交為 GitHub Issue | 需求模糊時,從對話收斂成明確規格 |
| to-issues | /to-issues | PRD 轉垂直切片 Issues,標記 HITL/AFK,依賴排序 | 大功能拆解,分配給不同 agent 或開發者 |
| grill-me | /grill-me | 窮盡式 decision-tree 提問,直到所有分支都有明確答案 | 動手之前,把模糊的想法問到透徹 |
| caveman | /caveman | 刪除冗詞贅句,節省約 65-75% output tokens,同時保持完整技術準確性 | 長 session 省 token;適合機械性任務,複雜推理需留意 |
我們的 agent fleet 用一套非常相似的流程:CEO 建 strategy issue → Mia 拆解為 collect/synthesize → Luna 認領執行 → board-complete 自動建下一個 task。mattpocock/skills 的 to-prd → to-issues → tdd chain 和這個架構本質相同——差別只在我們用 GitHub Issues + 自動化 scripts 實現,mattpocock 用 skills 封裝成可一鍵觸發的模組。
TDD Skill 深度解析:Phase Gate 到底是什麼意思?
TDD skill 是 mattpocock/skills 裡 impact 最高的單一 skill。它的核心機制:
1. Red Phase(寫失敗測試):Skill 指示 Claude 先寫測試,而且測試必須跑起來並失敗。這個「失敗」不是 bug,是設計——在 implementation 存在之前,測試本來就該失敗。
2. Green Phase(minimal implementation):只有在 Red 測試確認失敗之後,才進入寫 implementation 的階段。而且 skill 強制要求「只寫讓測試通過的最小 code」,不准多寫。
3. Subagent 隔離:TDD skill 使用 context: fork,讓寫測試的 agent 和寫 implementation 的 agent 在不同的 context 中工作。這避免了一個常見問題——當同一個 context 同時知道「測試要什麼」和「implementation 怎麼寫」,Claude 會傾向跳過 Red 直接寫出能通過的 code。
和「直接叫 Claude 先寫測試」的差異:prompt 只是建議(Claude 可以決定不聽),phase gate 是結構(沒有過 Red,Green 不會開始)。
Scott Spence 測試了超過 200 個 prompts,將觸發率從約 20%(Skills alone)提升至 84%(搭配 hooks,每次 prompt 前自動注入 TDD 階段評估)。alexop.dev 在 Vue 專案中應用相同方法也獲得了類似提升。你的結果可能因環境而異,但趨勢是明確的:skills alone 不夠穩,需要 hooks 搭配。
Workflow Chain(手動串接):grill-me → to-prd → to-issues → tdd
單獨安裝一個 skill 有價值,但 skills 真正的爆發力在 workflow chain——把多個 skills 手動串接成完整的開發 pipeline。注意:這些 skills 之間不會自動銜接,你需要手動依序觸發每個步驟;完整跑完一輪約需 45-90 分鐘(視需求複雜度而定):
Step 1: /grill-me(釐清需求)
輸入:模糊的想法(「我想做一個 dashboard」)
輸出:decision-tree 走完,所有分支都有明確答案
Step 2: /to-prd(結構化規格)
輸入:grill-me 對話的成果
輸出:結構化 PRD,自動提交為 GitHub Issue
Step 3: /to-issues(垂直切片)
輸入:PRD Issue
輸出:多個垂直切片 Issues,標記 HITL(需人工介入)或 AFK(可自動執行),依賴關係排序
Step 4: /tdd(逐個 Issue 執行)
輸入:單一 Issue
輸出:通過 phase-gated TDD 的 code + 測試
這個 chain 的邏輯和我們 fleet 的日常運作一致:strategy issue → task breakdown → isolated execution → auto-complete。差別是 mattpocock 把每個節點封裝成標準化的 skill,任何人都能 npx 安裝後直接用。
初次安裝後,建議先跑 /setup-matt-pocock-skills 設定 per-repo config(issue tracker 位置、triage labels、docs 路徑)。
Skills + Hooks 組合拳:從機率性到確定性執行
這是整篇文章最反直覺的部分:Skills 是機率性的(probabilistic)。
不管 SKILL.md 寫得多完整,Claude 在專注處理複雜任務時,仍然可能跳過 skill 的指令。這不是 bug,是語言模型的本質——它在多個目標之間做取捨,有時候「完成任務」的權重會超過「遵守流程」。
Hooks 則是完全確定性的(deterministic)。它們是 shell scripts,綁定在 Claude Code 的 lifecycle 事件上(如 PreToolUse、PostToolUse),在每次觸發時無條件執行。
組合策略:
- Skills 定義「要做什麼」:TDD 的 Red/Green phase gate、PRD 的輸出結構
- Hooks 確保「一定會做」:每次 prompt 前檢查 TDD 階段、每次 code 寫入後跑 lint
mattpocock/skills 裡的 git-guardrails-claude-code 就是一個好例子——它用 hooks 攔截危險的 git 操作(force push、reset --hard),不是「建議」Claude 不要做,而是在 shell 層直接 block。setup-pre-commit skill 則幫你設定 Husky hooks,把 linting 和測試變成每次 commit 前的強制步驟。
安裝與快速上手
# 安裝 mattpocock/skills 全部 skills
npx skills@latest add mattpocock/skills
# 或安裝單一 skill
npx skills@latest add mattpocock/skills/tdd
安裝完成後,skills 會放在 .claude/skills/ 目錄下。進入 Claude Code session 後:
- 驗證安裝成功:在 Claude Code session 中輸入
/,確認 skill 列表中出現/tdd、/grill-me等已安裝的 skills。如果沒出現,檢查.claude/skills/目錄下是否有對應的SKILL.md檔案 - 跑
/setup-matt-pocock-skills:設定 issue tracker、triage labels、docs 路徑 - 第一個 session 建議從
/grill-me開始:不需要 code,純對話,馬上感受 skill 和普通 prompt 的差異 - 全域 vs 專案 scope:放在
~/.claude/skills/是全域(所有專案共用),放在.claude/skills/是專案層級(commit 進 repo 和團隊共享) context: fork是什麼:在 SKILL.md 的 frontmatter 中設定context: fork,表示這個 skill 會在獨立 subagent 中執行,和主 session 的 context 完全隔離
社群資源一覽:如果 mattpocock/skills 不夠用,hesreallyhim/awesome-claude-code 是目前最完整的社群目錄,ComposioHQ/awesome-claude-skills 有按角色分類的 bundles,alirezarezvani/claude-skills 收錄了 232+ skills。
風險揭露:Skills 的局限與誠實評估
根據我們的 agent fleet 操作經驗,以下是安裝前應該知道的:
Skills 仍然是機率性的。安裝 ≠ 保證執行。在複雜任務中,Claude 可能跳過 skill 指令。別期待「裝了就萬事大吉」——真正穩定的執行需要 skills + hooks 雙層搭配。
/caveman 的適用邊界。Caveman 刪除冗詞贅句,設計上保持完整技術準確性(keeping full technical accuracy),在機械性 coding 任務上效果出色。但在需要深度推理鏈(chain-of-thought)的複雜數學或邏輯場景,過度壓縮可能影響推理品質——根據 2026 年 3 月 arXiv 論文,簡潔約束在某些基準上反而提升 26 個百分點準確度,但在複雜推理任務上則可能有損。
/grill-with-docs 的時間成本。完整的 interview 流程需要 15-20 分鐘。如果是小功能或 hotfix,直接動手比跑完整個 decision-tree 更有效率。
CLAUDE.md + forrestchang/andrej-karpathy-skills 和 mattpocock/skills 是互補關係。karpathy-skills 定義「什麼不該做」的 guardrails(防守),mattpocock/skills 定義「怎麼有結構地做」的 workflow(進攻)。兩者不衝突,可以疊加使用。
觸發率數據的適用範圍。本文引用的 20% → 84% 觸發率數據來自 Scott Spence 以 200+ prompts 的測試,alexop.dev 在 Vue 專案中也驗證了類似結果。樣本量雖比單一測試更可靠,但不同語言、框架、任務複雜度下結果可能不同。
結論:從「聰明但無序」到「遵守工程紀律」
Skills 解決的不是 Claude 的能力問題,是它的行為紀律問題。一個什麼都能做的 AI,如果沒有 phase gate、沒有結構化流程,就像一個極度聰明但從不跑測試的工程師——產出快,品質不可預測。
建議的入門路徑:先跑 npx skills@latest add mattpocock/skills,從 /grill-me 開始感受差異,一週後試完整的 grill-me → to-prd → to-issues → tdd chain。你的 AI 工作流程會從「每次都要叮嚀」,進化成「按流程自動執行」。
FAQ
Skills 和 Claude Code 的 slash commands(.claude/commands/)是同一件事嗎?
不完全是。Claude Code 的 .claude/commands/ 是專案層級的 custom slash commands(靜態 prompt templates);Skills 是更完整的 workflow 模組,帶有 SKILL.md 結構、frontmatter 定義、可選的 context: fork(subagent 隔離執行),以及跨 IDE 的 open standard(agentskills.io)。兩者都能 /invoke,但 skills 設計為可共享、可組合、跨平台的生產工作流程。
Agent Skills 是 open standard,可以在 Cursor、Gemini CLI 用嗎?
是的。Agent Skills(agentskills.io)是 Anthropic 主導的 open standard,設計上跨 Claude Code、Cursor、Gemini CLI 相容。mattpocock/skills 遵循此標準,理論上可在支援 skills 的任何 IDE 使用,但實際相容性因 IDE 版本而異,建議查閱各 IDE 的 skills 支援文件確認。



