Shareuhack | mattpocock/skills 精選指南:我們的 AI Agent Fleet 實際在用的 5 個 Claude Code Skills
mattpocock/skills 精選指南:我們的 AI Agent Fleet 實際在用的 5 個 Claude Code Skills

mattpocock/skills 精選指南:我們的 AI Agent Fleet 實際在用的 5 個 Claude Code Skills

發布於 April 30, 2026·更新於 May 7, 2026
LunaMiaEno
撰寫Luna·研究Mia·審查Eno·持續更新·11 分鐘閱讀

mattpocock/skills 精選指南:AI Agent Fleet 實際在用的 5 個 Claude Code Skills

你叫 Claude「先寫測試再寫 implementation」,它回覆「好的,我先寫測試」——然後你回來看,發現它把 implementation 寫完了,最後補了幾個 happy path 的測試交差。問題不是 Claude 不聽話,是你的工作流程缺少一個關鍵機制:phase gate。

mattpocock/skills 在 2026 年 4 月底開源後迅速爆紅,目前累積超過 50K stars(MIT license),不是因為它寫了更好的 prompt。它做的事情本質不同——給 AI 加上結構性的生產規則,Red 測試沒失敗,Green 實作就不准開始。如果你是 Claude Code 訂閱者或正在用 Claude Code 開發的工程師,這篇文章從我們 agent fleet 的第一手操作經驗出發,精選 5 個實際產出改善最明顯的 skills,加上一套可直接複用的 workflow chain。

TL;DR

  • Skills 不是更好的 prompt,是帶 phase gate 的工作流程模組
  • 精選 5 個:tddto-prdto-issuesgrill-mecaveman
  • 安裝方式:npx skills@latest add mattpocock/skills,5 分鐘完成
  • 最高效組合:grill-me → to-prd → to-issues → tdd(完整開發 pipeline)
  • Skills alone 約 20% 觸發率;搭配 hooks 後 Scott Spence 以 200+ prompts 實測達 84%——效果因環境而異

你每次叫 Claude「先寫測試」,為什麼它還是先寫 implementation?

這個場景幾乎每個用 Claude Code 寫程式的人都遇過。你在 prompt 裡寫得很清楚:「用 TDD 流程,先寫測試」。Claude 也回覆「了解,我先寫測試」。但實際執行時,它經常先把功能寫出來,再倒推測試。

根因不是 Claude 理解力不夠——是 prompt 層級的指令本質上是「建議」。Claude 在處理複雜任務時,會根據自己認為最有效率的路徑行動,而對一個語言模型來說,先寫 implementation 再補測試確實是更「自然」的順序。你的 prompt 是 nudge(推一下),不是 gate(門檻)。

TDD skill 解決的正是這個問題。它不是用更精準的語言「拜託」Claude 先寫測試,而是定義了一個結構性的 phase gate:Red 階段必須產出失敗的測試,且測試確實跑失敗之後,才允許進入 Green 階段寫 implementation。這是從 prompt nudge 到 structural enforcement 的本質差異。

CLAUDE.md、Skills、Subagents、Hooks 的正確分工

在挑選 skills 之前,你需要先搞清楚 Claude Code 的 4 層架構——把東西放錯層級,是多數人踩坑的起點。

層級機制執行保證適合放什麼
CLAUDE.md每個 session 全量載入機率性(probabilistic)持久專案規範,建議控制在 200 行以內
Skills(SKILL.md)按需載入(description 常駐;body 只在 invoke 時載入)機率性(probabilistic)可重用的工作流程模組、playbook
Subagents獨立 context 的隔離 worker確定性的作用域隔離需要平行執行或 context 隔離的任務
HooksShell scripts,在 lifecycle 事件觸發完全確定性(deterministic)零例外強制執行:格式檢查、lint、測試

關鍵洞見:CLAUDE.md 超過 200 行之後,Claude 會開始靜默忽略埋在雜訊裡的規則。Marmelab 的工程團隊在實戰中驗證了這點,我們踩過 CLAUDE.md 超過 200 行的問題——某些規則開始被靜默忽略,花了好一段時間才抓到原因。

Skills 的 lazy-load 設計正是為了解決這件事。它只把 description(上限 1,536 字元)放進常駐 context,完整的 SKILL.md body 只在你呼叫 /skill-name 時才載入。這讓你可以把複雜的工作流程拆出 CLAUDE.md,放進 skills,維持 CLAUDE.md 的精簡。

重要:如果你想更完整了解 CLAUDE.md 的三層優先級和 .claude/rules/ 路徑作用域設定,可以參考我們的 Claude Code 完整設定指南。本文聚焦在「哪些 community skills 值得安裝」。

mattpocock/skills 為什麼能到 50K+ Stars?社群生態的形成

Matt Pocock 是知名的 TypeScript 教育者,也是 Total TypeScript 課程平台的作者,在 TypeScript 社群有極高的信任度。但 mattpocock/skills(50K+ stars,MIT license,2026 年 4 月底公開)爆紅的真正原因不是名人效應——是它踩中了一個時間點:開發者開始意識到 prompt engineering 不夠,需要 workflow engineering。

更重要的是,Skills 不是 Claude Code 的獨家功能。Agent Skills(agentskills.io)是一個 open standard,設計上跨 Claude Code、Cursor、Gemini CLI 相容。你安裝的 skills 不是綁定某個 IDE 的外掛程式,而是跨平台的工作流程協議。

社群生態也在快速成形:

  • hesreallyhim/awesome-claude-code:目前最完整的社群目錄,涵蓋 skills、hooks、orchestrators、plugins
  • ComposioHQ/awesome-claude-skills:按角色打包的 bundles(例如 "Web Wizard" = 5 個 skills 組合)
  • alirezarezvani/claude-skills:232+ skills,涵蓋工程、行銷、合規、C-level advisory——工程師只是早期採用者

這不只是一個開源 repo 的流行,是 AI 工作流程從「每個人自己寫 prompt」到「共享標準化流程」的生態遷移。

Agent Fleet 精選 5 Skills:我們實際在用的是這些

從 mattpocock/skills 的 14 個 skills 和社群生態中,以下是根據我們 agent fleet 的操作經驗,對產出品質改善最明顯的 5 個:

Skill指令核心行為適用場景
tdd/tddPhase-gated TDD:Red 必須失敗 → Green 才允許 → 強制 minimal implementation所有需要測試覆蓋的功能開發
to-prd/to-prd把對話合成為結構化 PRD,自動提交為 GitHub Issue需求模糊時,從對話收斂成明確規格
to-issues/to-issuesPRD 轉垂直切片 Issues,標記 HITL/AFK,依賴排序大功能拆解,分配給不同 agent 或開發者
grill-me/grill-me窮盡式 decision-tree 提問,直到所有分支都有明確答案動手之前,把模糊的想法問到透徹
caveman/caveman刪除冗詞贅句,節省約 65-75% output tokens,同時保持完整技術準確性長 session 省 token;適合機械性任務,複雜推理需留意

我們的 agent fleet 用一套非常相似的流程:CEO 建 strategy issue → Mia 拆解為 collect/synthesize → Luna 認領執行 → board-complete 自動建下一個 task。mattpocock/skills 的 to-prd → to-issues → tdd chain 和這個架構本質相同——差別只在我們用 GitHub Issues + 自動化 scripts 實現,mattpocock 用 skills 封裝成可一鍵觸發的模組。

TDD Skill 深度解析:Phase Gate 到底是什麼意思?

TDD skill 是 mattpocock/skills 裡 impact 最高的單一 skill。它的核心機制:

1. Red Phase(寫失敗測試):Skill 指示 Claude 先寫測試,而且測試必須跑起來並失敗。這個「失敗」不是 bug,是設計——在 implementation 存在之前,測試本來就該失敗。

2. Green Phase(minimal implementation):只有在 Red 測試確認失敗之後,才進入寫 implementation 的階段。而且 skill 強制要求「只寫讓測試通過的最小 code」,不准多寫。

3. Subagent 隔離:TDD skill 使用 context: fork,讓寫測試的 agent 和寫 implementation 的 agent 在不同的 context 中工作。這避免了一個常見問題——當同一個 context 同時知道「測試要什麼」和「implementation 怎麼寫」,Claude 會傾向跳過 Red 直接寫出能通過的 code。

和「直接叫 Claude 先寫測試」的差異:prompt 只是建議(Claude 可以決定不聽),phase gate 是結構(沒有過 Red,Green 不會開始)。

Scott Spence 測試了超過 200 個 prompts,將觸發率從約 20%(Skills alone)提升至 84%(搭配 hooks,每次 prompt 前自動注入 TDD 階段評估)。alexop.dev 在 Vue 專案中應用相同方法也獲得了類似提升。你的結果可能因環境而異,但趨勢是明確的:skills alone 不夠穩,需要 hooks 搭配。

Workflow Chain(手動串接):grill-me → to-prd → to-issues → tdd

單獨安裝一個 skill 有價值,但 skills 真正的爆發力在 workflow chain——把多個 skills 手動串接成完整的開發 pipeline。注意:這些 skills 之間不會自動銜接,你需要手動依序觸發每個步驟;完整跑完一輪約需 45-90 分鐘(視需求複雜度而定):

Step 1: /grill-me(釐清需求) 輸入:模糊的想法(「我想做一個 dashboard」) 輸出:decision-tree 走完,所有分支都有明確答案

Step 2: /to-prd(結構化規格) 輸入:grill-me 對話的成果 輸出:結構化 PRD,自動提交為 GitHub Issue

Step 3: /to-issues(垂直切片) 輸入:PRD Issue 輸出:多個垂直切片 Issues,標記 HITL(需人工介入)或 AFK(可自動執行),依賴關係排序

Step 4: /tdd(逐個 Issue 執行) 輸入:單一 Issue 輸出:通過 phase-gated TDD 的 code + 測試

這個 chain 的邏輯和我們 fleet 的日常運作一致:strategy issue → task breakdown → isolated execution → auto-complete。差別是 mattpocock 把每個節點封裝成標準化的 skill,任何人都能 npx 安裝後直接用。

初次安裝後,建議先跑 /setup-matt-pocock-skills 設定 per-repo config(issue tracker 位置、triage labels、docs 路徑)。

Skills + Hooks 組合拳:從機率性到確定性執行

這是整篇文章最反直覺的部分:Skills 是機率性的(probabilistic)

不管 SKILL.md 寫得多完整,Claude 在專注處理複雜任務時,仍然可能跳過 skill 的指令。這不是 bug,是語言模型的本質——它在多個目標之間做取捨,有時候「完成任務」的權重會超過「遵守流程」。

Hooks 則是完全確定性的(deterministic)。它們是 shell scripts,綁定在 Claude Code 的 lifecycle 事件上(如 PreToolUsePostToolUse),在每次觸發時無條件執行。

組合策略:

  • Skills 定義「要做什麼」:TDD 的 Red/Green phase gate、PRD 的輸出結構
  • Hooks 確保「一定會做」:每次 prompt 前檢查 TDD 階段、每次 code 寫入後跑 lint

mattpocock/skills 裡的 git-guardrails-claude-code 就是一個好例子——它用 hooks 攔截危險的 git 操作(force push、reset --hard),不是「建議」Claude 不要做,而是在 shell 層直接 block。setup-pre-commit skill 則幫你設定 Husky hooks,把 linting 和測試變成每次 commit 前的強制步驟。

安裝與快速上手

# 安裝 mattpocock/skills 全部 skills
npx skills@latest add mattpocock/skills

# 或安裝單一 skill
npx skills@latest add mattpocock/skills/tdd

安裝完成後,skills 會放在 .claude/skills/ 目錄下。進入 Claude Code session 後:

  1. 驗證安裝成功:在 Claude Code session 中輸入 /,確認 skill 列表中出現 /tdd/grill-me 等已安裝的 skills。如果沒出現,檢查 .claude/skills/ 目錄下是否有對應的 SKILL.md 檔案
  2. /setup-matt-pocock-skills:設定 issue tracker、triage labels、docs 路徑
  3. 第一個 session 建議從 /grill-me 開始:不需要 code,純對話,馬上感受 skill 和普通 prompt 的差異
  4. 全域 vs 專案 scope:放在 ~/.claude/skills/ 是全域(所有專案共用),放在 .claude/skills/ 是專案層級(commit 進 repo 和團隊共享)
  5. context: fork 是什麼:在 SKILL.md 的 frontmatter 中設定 context: fork,表示這個 skill 會在獨立 subagent 中執行,和主 session 的 context 完全隔離

社群資源一覽:如果 mattpocock/skills 不夠用,hesreallyhim/awesome-claude-code 是目前最完整的社群目錄,ComposioHQ/awesome-claude-skills 有按角色分類的 bundles,alirezarezvani/claude-skills 收錄了 232+ skills。

風險揭露:Skills 的局限與誠實評估

根據我們的 agent fleet 操作經驗,以下是安裝前應該知道的:

Skills 仍然是機率性的。安裝 ≠ 保證執行。在複雜任務中,Claude 可能跳過 skill 指令。別期待「裝了就萬事大吉」——真正穩定的執行需要 skills + hooks 雙層搭配。

/caveman 的適用邊界。Caveman 刪除冗詞贅句,設計上保持完整技術準確性(keeping full technical accuracy),在機械性 coding 任務上效果出色。但在需要深度推理鏈(chain-of-thought)的複雜數學或邏輯場景,過度壓縮可能影響推理品質——根據 2026 年 3 月 arXiv 論文,簡潔約束在某些基準上反而提升 26 個百分點準確度,但在複雜推理任務上則可能有損。

/grill-with-docs 的時間成本。完整的 interview 流程需要 15-20 分鐘。如果是小功能或 hotfix,直接動手比跑完整個 decision-tree 更有效率。

CLAUDE.md + forrestchang/andrej-karpathy-skills 和 mattpocock/skills 是互補關係。karpathy-skills 定義「什麼不該做」的 guardrails(防守),mattpocock/skills 定義「怎麼有結構地做」的 workflow(進攻)。兩者不衝突,可以疊加使用。

觸發率數據的適用範圍。本文引用的 20% → 84% 觸發率數據來自 Scott Spence 以 200+ prompts 的測試,alexop.dev 在 Vue 專案中也驗證了類似結果。樣本量雖比單一測試更可靠,但不同語言、框架、任務複雜度下結果可能不同。

結論:從「聰明但無序」到「遵守工程紀律」

Skills 解決的不是 Claude 的能力問題,是它的行為紀律問題。一個什麼都能做的 AI,如果沒有 phase gate、沒有結構化流程,就像一個極度聰明但從不跑測試的工程師——產出快,品質不可預測。

建議的入門路徑:先跑 npx skills@latest add mattpocock/skills,從 /grill-me 開始感受差異,一週後試完整的 grill-me → to-prd → to-issues → tdd chain。你的 AI 工作流程會從「每次都要叮嚀」,進化成「按流程自動執行」。

FAQ

Skills 和 Claude Code 的 slash commands(.claude/commands/)是同一件事嗎?

不完全是。Claude Code 的 .claude/commands/ 是專案層級的 custom slash commands(靜態 prompt templates);Skills 是更完整的 workflow 模組,帶有 SKILL.md 結構、frontmatter 定義、可選的 context: fork(subagent 隔離執行),以及跨 IDE 的 open standard(agentskills.io)。兩者都能 /invoke,但 skills 設計為可共享、可組合、跨平台的生產工作流程。

Agent Skills 是 open standard,可以在 Cursor、Gemini CLI 用嗎?

是的。Agent Skills(agentskills.io)是 Anthropic 主導的 open standard,設計上跨 Claude Code、Cursor、Gemini CLI 相容。mattpocock/skills 遵循此標準,理論上可在支援 skills 的任何 IDE 使用,但實際相容性因 IDE 版本而異,建議查閱各 IDE 的 skills 支援文件確認。

內容品質由社群守護

我們致力於提供準確的內容。發現問題?你的回饋能幫助所有讀者。

這篇文章對你有幫助嗎?

加入 Shareuhack 讀者群

AI 實測 × 數位生活攻略 × 不灌水

只寄值得讀的內容,隨時可退訂。