mattpocock/skills 厳選ガイド:AI Agent Fleet で実際に使っている Claude Code Skills 5選
Claude に「先にテストを書いて、それから実装して」と指示する。Claude は「わかりました、先にテストを書きます」と答える。戻ってみると、実装が完成していて、最後にいくつかの happy path テストが追加されているだけ。問題は Claude の理解力ではない。ワークフローに phase gate がないことだ。
mattpocock/skills は 2026 年 4 月末のオープンソース公開後に爆発的に広まり、現在 50K+ stars(MIT license)を超えている。より良いプロンプトだからではなく、本質的に異なることをしているからだ。AI に構造的なプロダクションルールを与える。Red テストが失敗していなければ、Green の実装は開始できない。Claude Code サブスクライバーまたは Claude Code で開発中のエンジニアなら、この記事は私たちの agent fleet での第一手運用経験から、最も改善効果の高かった 5 つの skills と、そのまま再利用できる workflow chain を共有する。
TL;DR
- Skills はより良いプロンプトではなく、phase gate 付きのワークフローモジュール
- 厳選 5 つ:
tdd、to-prd、to-issues、grill-me、caveman - インストール:
npx skills@latest add mattpocock/skills、5 分で完了 - 最強コンボ:grill-me → to-prd → to-issues → tdd(完全な開発パイプライン)
- Skills 単体では約 20% のトリガー率。hooks 併用で Scott Spence が 200+ プロンプトで 84% を計測。環境によって結果は異なる
なぜ Claude は「先にテストを書いて」を無視するのか
Claude Code で開発している人なら、ほぼ全員がこの場面に遭遇している。プロンプトに「TDD で、先にテストを書いて」と明記する。Claude も「了解、先にテストを書きます」と返答する。しかし実際には、先に機能を実装してからテストを後付けすることが多い。
根本原因は Claude の理解力不足ではない。プロンプトレベルの指示は本質的に「提案」だということだ。Claude は複雑なタスク処理時、最も効率的と判断したパスで行動する。言語モデルにとって、先に実装してからテストを導出する方が「自然な」順序だ。プロンプトは nudge(軽い促し)であって、gate(門)ではない。
TDD skill はまさにこの問題を解決する。Red フェーズで失敗するテストを生成し、テストが実際に失敗してから、初めて Green フェーズ(実装)の開始が許可される構造的 phase gate を定義する。prompt nudge から structural enforcement への本質的な転換だ。
Skills の位置づけ:4層アーキテクチャ
Skills を選ぶ前に、Claude Code の 4 層構造を理解する必要がある。間違った層に配置するのが、多くの人が躓く出発点だ。
| 層 | メカニズム | 実行保証 | 適する用途 |
|---|---|---|---|
| CLAUDE.md | セッション毎に全量ロード | 確率的(probabilistic) | 永続的プロジェクト規約、200 行以内推奨 |
| Skills(SKILL.md) | オンデマンドロード(description 常駐、body は invoke 時のみ) | 確率的(probabilistic) | 再利用可能なワークフローモジュール |
| Subagents | 独立コンテキストの分離ワーカー | 決定的スコープ分離 | 並列実行やコンテキスト分離が必要なタスク |
| Hooks | ライフサイクルイベントの Shell scripts | 完全に決定的(deterministic) | 例外なし強制:フォーマットチェック、lint、テスト |
重要な洞察:CLAUDE.md が約 200 行を超えると、Claude はノイズに埋もれたルールを静かに無視し始める。 Marmelab のエンジニアチームがプロダクションで検証し、私たちも同じ問題に遭遇した。特定のルールが静かにスキップされ始め、原因の特定に時間がかかった。
Skills の遅延ロード設計はこれを解決する。常駐コンテキストには description(最大 1,536 文字)のみ。完全な SKILL.md body は /skill-name を呼び出した時だけロードされる。複雑なワークフローを CLAUDE.md から skills に移動し、CLAUDE.md を簡潔に保てる。
CLAUDE.md の三層優先度システムや
.claude/rules/パススコーピングについて詳しく知りたい場合は、Claude Code 設定ガイドを参照。本記事は「どのコミュニティ skills をインストールする価値があるか」に焦点を当てる。
mattpocock/skills が 50K+ Stars に到達した理由
Matt Pocock は著名な TypeScript 教育者で Total TypeScript の作者。TS コミュニティで高い信頼度を持つ。しかし mattpocock/skills(50K+ stars、MIT license、2026 年 4 月末公開)が爆発的に広まった本当の理由は知名度ではなく、開発者がプロンプトエンジニアリングでは不十分と気づいた瞬間に登場したことだ。必要なのはワークフローエンジニアリングだった。
さらに重要なのは、Skills は Claude Code 専用ではないということ。Agent Skills(agentskills.io)は Claude Code、Cursor、Gemini CLI 間のクロス IDE 互換性を持つオープンスタンダードだ。インストールした skills は特定 IDE に縛られたプラグインではなく、クロスプラットフォームのワークフロープロトコルだ。
エコシステムも急速に形成されている:
- hesreallyhim/awesome-claude-code:skills、hooks、orchestrators、plugins を網羅する最も完全なコミュニティディレクトリ
- ComposioHQ/awesome-claude-skills:ロール別バンドル(例:"Web Wizard" = 5 skills のコンボ)
- alirezarezvani/claude-skills:232+ skills、エンジニアリング、マーケティング、コンプライアンス、C-level アドバイザリーまでカバー
これは 1 つの repo の流行ではない。AI ワークフローが「各自でプロンプトを書く」から「共有された標準化フローを使う」へのエコシステム移行だ。
Agent Fleet 厳選 5 Skills:実際に使っているもの
mattpocock/skills の 14 skills とより広いエコシステムから、私たちの agent fleet で品質改善が最も顕著だった 5 つ:
| Skill | コマンド | コア動作 | 適用場面 |
|---|---|---|---|
| tdd | /tdd | Phase-gated TDD:Red 失敗必須 → Green 許可 → minimal implementation 強制 | テストカバレッジが必要な全機能開発 |
| to-prd | /to-prd | 会話を構造化 PRD に合成、GitHub Issue として自動提出 | 曖昧な要求を明確な仕様に収束 |
| to-issues | /to-issues | PRD → 垂直スライス Issues、HITL/AFK マーク、依存関係ソート | 大機能の分解、各 agent や開発者へのアサイン |
| grill-me | /grill-me | 徹底的な decision-tree 質問、全分岐に明確な回答があるまで | コードを書く前に曖昧なアイデアを問い詰める |
| caveman | /caveman | 冗長な出力を削除、約 65-75% の output tokens 節約、完全な技術的正確性を維持 | 長いセッションでトークン節約。機械的タスクに最適、複雑な推論には注意 |
私たちの agent fleet はほぼ同一のフローで動いている:CEO が strategy issue 作成 → Mia が collect/synthesize に分解 → Luna が認領して実行 → board-complete が自動で次のタスク作成。mattpocock の to-prd → to-issues → tdd チェーンは本質的に同じアーキテクチャだ。違いは私たちが GitHub Issues + 自動化スクリプトで実装し、mattpocock がワンクリック skill モジュールとしてパッケージ化している点だけ。
TDD Skill 詳解:Phase Gate の意味
TDD skill は mattpocock/skills で最もインパクトの高い単一 skill だ。コアメカニズム:
1. Red Phase(失敗テストを書く):Skill が Claude に、実行して失敗するテストを書くよう指示する。この「失敗」はバグではなく設計通り。実装が存在しない段階では、テストは失敗すべきだ。
2. Green Phase(minimal implementation):Red テストが失敗を確認してから初めて、実装フェーズが開始される。Skill は「テストを通す最小限のコードだけを書く」を強制する。
3. Subagent 分離:TDD skill は context: fork を使用し、テスト記述 agent と実装 agent を別々のコンテキストで動かす。同一コンテキストが「テストの期待値」と「実装方法」の両方を知っていると、Claude は Red をスキップして直接通るコードを書く傾向がある。これを防ぐ。
「Claude にテストを先に書いてと言う」との違い:プロンプトは提案(Claude は無視できる)、phase gate は構造(Red を通過しなければ Green は開始しない)。
Scott Spence が 200+ プロンプトでテストし、トリガー率を約 20%(Skills 単体)から 84%(hooks 併用、各プロンプト前に TDD フェーズ評価を自動注入)まで引き上げた。alexop.dev も Vue プロジェクトで同様の結果を検証。言語、フレームワーク、タスク複雑度によって結果は異なるが、トレンドは明確だ:skills 単体では不安定、hooks の併用が必要。
Workflow Chain(手動連携):grill-me → to-prd → to-issues → tdd
単一 skill にも価値はあるが、skills の真の爆発力は workflow chain にある。複数の skills を手動で連携し、完全な開発パイプラインを構成する。注意:これらの skills は自動的に連鎖しない。各ステップを手動でトリガーする必要がある。全工程で約 45-90 分(要件の複雑度による):
Step 1: /grill-me(要件明確化)
入力:曖昧なアイデア(「ダッシュボードを作りたい」)
出力:decision-tree 完了、全分岐に明確な回答
Step 2: /to-prd(構造化仕様)
入力:grill-me 会話の成果
出力:構造化 PRD、GitHub Issue として自動提出
Step 3: /to-issues(垂直スライス)
入力:PRD Issue
出力:複数の垂直スライス Issues、HITL(人的介入必要)/ AFK(自動実行可能)マーク、依存関係ソート
Step 4: /tdd(各 Issue を実行)
入力:単一 Issue
出力:phase-gated TDD を通過した code + tests
このチェーンのロジックは私たちの fleet の日常運用と同一だ:strategy issue → タスク分解 → 分離実行 → 自動完了。違いは mattpocock が各ノードを標準化 skill としてパッケージ化し、誰でも npx インストール後すぐ使える点。
初回インストール後、/setup-matt-pocock-skills を実行して per-repo 設定(issue tracker、triage labels、docs パス)を行う。
Skills + Hooks コンボ:確率的実行から決定的実行へ
この記事で最も直感に反する部分:Skills は確率的(probabilistic)である。
SKILL.md がどれだけ完璧でも、Claude は複雑なタスク処理に集中している時、skill の指示をスキップする可能性がある。これはバグではなく言語モデルの本質だ。複数の目標間でトレードオフし、「タスク完了」の重みが「プロセス遵守」を上回ることがある。
Hooks は完全に決定的(deterministic)だ。Claude Code のライフサイクルイベント(PreToolUse、PostToolUse など)にバインドされた shell scripts で、トリガー時に無条件実行される。
組み合わせ戦略:
- Skills が「何をするか」を定義:TDD の Red/Green phase gate、PRD の出力構造
- Hooks が「必ず実行される」を保証:各プロンプト前に TDD フェーズチェック、コード書き込み毎に lint 実行
mattpocock/skills の git-guardrails-claude-code が好例だ。hooks で危険な git 操作(force push、reset --hard)をインターセプトする。Claude に「やめて」と「提案」するのではなく、shell レベルで直接ブロックする。setup-pre-commit skill は Husky hooks を設定し、linting とテストを毎コミット前の必須ステップにする。
インストールとクイックスタート
# mattpocock/skills 全 skills をインストール
npx skills@latest add mattpocock/skills
# 単一 skill のみインストール
npx skills@latest add mattpocock/skills/tdd
インストール後、skills は .claude/skills/ ディレクトリに配置される。Claude Code セッションで:
- インストール確認:Claude Code セッションで
/を入力し、skill リストに/tdd、/grill-me等が表示されることを確認。表示されない場合は.claude/skills/に対応するSKILL.mdファイルがあるか確認 /setup-matt-pocock-skillsを実行:issue tracker、triage labels、docs パスを設定- まず
/grill-meから始める:コード不要、純粋な会話で、通常のプロンプトとの違いを体感 - グローバル vs プロジェクトスコープ:
~/.claude/skills/に配置でグローバル(全プロジェクト共有)、.claude/skills/でプロジェクトレベル(repo に commit してチーム共有) context: forkとは:SKILL.md の frontmatter でこれを設定すると、skill は独立した subagent で実行され、メインセッションのコンテキストと完全に分離
コミュニティリソース:mattpocock/skills で足りない場合、hesreallyhim/awesome-claude-code が最も完全なディレクトリ、ComposioHQ/awesome-claude-skills にロール別バンドル、alirezarezvani/claude-skills に 232+ skills が収録されている。
リスク開示:正直な限界評価
私たちの agent fleet 運用経験から、インストール前に知っておくべきこと:
Skills は依然として確率的。 インストール ≠ 実行保証。複雑なタスク中、Claude は skill 指示をスキップする可能性がある。「入れれば安心」と期待せず、安定した実行には skills + hooks の二重レイヤーが必要。
/caveman の適用範囲。 Caveman は冗長出力を削除し、完全な技術的正確性を維持するよう設計されている。機械的なコーディングタスクには優秀。ただし深い chain-of-thought 推論(複雑な数学やロジック)が必要なタスクでは、過度な圧縮が推論品質に影響する可能性がある。2026 年 3 月の arXiv 論文によると、簡潔性制約は一部のベンチマークで 26 ポイントの精度向上を示したが、複雑な推論タスクではマイナス面の可能性も示された。
/grill-with-docs の時間コスト。 完全なインタビューフローに 15-20 分かかる。小機能や hotfix なら、直接コードを書く方が効率的。
forrestchang/andrej-karpathy-skills は mattpocock/skills の補完。 karpathy-skills は「何をすべきでないか」のガードレール(防御)、mattpocock/skills は「どう構造的にやるか」のワークフロー(攻撃)を定義。衝突しないので重ねて使える。
トリガー率データの適用範囲。 本記事で引用した 20% → 84% は Scott Spence の 200+ プロンプトでのテスト結果で、alexop.dev が Vue プロジェクトで類似結果を検証。単一テストより信頼性は高いが、言語、フレームワーク、タスク複雑度によって結果は異なる可能性がある。
結論:「賢いが無秩序」から「エンジニアリング規律」へ
Skills は Claude の能力の問題ではなく、行動規律の問題を解決する。phase gate も構造化プロセスもなく何でもできる AI は、テストを絶対に走らせない天才エンジニアのようなものだ。出力は速いが、品質は予測不可能。
推奨の入門パス:npx skills@latest add mattpocock/skills を実行し、/grill-me で違いを体感。1 週間後に grill-me → to-prd → to-issues → tdd の完全チェーンを試す。AI ワークフローが「毎回注意する」から「プロセスに従って自動実行」に進化する。
FAQ
Skills と Claude Code のスラッシュコマンド(.claude/commands/)は同じものですか?
完全には同じではありません。.claude/commands/ はプロジェクトレベルのカスタムスラッシュコマンド(静的プロンプトテンプレート)です。Skills は SKILL.md 構造、frontmatter 定義、オプションの context: fork(subagent 分離実行)、そしてクロス IDE のオープンスタンダード(agentskills.io)を備えた完全なワークフローモジュールです。どちらも / で呼び出せますが、skills は共有可能、組み合わせ可能、クロスプラットフォームのプロダクションワークフローとして設計されています。
Agent Skills はオープンスタンダードですが、Cursor や Gemini CLI でも使えますか?
はい。Agent Skills(agentskills.io)は Anthropic 主導のオープンスタンダードで、Claude Code、Cursor、Gemini CLI 間のクロス IDE 互換性を持つよう設計されています。mattpocock/skills はこのスタンダードに準拠しているため、理論上は skills をサポートする任意の IDE で使用可能です。ただし実際の互換性は IDE バージョンによって異なるため、各 IDE の skills サポートドキュメントを確認してください。



