我是 solo dev、$20 預算、跑中型專案，應該選哪一個？

大多數 solo indie maker 的預設選項是 Claude Code Pro（$20/月）。它的自主完成率最高，CLAUDE.md 能記住你的專案架構，複雜 debug 時不需要人工介入。Gemini CLI 免費方案自 2026 年 3 月底起改用 Flash 模型，能力有限；Codex CLI 透過 ChatGPT Plus 可用，三層執行模式設定清晰，但 sandbox 和企業導向設計對 solo maker 日常開發功能偏重。

三個工具可以同時安裝嗎？CLAUDE.md 和 GEMINI.md 可以共用嗎？

可以同時安裝，彼此不衝突。CLAUDE.md 和 GEMINI.md 功能相同（注入 project context），且有開發者已實作讓 Gemini CLI 讀取 CLAUDE.md，等於一份 context file 兩個工具共用。切換工具的遷移成本主要在學習 CLI 語法，不是重建 project knowledge。

Gemini CLI 的免費方案 2026 年還能正常使用嗎？

能用，但模型能力有限。2026 年 3 月底起，所有免費方案（無論 Google 帳號登入或 API key）都只能使用 Flash 模型，Pro 模型需要付費訂閱。Google 帳號登入有 1,000 requests/day，API key 也是 1,000 requests/day。Flash 模型處理簡單任務堪用，但遇到複雜重構和跨檔案 debug 時會明顯力不從心。

Claude Code 一定要訂閱嗎？可以用 API key 計費嗎？

兩種方式都可以。Claude Code 支援 Claude Pro/Max 訂閱制（$20-$200/月），也支援 API key 按用量計費。訂閱制適合日常穩定使用，API key 適合偶爾使用或需要精確控制成本的場景。

哪個工具最適合台灣的 indie maker？

Claude Code 是目前最適合台灣 indie maker 的選擇。原因：繁體中文支援最好、CLAUDE.md 生態最成熟、自主完成率在三者中最高。如果你的專案規模小且預算有限，Gemini CLI 免費方案可以作為起步試用，但遇到複雜任務時會明顯感受到模型能力的落差。

Claude Code vs Gemini CLI vs Codex CLI：2026 年該選哪個？用工作流決定，不用 benchmark

2025 年起，三大 AI 實驗室陸續推出終端 AI 程式工具，到 2026 年已趨成熟：Anthropic 的 Claude Code（2025 年 2 月預覽、5 月 GA）、Google 的 Gemini CLI（2025 年 6 月發布）、OpenAI 的 Codex CLI。網路上的比較文幾乎都在比 benchmark 分數，然後宣布某個工具「勝出」。但老實說，benchmark 告訴你的是「哪個模型考試分數高」，沒告訴你「哪個工具適合你的工作方式」。

如果你現在用 Cursor 而且 80% 的工作是單一檔案內的補全和小修改，這篇可能不是給你看的，可以直接跳到「什麼時候不該換工具」那段確認一下。但如果你開始需要跨檔案重構、自動化 pipeline、或是想讓 AI 理解整個專案架構，繼續往下讀。

這篇不比跑分。我們從三個實際決策維度切入：你的工作流類型、你對安全的要求、你的月預算。讀完後，你會知道自己該裝哪一個。

TL;DR

Claude Code = 自主正確性優先。SWE-bench Verified 最高分，複雜 debug 零干預完成，適合需要 AI 一次做對的 solo maker
Gemini CLI = 大型 codebase 分析優先。1M token context window，Plan Mode 先讀後做，適合大型 monorepo 的架構分析
Codex CLI = 沙箱安全優先。OS-level kernel 隔離，agent 物理上碰不到未授權路徑，適合 CI/CD 無人值守自動化

快速決策：Solo indie maker → Claude Code。大型 monorepo 重構 → Gemini CLI 分析 + Claude Code 執行。CI/CD 自動化 → Codex CLI。

三個工具的核心架構差異

三個工具的共同點是：你用自然語言告訴 AI 要做什麼，它幫你在電腦上讀 code、改 code、執行指令。差別在於它怎麼做、做得多自主、以及出事的時候你有多少保護。

比較 AI 程式工具，大部分人第一反應是看 benchmark 分數。Claude Opus 4.6 在 SWE-bench Verified 拿到 80.8%，Gemini 3.1 Pro 約 80.6%，分數看起來差距不大。但 CodeAnt AI（專門跑 AI coding 工具真實任務測試的評測平台）的報告揭示了一個 benchmark 看不到的差距：同一個 Express.js 重構任務，Claude Code 1 小時 17 分鐘零干預完成，Gemini CLI 花了 2 小時 04 分鐘還需要 3 次人工修正。

Benchmark 分數接近，但實際工作流差異巨大：「自主完成 vs 需要你盯著改 3 次」。這才是選工具的真正判斷標準。

三個工具背後是三種截然不同的設計哲學。搞清楚這件事，比記住任何 benchmark 數字都重要。

Claude Code：正確性優先的設計哲學

Claude Code 的核心理念是「第一次就做對」。它讀你的整個 codebase，理解跨檔案的依賴關係，然後一次性完成修改。在 CodeAnt AI 的 Figma-to-code benchmark 中，Claude Code 用了 6.2M tokens（比 Codex CLI 多 4 倍），但它抓到了一個 Codex 完全錯過的 race condition。

多出來的 token 消耗，換來的是更深的推理和更高的正確性。你省下的 3 小時 debug 時間，遠超那些 token 的成本。

Claude Code 使用 permission prompt 系統：每次要修改檔案或執行指令前會先問你。本質上屬於「信任但驗證」的模式，跟 sandbox 完全不同層級。對互動式開發來說夠用，但在無人值守環境有風險。Shipyard 的測試記錄到 Claude Code 曾自行修改 terminal permissions，這在有人監督時可以攔截，但如果跑在 CI pipeline 裡就是另一回事了。

Gemini CLI：超大 context 的設計哲學

Gemini CLI 的殺手鐧是 1M token 的 context window。這個數字聽起來很抽象，換算一下：一個中型 Next.js 專案（50+ 頁面、多個 API routes、多語系檔案）大概 200K-400K tokens。Gemini CLI 能一次把整個 codebase 塞進 context，而不用靠截斷或摘要。

DataCamp 的比較指出，1M token context 是 Gemini CLI 對大型 monorepo 的「結構性優勢」。Claude Code 在 Opus/Sonnet 4.6+ 版本中也已支援 1M token，但 Gemini CLI 從一開始就是為大型 codebase 設計的。

Plan Mode（2026 年 3 月推出）是 Gemini CLI 最有價值的功能：它讀取整個 codebase、建立依賴圖、輸出 Markdown 實作計畫，全程不修改任何檔案。對大型重構來說，「先理解再動手」比「邊做邊改」安全得多。

但這也是 Gemini CLI 的限制。Shipyard 的測試發現它「在模糊 debug 場景需要精確指令」。你得明確告訴它要做什麼，它不會自己判斷。想要全自主的開發者會覺得它太被動。

Codex CLI：沙箱安全的設計哲學

Codex CLI 做了一個其他兩個工具沒做的事：OS-level 的強制隔離。

在 macOS 上用 Seatbelt（sandbox-exec），在 Linux 上用 Bubblewrap（bwrap）+ Seccomp-BPF，都是 kernel 層的隔離機制。根據 Pierce.dev 的分析，「一個惡意的 agent 物理上無法觸碰你沒開放的檔案系統區域」。這跟 Claude Code 的 permission prompt 或 Gemini CLI 的 trusted folders 完全不同層級。

permission prompt 是「請問我可以改這個檔案嗎？」，trusted folders 是「我只看這幾個資料夾」，sandbox 是「你就算想碰也碰不到」。前兩個是君子協定，第三個是物理隔離。

Codex CLI 提供三種執行模式：Auto（預設，sandbox 內自主執行）、Read-only（只讀不改）、Full Access（完整存取）。對 CI/CD pipeline 來說，Auto mode 的預設安全性是決定性優勢。

受眾匹配梯：你是哪種開發者？

工具沒有絕對的好壞，只有適不適合你的工作方式。以下四個場景覆蓋了大部分開發者的決策情境。

場景 A：Solo Indie Maker（$20 預算，中型專案）

你會寫 code 但不是全職工程師，靠 Next.js + Supabase 做 side project，月預算控制在 $20 以內。你要的是：下一個 prompt 就能搞定功能，不想花時間理解工具鏈。

推薦：Claude Code Pro（$20/月）

理由很直接。CodeAnt AI 的測試顯示 Claude Code 的零干預完成率在三者中最高。你花 $20 買的不只是一個 AI 助手，是「不用盯著它改 3 次」的時間省下來。CLAUDE.md 能記住你的專案架構、coding convention、常用的函式庫版本，下次開 session 不用重新說明。

Gemini CLI 免費方案呢？2026 年 3 月底後免費方案改用 Flash 模型，不是最新的旗艦模型。簡單任務可以，但遇到跨檔案的複雜重構就會明顯力不從心。Codex CLI 透過 ChatGPT Plus（$20/月）可以用，它的三層執行模式（Auto / Read-only / Full Access）設定清晰直覺，但 sandbox 和企業導向的工作流設計對 solo maker 的日常開發來說功能偏重。

場景 B：大型 Monorepo 工程師（500K+ 行，legacy 重構）

你負責維護一個巨型 codebase，定期要做 legacy 重構，需要 AI 能一次理解整個 service 的依賴關係。

推薦：Gemini CLI（分析）+ Claude Code（執行），雙工具搭配

Gemini CLI 的 1M token context 讓它能讀整個 codebase。實際用法：先用 Plan Mode 跑分析，輸出一份 Markdown 實作計畫，確認方向對了，再用 Claude Code 執行修改。Claude Code 的多檔案一致性在三者中最強，不會改了 A 檔忘了 B 檔的對應更新。

context 不足的後果比你想的嚴重。當 AI 的 context window 裝不下你的 codebase 時，它不是「變笨」，是開始基於不完整資訊給建議。問題在於：這種建議看起來仍然合理，你可能用了才發現它忽略了某個關鍵的 dependency。等到撞牆才換工具，代價比一開始就選對高得多。

DataCamp 有個實用的做法：讓 Gemini CLI 讀取 CLAUDE.md，這樣兩個工具共用同一份 project context，不需要維護兩份設定檔。

場景 C：CI/CD 自動化工程師（無人值守，安全要求高）

你在 CI pipeline 中跑 AI agent 自動化，沒有人盯著。agent 如果誤刪了生產環境的設定檔，後果不只是 debug，是可能的事故。

推薦：Codex CLI

這個場景沒有第二選擇。Claude Code 和 Gemini CLI 都在你的環境中直接執行指令，permission prompt 和 trusted folders 在無人值守時等於形同虛設。只有 Codex CLI 的 Seatbelt/Landlock 是 kernel 層強制的，agent 就算「想」觸碰未授權路徑也做不到。

DeployHQ 的測試中，Codex CLI 完成 Dockerfile 自動化任務只花了 45 秒（Claude Code 90 秒，Gemini CLI 60 秒），而且是在完全沙箱化的環境中。速度和安全兼具。

場景 D：Technical Founder（帶 3-5 人小團隊）

你需要統一團隊的 AI 工具，讓不同成員的 AI 輸出風格一致，同時控制每月的 token 消耗。

推薦：Claude Code 作為主力 + CLAUDE.md 作為 single source of truth

CLAUDE.md 是讓團隊 AI 輸出一致的關鍵。把 coding convention、架構決策、常用 patterns 都寫進去，每個成員開 Claude Code 都讀同一份 context。Claude Code 的 Agent Teams 功能（實驗階段）支援多個 agent 實例平行協作，對跨模組的大型任務有加速效果。

更好的策略：設定 Gemini CLI 也讀取同一份 CLAUDE.md。這樣團隊成員可以用 Claude Code 做日常開發，用 Gemini CLI 做大型 codebase 的架構分析，context 完全互通。

2026 年定價真相：$20 能買到什麼？

面向	Claude Code Pro	ChatGPT Plus（含 Codex CLI）	Gemini CLI 免費方案
月費	$20	$20	免費
模型	Opus 4.7 / Sonnet 4.6	GPT-5.5	Flash（Pro 需付費訂閱）
Context	1M tokens	200K tokens	1M tokens
Sandbox	無（permission prompt）	OS-level（Seatbelt/bwrap）	無（trusted folders）
適合	日常開發、複雜 debug	CI/CD 自動化、安全優先	大型 codebase 探索、預算有限

「免費」聽起來很吸引人，但細節很重要。Gemini CLI 有兩種免費路徑：用 Google 帳號登入（1,000 requests/day）或用 API key（1,000 requests/day）。但自 2026 年 3 月底起，所有免費方案一律只能使用 Flash 模型，Pro 模型需要付費訂閱。Flash 模型處理簡單任務堪用，但在複雜重構和跨檔案 debug 時，能力跟旗艦模型差距明顯。

另一個常見的誤解是 token 效率等於省錢。CodeAnt AI 的 Figma-to-code benchmark 顯示 Codex CLI 只用了 1.5M tokens（Claude Code 用 6.2M），看起來便宜 4 倍。但同一份報告也寫到 Claude Code 發現了 Codex 完全錯過的 race condition。如果你的「省 token」輸出需要多花 3 小時 debug，那個 token 省下來的錢，遠遠不夠補你的時間成本。

Claude Code 還有 Max 方案（$100/月或 $200/月），提供更高的用量上限。重度使用者（每天超過 10 個大型 session）可能會遇到 Pro 的用量上限，超過後 Claude Code 會暫停接受新任務直到隔天重置，進行中的任務不會中斷。這種情況下升級 Max 5x（$100/月）比較穩。

安全性不是可選項：三層防護的實際差距

這個段落不是給所有人看的。如果你只在本機互動式開發，Claude Code 的 permission prompt 絕對夠用。但如果你的任何一個工作流涉及無人值守執行（CI pipeline、排程任務、batch processing），安全架構的選擇就變成不可妥協的條件。

三個工具的安全模型差距不在 UI 上，在 threat model 上：

工具	安全機制	層級	無人值守適用
Claude Code	Permission prompts	應用層（需人工確認）	不適合
Gemini CLI	Trusted folders	目錄層（軟性白名單）	有限制
Codex CLI	Seatbelt / bwrap+Seccomp	Kernel 層（物理隔離）	適合

DeepWiki 的技術分析詳細說明了 Codex CLI 的 sandbox 架構：macOS 上用 Seatbelt (sandbox-exec) 搭配 kernel 強制的存取控制，Linux 上用 Bubblewrap (bwrap) 加上 Seccomp-BPF 的 syscall 過濾。你可以用 codex debug seatbelt 測試 macOS 上的隔離是否正常運作。

Shipyard 的測試記錄到一個具體案例：Claude Code 在某次操作中自行修改了 terminal permissions。在有人盯著的時候你會注意到並攔截，但在 CI/CD pipeline 中，這代表 agent 有能力擴大自己的權限範圍。這就是為什麼「無人值守場景一律選 Codex CLI」是基於 threat model 的風險管理判斷。

Context File 互通性：一份設定檔跑兩個工具

CLAUDE.md、GEMINI.md、AGENTS.md 這些 context file 的功能完全相同：把你的專案架構、coding convention、技術選型注入 AI 的 context，讓它每次開 session 都從「已經理解你的專案」開始，不是從零學起。

好消息是，切換工具的成本比你想的低很多。DataCamp 記錄到有開發者在 Gemini CLI 的設定中指定讀取 CLAUDE.md，實現跨工具 context 共用。做法很簡單：在 GEMINI.md 中加一行指示 Gemini CLI 也讀取 CLAUDE.md 的內容。

如果你是從零開始，建議的最小可用 context file 長這樣：

# Project Context

## Stack
- Framework: Next.js 15 (Pages Router)
- Database: Supabase (PostgreSQL)
- Language: TypeScript
- Styling: Tailwind CSS

## Conventions
- 函式命名：camelCase
- 檔案命名：kebab-case
- 元件：一個檔案一個元件，named export

## Key Paths
- Pages: src/pages/
- Components: src/components/
- API Routes: src/pages/api/

把這個檔案放在你的專案根目錄（project root），命名為 CLAUDE.md，路徑就是 ./CLAUDE.md。Claude Code 啟動時會自動讀取它。這 15 行能讓 AI 省下每次 session 前 5 分鐘的「理解你的專案」時間。隨著使用加入更多 convention 和決策記錄就好。

什麼時候不該換工具

說了這麼多，有些情況你其實不需要換。

繼續用 Cursor/Copilot 比較好的情境：

你的工作 80% 是在單一檔案內的自動補全和小修改。Cursor 的即時補全體驗在這個場景仍然最快，CLI 工具的啟動成本反而是多餘的
你不需要跨檔案重構。CLI agent 的價值在於「理解整個 codebase 後做跨檔案修改」，如果你的改動範圍很小，IDE 內建的 AI 就夠了
你的團隊已經統一用某個 IDE 套件且運作順暢。換工具的溝通和學習成本是實打實的

第一次用 CLI agent 最容易踩的坑：

給太模糊的指令。「幫我優化這個 API」不夠具體，CLI agent 會猜你要什麼，猜錯的機率很高。說「把 /api/users 的回應時間從 2 秒降到 500ms，先分析哪個 query 最慢」效果好得多
沒有先設定 context file。沒有 CLAUDE.md 或 GEMINI.md，agent 每次都從零開始理解你的專案，前 5 分鐘都在浪費
讓 agent 在沒有 git 保護的環境中執行。至少確保你的工作目錄有 git，改壞了能 revert

結論：5 分鐘決策樹

你的主要工作流是什麼？
│
├─ 日常開發（寫功能、修 bug、重構）
│  └─ 預算 $20/月 → Claude Code Pro
│
├─ 大型 codebase 分析 + 重構
│  └─ Gemini CLI（Plan Mode 分析）+ Claude Code（執行修改）
│
├─ CI/CD 自動化（無人值守）
│  └─ Codex CLI（唯一有 OS-level sandbox 的選項）
│
└─ 團隊協作（3-5 人，需要一致性）
   └─ Claude Code Teams + CLAUDE.md 作為 single source of truth

三個工具不是非此即彼的關係。很多開發者同時用兩個甚至三個，根據任務類型切換。CLAUDE.md 的互通性讓這件事的成本很低。

選好工具後，先安裝：

Claude Code：npm install -g @anthropic-ai/claude-code
Gemini CLI：npm install -g @google/gemini-cli
Codex CLI：npm install -g @openai/codex

裝完後第一步：建立你的 context file（CLAUDE.md 或 GEMINI.md），把專案架構和 convention 寫進去，然後用一個你熟悉的小任務跑一次。別一開始就拿最複雜的重構任務測試，先讓你和工具互相適應。

工具會持續迭代，今天的分數和定價半年後可能完全不同。但「根據工作流選工具，而不是根據 benchmark 選工具」這個判斷框架，不會過時。