Claude Code 和 Codex 都是 $20/月起跳，indie maker 應該先付哪個？

先問自己的主力任務類型。如果你大部分時間在做複雜重構、多檔修改、長期維護同一個代碼庫，Claude Code Pro $20 是更好的起點，因為它的代碼品質和深度理解能力更強。如果你的工作流偏向快速執行 isolated tickets、批次 PR，且已經在用 ChatGPT Plus，那 Codex 的 token 效率（約 4 倍）讓你在 $20 方案內能做更多事。兩者都試過之後，再決定是否升級或混用。

Codex 的 computer use（操控 Mac）對日常 coding 真的有幫助嗎？

老實說，目前幫助有限。Codex computer use 僅支援 macOS（EU/UK 尚未開放），in-app browser 只能存取 localhost，而且圖片操作會讓 token 消耗暴增 3-5 倍。對 indie maker 的日常 coding 任務來說，Claude Code 的 Monitor + /loop 組合更務實：它可以在背景串流監聽 script 事件、自動修復 CI 錯誤，搭配 Routines 還能在雲端排程執行，不需要你一直盯著電腦。

Claude Code 和 Codex 可以同時用嗎？最佳混用策略是什麼？

可以，而且混用是大多數 indie maker 的最佳策略。具體做法：用 Claude Code 處理複雜重構、多檔修改、Ultraplan 架構規劃等需要深度理解的任務；用 Codex 處理 isolated 的 ticket 批次執行、簡單 bug fix、diff review 等可以並行的工作。月成本是 Claude Pro $20 + ChatGPT Plus $20 = $40/月，這對大多數 indie maker 來說是 sweet spot。建議先用兩個月觀察自己的任務分布，再決定是否需要升級某一邊。

2026 年 Claude Code vs OpenAI Codex 深度比較：indie maker 如何選對 AI coding 主力？

2026 年 4 月，Anthropic 和 OpenAI 接連丟出重磅更新。4 月 16 日，Claude Opus 4.7 帶著 SWE-bench Verified 87.6%（公司自述）的成績正式 GA；稍早在 4 月初，Ultraplan 雲端規劃功能已進入 early preview，讓開發者可以在瀏覽器中審查 diff 並直接開 PR。OpenAI 這邊，Codex 在 4 月陸續推出 computer use（macOS 限定）等更新，並在 4 月初調整了定價方案。Codex 的週活躍用戶在兩週內從 300 萬衝到 400 萬（公司自述），Reddit 和 Hacker News 的論戰帖動輒數百則留言。

但你是 indie maker，不是追熱度的人。你需要的是：什麼任務用哪個工具、月成本怎麼算、以及哪個更適合你一個人扛起整個 SaaS 的現實。這篇文章就是那個框架。

TL;DR

Claude Code 在代碼品質（SWE-bench Verified 87.6%，公司自述，排名第二僅次於 GPT-5.5）和深度代碼庫理解上表現突出
Codex 在 token 效率上有約 4 倍優勢（SpectrumAI 實測同任務 1.5M vs 6.2M tokens），isolated 並行任務更快更省
大多數 indie maker 的最佳解：Claude Code 為主力 + Codex 為輔助，$40/月的混用策略
注意：Claude Code 的 token 消耗較高，代表你會更快碰到方案上限；Codex 的 computer use 目前限制很多（macOS only、localhost only），別被行銷亮點誤導

四月的兩個大更新：這場戰役在打什麼？

4 月這波更新的重點是什麼？

Anthropic 這邊，Claude Opus 4.7 於 4 月 16 日正式 GA。SWE-bench Verified 從上一代 Opus 4.6 的 80.8% 跳到 87.6%（公司自述，+6.8 個百分點），在 SWE-bench 排行榜上位居第二（第一是 GPT-5.5 的 88.7%）。稍早在 4 月初進入 early preview 的 Ultraplan 讓 Claude Code 可以在雲端 session 中執行實作，開發者在瀏覽器審查 diff 後直接開 PR，完全不需要碰 terminal。

OpenAI 這邊，Codex 在 4 月陸續推出多項更新：computer use 功能讓 Codex 可以看螢幕、點擊、輸入（僅 macOS）；plugin 生態整合 Atlassian、CircleCI、Microsoft Suite 等工具；定價方案也在 4 月初進行了調整。

表面上看，這是兩個 AI coding 工具的功能軍備競賽。但實際上，這波更新揭示的是兩條完全不同的產品路線：Claude Code 在深化「替你理解整個代碼庫」的能力，Codex 在擴張「成為你整個開發工具鏈的入口」。

理解這個分歧，是選對工具的前提。

架構哲學：terminal-native 深度代碼庫 vs desktop super-app

根據 arXiv 上的一篇 Claude Code 架構分析論文，Claude Code 的底層設計中，98.4% 是確定性基礎設施，只有 1.6% 是 AI 決策邏輯。這個比例說明了它的設計哲學：可預測、可控制、可版控。

具體來說，Claude Code 的核心機制包含：

CLAUDE.md：永遠可讀的專案指令檔，放在 repo 裡跟著程式碼一起版控，每次 session 啟動自動讀取
五層 compaction pipeline：當對話太長時，會分層壓縮上下文，保留最關鍵的 codebase 知識
subagent persistent memory：子代理有自己的記憶目錄，跨 session 持續累積對代碼庫的理解
Skills 系統：由社群自由貢獻的工作流定義，用自然語言寫就行，沒有平台策展的天花板

Codex 的設計走的是另一條路：

Desktop app + plugin 生態：plugins 整合 Atlassian Rovo、CodeRabbit、GitLab Issues、Microsoft Suite、Render 等
Manager agent + 3 roles：explorer（唯讀分析）、worker（讀寫執行）、default（通用），最多 6 個 subagents 並行
Worktrees 隔離：每個 subagent 在獨立的 git worktree 中工作，互不干擾
Computer use：可以看你的螢幕、操控滑鼠鍵盤（目前僅 macOS）

這裡有一個常見的認知陷阱：你可能覺得 Codex 的 plugin 生態更廣，所以擴展性比 Claude Code 強。但實際上，仔細看那份 plugin 清單就會發現，大量整合是為企業工程師團隊設計的。Atlassian、Salesforce、CircleCI、Microsoft Teams 這些工具，典型的 indie maker 根本用不到幾個。

相反地，Claude Code 的 CLAUDE.md + Skills 系統讓你用自然語言定義自己的工作流。我們實際操作下來，自訂一個 skill 大概 5 分鐘，不需要等平台審核，也不受 plugin 數量限制。對一人團隊來說，這種彈性其實更實用。

代碼品質 vs 執行速度：benchmark 在你的任務中意味著什麼？

先看數字：

Benchmark	Claude Code (Opus 4.7)	Codex (GPT-5.3)	測試重點
SWE-bench Verified	87.6%（公司自述）	85.0%（公司自述）	能否修好真實 GitHub issue
Terminal-Bench 2.0	65.4%	77.3%（公司自述）	終端機代理任務（CLI 操作、腳本執行）
Token 效率（同任務）	~6.2M tokens	~1.5M tokens	SpectrumAI lab 實測

注意：SWE-bench Verified 和 Terminal-Bench 2.0 均為各家公司自行提交的分數。OpenAI 在 2026 年初曾質疑 SWE-bench Verified 存在汙染風險，建議改看 SWE-bench Pro。GPT-5.5 在更新的 Terminal-Bench 2.0 上已達 82.0%（公司自述），但本文比較基準為 2026 年 4 月發布的版本。

2.6 個百分點的 SWE-bench 差距看起來很小，但 SWE-bench 測的是「能不能修好 bug」（二元結果），實際開發中代碼的可讀性、架構合理性同樣重要。根據多位開發者的使用心得，Claude Code 在複雜重構和多檔修改場景中的產出品質普遍獲得較高評價。

Terminal-Bench 2.0 的差距（77.3% vs 65.4%）同樣值得注意。如果你的工作流大量涉及 CLI 腳本、終端機操作、系統管理類任務，Codex 在這類 isolated 任務上確實更順手。

實際操作後，我們的觀察是：需要跨多個檔案理解上下文、做複雜重構的任務，Claude Code 的產出品質明顯更好；但如果是「改這個 CSS、修那個 API endpoint」這種範圍明確的小任務，Codex 的速度和 token 效率優勢就很有感。

Ultraplan vs Subagents：誰的雲端 agent 更適合 indie maker？

很多人對 Claude Code 的印象還停留在「要打開 terminal 才能用的 CLI 工具」。Ultraplan 改變了這個定位。

根據官方文件的描述：「Execute on the web: Claude implements the plan in the cloud session. You review the diff in the browser. Then you create a PR directly, never touching your terminal.」

Ultraplan 的實際流程是這樣的：

在雲端 session 中做深度分析，解析依賴關係、產生架構圖
你在瀏覽器審查分析結果，approve 或調整計畫
Claude 在雲端 session 執行實作
直接從瀏覽器開 GitHub PR

這需要 Pro 或 Max 方案 + Claude Code v2.1.101 以上版本 + 安裝 GitHub App。目前仍在 research preview 階段。

Codex 的 subagents 走的是不同的路：最多 6 個 agent 同時並行，每個在獨立的 git worktree 中工作，有明確的角色分工（explorer 唯讀、worker 讀寫、default 通用）。這個架構特別適合「把 10 個 ticket 丟進去，讓 6 個 agent 同時跑」的批次執行場景。

對 indie maker 來說，兩者解決的是不同問題：

Ultraplan 適合「我要重構這個模組，但不確定會影響哪些檔案」這種需要深度理解的規劃型任務
Codex subagents 適合「這 8 個 bug fix 彼此獨立，讓 agent 並行處理」這種可以切割的執行型任務

如果你的 side project 正在從 MVP 轉向正式產品、需要做架構層級的重構，Ultraplan 的深度分析能力會更有價值。如果你在接案、同時處理多個客戶的 ticket backlog，Codex subagents 的並行架構更適合。

Computer Use vs Monitor + /loop：自動化日常任務誰更強？

Codex 的 computer use 是 4 月更新中最吸睛的功能：AI 可以看你的螢幕、點擊按鈕、輸入文字。聽起來很厲害，但實際限制不少：

僅支援 macOS（EU/UK 地區尚未開放）
In-app browser 只能存取 localhost，無法操作真實外部網頁
圖片操作讓 token 消耗暴增 3-5 倍
多個 agent 同時跑時不會干擾用戶操作（這點設計得不錯）

說白了，computer use 目前更像是一個技術展示，而不是 indie maker 可以立即依賴的生產力工具。

Claude Code 這邊的自動化方案更務實。Monitor 工具（v2.1.98，4 月 9 日上線）可以串流後台 script 事件，讓你在 terminal 中即時監控任務進度。/loop 指令支援自我調速執行，AI 會根據任務進度自動決定節奏。再搭配 4 月 14 日上線的 Routines 雲端排程，你可以設定定期任務在雲端自動跑，不需要開著筆電。

一個具體場景：你想讓 AI 在半夜自動監控 CI pipeline，發現錯誤就自動修復並推 PR。用 Claude Code 的 Monitor + Routines，現在就能做到。用 Codex 的 computer use，你得開著 Mac 讓它盯著螢幕看 CI dashboard，然後 token 燒得飛快。哪個更適合 indie maker，答案很明顯。

定價全算法：$20 起頭，你的 TCO 差多少？

表面上兩個工具都是 $20/月起跳，但實際 TCO 差異比你想的大。

方案	Claude Code	Codex
入門（$20/月）	Pro	Plus（ChatGPT 方案含蓋）
重度（$100/月）	Max 5x	Pro（5x 額度，2026/5/31 前慶祝期加碼至 10x）
全職（$200/月）	Max 20x	Pro（20x 額度）
API 計費	Opus 4.7：$5 input / $25 output per MTok	Token-based（2026/4/2 起）

關鍵在 token 效率的差距。根據 SpectrumAI lab 的實測，完成相同的 coding 任務，Claude Code 平均消耗約 6.2M tokens，Codex 只需要約 1.5M tokens。這個 4 倍差距直接影響你「多快碰到方案上限」。

用白話講：同樣在 $20/月方案下，Codex 用戶大概能完成 4 倍數量的 agentic 任務才會感覺到限速。但反過來說，根據多位開發者的使用反饋，Claude Code 在複雜任務上的代碼品質普遍更好，所以你可能需要更少的來回修改。

對大多數 indie maker 來說，混用策略是最務實的：

Claude Pro $20 處理需要深度理解的複雜任務（重構、架構設計、多檔修改）
ChatGPT Plus $20 含蓋 Codex 使用，處理 isolated 的小任務和並行 PR
月度 TCO：$40，這是大多數 indie maker 的 sweet spot

如果你每月 agentic 任務量很大（例如全職用 AI 寫 code），Claude Code 可能需要升到 Max $100，而 Codex 在 Plus $20 可能還夠用。這時候你的決策變成：$100（Claude Max）vs $20（Codex Plus）+ 較低的 code quality，或者 $120 混用（Claude Max $100 + ChatGPT Plus $20）。

提醒：Codex 沒有公開具體的 token/月上限數字，官方描述為「標準額度」。Claude Code 的 Pro 方案約有 44,000 tokens per 5-hour window。實際體驗因使用模式而異。

CLAUDE.md + Skills vs Memory + Plugins：記憶與工作流誰更成熟？

記憶系統的成熟度，是兩個工具目前差距最大的地方。

Claude Code 的記憶架構有三層：

CLAUDE.md：放在 repo 根目錄的指令檔，跟程式碼一起 git 版控。每次開 session 自動讀取，團隊成員共享同一份規則。你可以 diff 它、review 它、rollback 它。
Auto memory（v2.1.59，2 月 26 日 GA）：Claude Code 自動記住你的偏好和修正模式，不需要手動設定。
Subagent persistent memory：每個子代理有自己的記憶目錄，跨 session 累積對代碼庫的理解。

這套系統已經穩定運行超過 6 個月。最關鍵的是，CLAUDE.md 是可版控的第一公民資料，你可以精確控制 AI 知道什麼、不知道什麼。

Codex 的 memory 在 4 月底仍處於 preview 狀態，能記住偏好和修正，但架構細節和可靠性數據尚未公開。你無法像 CLAUDE.md 那樣把記憶規則放進 git、做 code review、或在團隊間同步。

對 indie maker 來說，「可預測」比「智能」更重要。你不會想要 AI 在某天突然忘記你的 code style 規範，或是記住了不該記的東西但你沒辦法刪除。CLAUDE.md 的透明性在這方面有明確優勢。

Plugin 方面，Codex 的 plugin 生態在數量上有優勢，但我們前面分析過，大部分是企業工具整合。Claude Code 的 Skills 系統採用開放模型，2026 年 4 月社群已貢獻超過 1,000 個 skills，任何人都可以用自然語言定義新的工作流。

受眾匹配梯：你的 indie maker workflow 在哪個位置？

與其比功能，不如問自己兩個問題：

你的主力任務是「理解和修改複雜代碼庫」還是「快速並行執行 isolated tickets」？
你的工作流依賴「自訂 workflow」還是「現有工具生態（Atlassian/Microsoft/CI）」？

根據這兩個軸，你可以定位自己在這個矩陣中的位置：

	自訂 workflow 為主	整合現有工具生態為主
複雜重構 / 長期代碼庫	Claude Code 為主力	Claude Code + Codex 混用
Isolated tickets / 快速執行	Claude Code + Codex 混用	Codex 為主力

三類 indie maker 的具體建議：

非工程師背景（設計師/PM 用 AI 做 SaaS）：從 Claude Code Pro $20 開始。CLAUDE.md 讓你用自然語言定義工作規則，不需要理解 plugin API。代碼品質的優勢在你不太會自己 review code 的時候更重要。

全端工程師副業接案（中型代碼庫 5-20 萬行）：Claude Code Max $100 + ChatGPT Plus $20 = $120/月。用 Claude Code 處理客戶代碼庫的重構和理解，用 Codex subagents 並行跑 ticket backlog。SWE-bench 那 2.6% 差距在 5 萬行以上的代碼庫會明顯感受到，多位開發者反饋 Claude Code 在複雜重構場景的代碼品質明顯更好。

重度 agent 自動化用戶（多個 side projects 同時跑）：評估 Ultraplan + Codex subagents 混用。用 Ultraplan 做架構規劃和深度分析，用 Codex subagents 執行 isolated PR 批次。但注意 Ultraplan 仍在 research preview，需要安裝 GitHub App。

結論

這不是「誰更好」的問題。Claude Code 和 Codex 走的是兩條不同的路，你的主力任務類型決定了哪條路更適合你。

如果你不確定，最務實的做法是：從混用開始，Claude Pro $20 + ChatGPT Plus $20 = $40/月。用兩個月的時間記錄自己的任務分布：有多少比例是複雜重構、有多少是 isolated tickets、有多少是需要自動化的日常任務。數據會告訴你答案。

兩個工具都在快速迭代。Codex 的 memory 會從 preview 走向穩定，Claude Code 的 Ultraplan 會從 research preview 走向 GA。重要的不是現在押對寶，而是建立一個能隨時切換的工作流。