Gemini CLI 完整指南:免費 AI 終端 Agent 的真實能力與限制(2026)
Google 在 2025 年中開源了 Gemini CLI,一個能在終端直接操作檔案、執行指令、串接外部工具的 AI Agent。行銷重點是「免費、開源、1M token 上下文」,聽起來像是 Claude Code 的免費替代品。
但實際跑過幾週後,我們發現真實情況比行銷文案複雜得多。有些地方 Gemini CLI 確實做到 Claude Code 做不到的事(例如 Google Workspace 原生整合),但也有些限制是你不踩到不會發現的。
這篇指南的目的不是告訴你該選哪個,而是讓你在 5 分鐘內理解 Gemini CLI 的真實能力邊界,避免帶著錯誤期待入坑。
時效聲明:本文基於 2026 年 4 月的 Gemini CLI 官方文件和社群實踐。Google 的更新節奏快,具體配額、功能、MCP 相容性可能隨版本變動,建議搭配 Gemini CLI 官方文件使用。
TL;DR
- 免費但有真實天花板:行銷說 1,000 RPD,但 60 RPM 才是你會先撞到的牆。Agentic loop 每個任務打多條子請求,10–15 個 prompt 就可能觸發限流
- 不是「Google 版 Claude Code」:架構哲學根本不同——1M token 上下文、Apache 2.0 開源、Google Workspace 原生整合,這些是 Claude Code 沒有的
- MCP 支援 ≠ 全部能用:社群伺服器(GitHub、Slack)運作良好,但企業工具的私有 auth(如 Atlassian)會直接失敗
- 混合策略最實用:Gemini CLI 負責探索和原型,Claude Code 負責精確度要求高的任務
三個對 Gemini CLI 的常見誤解
在深入功能之前,先修正三個最常見的錯誤認知,避免你帶著錯誤期待走完整篇文章。
誤解一:「每天 1,000 次免費請求很夠用」
Google 的行銷數字是 1,000 RPD(requests per day),但免費層還有另一個限制:60 RPM(requests per minute)。在 agentic loop 裡,一個「審查這段程式碼」的任務可能觸發 5–10 條子請求(工具呼叫、上下文刷新、確認回合)。GitHub Discussions #2436 的用戶報告顯示,單次 session 10–15 個 prompt 就撞上 429 錯誤,從來沒接近過每日 1,000 次的上限。真實瓶頸是 RPM,不是 RPD。
誤解二:「就是 Google 版的 Claude Code」
兩者都是終端 AI Agent,但底層設計分歧明顯:Gemini CLI 多模態優先、1M token 上下文窗口(Claude Code 約 200K);Apache 2.0 開源,可以 fork、審計、嵌入自己的產品;免費層使用 Gemini Flash 預設模型,不需要付費訂閱即可啟動。這些不是表面差異——它們代表不同的使用場景和採用策略。
誤解三:「支援 MCP 就代表所有工具都能接」
Gemini CLI 的 MCP 支援處理社群維護的伺服器(GitHub MCP、file system、Slack)表現良好。但需要私有 auth handshake 的企業服務——已確認案例是 Atlassian MCP——會完全失敗,因為 Gemini CLI 無法完成所需的 token 交換流程。「支援 MCP 協定」和「所有 MCP 伺服器都能用」是兩件事。
5 分鐘安裝 + 第一個 Agentic 任務
整個安裝流程只需要 Node.js 18+ 和一個 Google 帳號。
安裝
npm install -g @google/gemini-cli
安裝完成後執行 gemini 啟動 CLI,首次使用會引導你完成 Google 帳號 OAuth 認證。
兩種認證方式
| 方式 | 適用場景 | 設定方法 |
|---|---|---|
| Google 帳號 OAuth | 個人使用、快速上手 | 啟動後瀏覽器自動跳轉授權 |
| AI Studio API Key | CI/CD、headless、需要更高配額 | export GEMINI_API_KEY=your-key |
個人 Google 帳號登入就夠用,不需要 Workspace 帳號或付費訂閱。如果你需要 headless 環境(CI/CD pipeline、排程腳本),使用 API key 方式。
第一個 Agentic 任務
認證完成後,給 Gemini CLI 一個有意義的任務來驗證 agent 能力:
gemini -p "Review the code in src/ directory, identify potential bugs, and create a summary in review.md"
這個指令會觸發 Gemini CLI 的 agentic loop:讀取檔案 → 分析程式碼 → 撰寫摘要 → 寫入檔案。如果你看到它自動切換工具、讀取多個檔案並產出結果,安裝就算成功。
提示:
-p旗標是非互動模式(headless),直接傳入 prompt 並執行完畢後退出。互動模式直接輸入gemini即可。
費率限制的真相:60 RPM 才是真正的天花板
這一段對每個想認真使用 Gemini CLI 的人都很關鍵。
免費層的實際配額結構
根據 Google 官方文件,免費個人帳號(Personal Google Account)的限制是:
| 限制類型 | 配額 | 說明 |
|---|---|---|
| RPM(每分鐘請求數) | 60 | 這是你會先撞到的牆 |
| RPD(每日請求數) | 1,000 | 行銷重點,但幾乎不會先觸及 |
| TPM(每分鐘 token 數) | 依模型而異 | Gemini Flash 較寬鬆 |
為什麼 RPM 是真正的瓶頸?
Agentic loop 的每個「任務」不等於一個 API 請求。一個「幫我重構這個函數」的指令,Gemini CLI 內部可能產生:
- 讀取目標檔案(1 次工具呼叫)
- 分析程式碼結構(1 次推理)
- 讀取相關依賴(2–3 次工具呼叫)
- 生成重構方案(1 次推理)
- 寫入修改(1 次工具呼叫)
- 確認結果(1 次推理)
一個看似簡單的任務就消耗了 7–8 個請求。在 60 RPM 的限制下,連續操作 7–8 分鐘就可能觸發限流。GitHub 上的用戶回報證實了這個模式:10–15 個 prompt 後收到 429 錯誤。
應對策略
- 切換 AI Studio API key:如果你需要穩定的 RPM,透過 Google AI Studio 申請 API key,付費方案解鎖更高的 RPM 上限
- 降低 context size:減少每次請求附帶的檔案數量,降低 token 消耗
- Rate limit 觸發後的行為:遇到 429 錯誤時,Gemini CLI 不會自動 retry——它會中止當前任務並顯示錯誤訊息。若在 CI/CD 中使用,需在腳本層處理 retry 邏輯(例如加入 exponential backoff 的 wrapper)
- 團隊注意:配額是 per-project 而非 per-key,多個 API key 不會乘以配額,建議參考 Google AI for Developers 配額文件確認最新限制。團隊評估時需要把這個因素計入成本
MCP 整合的邊界:哪些能用,哪些會壞
Gemini CLI 支援 Model Context Protocol(MCP),讓你可以把外部工具接入 CLI。但「支援 MCP」和「所有 MCP 伺服器都能跑」差距很大。
能用的:社群維護伺服器
| MCP 伺服器 | 傳輸協定 | 狀態 |
|---|---|---|
| GitHub MCP | STDIO | 穩定 |
| File System | STDIO | 穩定 |
| Slack | STDIO | 穩定 |
| Google Search | SSE | 穩定 |
會壞的:企業私有 auth
已確認的失敗案例:Atlassian MCP。原因是 Gemini CLI 無法完成 Atlassian 要求的私有 token 交換流程。這不是 Gemini CLI 的 bug,而是 MCP 協定層面沒有統一企業 auth 標準的問題。
隱性風險:JSON Schema 被靜默修改
Gemini CLI 為了符合 Gemini API 格式,會自動 strip 掉 $schema 和 additionalProperties JSON schema 屬性。如果你的 MCP 伺服器依賴嚴格的 schema 驗證,可能會在沒有錯誤訊息的情況下靜默失敗。
MCP 設定範例
在 ~/.gemini/settings.json 中新增 MCP 伺服器:
{
"mcpServers": {
"github": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-github"],
"env": {
"GITHUB_PERSONAL_ACCESS_TOKEN": "ghp_your_token"
},
"transport": "stdio"
},
"filesystem": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-filesystem", "/path/to/allowed/dir"],
"transport": "stdio"
}
}
}
建議:整合新的 MCP 伺服器前,先確認該服務的 auth 機制是否為標準 OAuth 或 API key。需要私有 token 交換的服務(Atlassian、部分企業 SaaS)目前應預期不相容。
GEMINI.md 層級架構:比 CLAUDE.md 更複雜的 context 系統
如果你用過 Claude Code 的 CLAUDE.md,可能會以為 GEMINI.md 是同樣的東西。結構上類似,但行為差異足以讓你踩到坑。
三層堆疊機制
Gemini CLI 按以下順序載入 GEMINI.md,全部串接後送入每個 prompt:
1. ~/.gemini/GEMINI.md (全域層 — 所有專案共用)
2. ./GEMINI.md (專案層 — 專案根目錄)
3. ./src/GEMINI.md (子目錄層 — 特定資料夾)
三層的內容會被串接而非覆蓋。這意味著 context 在層級間靜默累積,子目錄規則不會取代全域規則,而是追加在後面。
與 CLAUDE.md 的行為差異
| 特性 | GEMINI.md | CLAUDE.md |
|---|---|---|
| 載入層級 | 三層(全域 + 專案 + 子目錄) | 單層(每專案一個) |
| 層級關係 | 串接累積 | 無層級問題 |
| 可視工具 | /memory show | 直接檢視檔案 |
| context 膨脹風險 | 高(三層疊加) | 低 |
實用建議
- 全域層(
~/.gemini/GEMINI.md):只放真正通用的規則,例如程式碼風格偏好、語言設定 - 專案層(
./GEMINI.md):放 project-specific 規範,例如技術堆疊、架構約束 - 避免在子目錄層定義衝突規則:因為串接機制,子目錄的規則是「追加」而非「覆蓋」,衝突規則會讓 Gemini 的行為變得不可預測
- 定期用
/memory show檢查:這是唯一能看到 Gemini CLI 實際載入了哪些 context 的方式
Apache 2.0 對開發者的實際意義
Gemini CLI 採用 Apache 2.0 授權,這在 AI coding CLI 中是獨特的定位(Claude Code 是 Anthropic 私有授權)。但「開源」的實際意義比直覺想像的更微妙。
你可以做什麼
- Fork 用於內部工具:合法地將 Gemini CLI 嵌入你公司的開發工具鏈,不需要額外授權
- 審計原始碼:確認 CLI 對你的程式碼做了什麼處理、資料如何傳送,這對合規審查很重要
- 修改後不需公開:Apache 2.0 不要求你公開修改過的原始碼(不同於 GPL)
這不代表什麼
- Fork ≠ 維護責任消失:第三方 fork 可能附帶不同的預設行為。如果你團隊使用的是非官方 fork 或鎖定舊版本,可能獲得與官方版本不同的體驗,且需自行承擔安全更新和相容性維護
- 開源 ≠ 更安全:透明度確實提高了,但你需要主動版本管理策略。Google 官方版本有持續更新,但你 fork 出去的版本不會自動同步
對比 Claude Code 的授權差距
這不是「感覺上更開放」的差異。Apache 2.0 允許你將 Gemini CLI 嵌入商業產品並銷售,Claude Code 的私有 ToS 明確不允許這樣做。如果你的團隊需要在內部工具中嵌入 AI coding 能力,這是一個真正有法律意義的區別。
Google Workspace 原生整合:Claude Code 沒有的優勢
這是 Gemini CLI 相對 Claude Code 的真正差異化護城河——不是「功能更多」的量化比較,而是一個 Claude Code 完全沒有對應能力的使用場景。
具體能做什麼
Gemini CLI 的 Workspace extension(Google Cloud Community 教學系列,截至 2026 年 4 月)提供 Gmail、Drive、Docs、Calendar、Sheets 等 agent skills,涵蓋:
- Gmail:從終端搜尋、分類、摘要郵件
- Google Drive:搜尋和讀取文件內容,產出文件摘要
- Google Docs:直接從 CLI 建立或編輯文件
- Google Calendar:查詢行程、建立排程
- Google Sheets:讀取和處理試算表資料
實際應用場景
搭配 headless mode,你可以將這些能力腳本化:
# 每天早上自動摘要未讀郵件
gemini -p "Summarize my unread Gmail from the last 24 hours and save to daily-summary.md"
# 從 Drive 文件產出週報
gemini -p "Read the project-updates folder in Drive and create a weekly summary"
使用門檻
- 個人 Gmail 帳號可以使用基本功能
- 完整 Workspace 整合(組織層級文件存取、管理員功能)需要付費 Google Workspace 帳號
- 需要安裝 Workspace extension,非預裝功能;安裝指令:
gemini /extensions install @google/workspace - 操作方式是終端指令,但不需要寫程式碼——自然語言描述任務即可
- 注意:headless 模式下若 context 超出限制,CLI 可能靜默省略部分內容而不報錯,建議在重要自動化任務加上明確的輸出驗證步驟
對 Google Workspace 重度用戶來說,這代表了一個全新的自動化入口。在 Claude Code 裡,你沒有原生方式直接操作 Gmail 或 Drive。
免費 vs 付費決策框架
Gemini CLI 的免費層($0)對比 Claude Pro($20/月)看起來差距懸殊,但做決策不能只看價格。
2×2 決策矩陣
| 低精確度需求(原型/探索) | 高精確度需求(生產/重構) | |
|---|---|---|
| 輕度使用(每天 < 30 prompt) | ✅ Gemini CLI 免費層 | ⚠️ Gemini CLI + AI Studio Key |
| 重度使用(每天 > 30 prompt) | ⚠️ Gemini CLI + AI Studio Key | ❌ Claude Code 或付費 Gemini Pro |
各象限說明
- 輕度 + 低精確度:Gemini CLI 免費層完全夠用。Gemini Flash 預設模型處理探索性任務、文件閱讀、快速原型的品質可以接受
- 輕度 + 高精確度:免費層的 RPM 足夠,但 Flash 模型在複雜多檔案重構的精確度低於 Claude Code(SWE-bench Verified 基準:Claude 3.5 Sonnet 49%,Gemini 相對較低)。建議用 AI Studio API key 切換到 Gemini 2.5 Pro
- 重度 + 低精確度:60 RPM 會頻繁觸發限流,需要 AI Studio API key 解鎖更高配額
- 重度 + 高精確度:這是 Claude Code 的主場。或者使用付費的 Gemini 2.5 Pro 方案
注意:上述精確度比較基於 SWE-bench Verified 基準測試數據,不同版本和任務類型的表現可能有差異,僅作為參考指標。
混合策略
對大多數 indie maker 而言,最務實的做法是:
- Gemini CLI:用於探索新想法、閱讀大型 codebase(1M token 上下文優勢)、Google Workspace 自動化
- Claude Code:用於精確度要求高的多檔案重構、需要穩定品質的生產任務
兩者不是二選一的關係,而是互補。
Gemini CLI vs Claude Code:場景分流決策樹
我們每天使用 Claude Code 做內容系統開發,同時在原型探索和大量文件讀取的場景測試 Gemini CLI。以下的比較來自實際使用經驗,不是規格表對照。
三個分叉點
分叉點 1:你需要 Google Workspace 整合嗎?
如果你的工作流重度依賴 Gmail、Drive、Docs,Gemini CLI 是目前唯一提供原生終端整合的 AI Agent。Claude Code 沒有對應功能,這個場景沒有替代方案。
分叉點 2:你需要 Apache 2.0 授權用於商業嵌入嗎?
如果你要將 AI coding CLI 嵌入公司的內部工具或商業產品,Gemini CLI 的 Apache 2.0 授權允許這樣做。Claude Code 的授權不允許。這是法律層面的區別,不是偏好問題。
分叉點 3:你需要最高精確度的複雜多檔案任務嗎?
根據我們的實際使用和 SWE-bench Verified 基準測試結果,Claude Code 在複雜多步驟除錯和多檔案重構的精確度上表現較好。如果你的日常工作以這類任務為主,Claude Code 仍然是更可靠的選擇。
另一方面,Gemini CLI 的 1M token 上下文在需要「讀完整個 codebase 再回答」的場景有明顯優勢。實際跑過後,在大型專案的程式碼理解任務上,Gemini CLI 因為能一次載入更多檔案,回答的完整度確實更好。
快速對照表
| 場景 | 建議工具 | 原因 |
|---|---|---|
| Google Workspace 自動化 | Gemini CLI | 唯一原生支援 |
| 商業產品嵌入 | Gemini CLI | Apache 2.0 授權 |
| 大型 codebase 理解 | Gemini CLI | 1M token 上下文 |
| 複雜多檔案重構 | Claude Code | SWE-bench 精確度較高 |
| 多步驟除錯 | Claude Code | loop 穩定性較好 |
| 零預算探索 | Gemini CLI | 免費層可用 |
| 生產環境 CI/CD | 視精確度需求 | 兩者皆可 |
相關閱讀:如果你對 AI coding CLI 的完整生態有興趣,可以參考我們的 AI Agent 框架比較指南。
Gemini CLI 上手完整清單(10 項)
按照以下順序操作,你可以在一個下午完成從安裝到進階設定的全部流程:
- 安裝 CLI:
npm install -g @google/gemini-cli - 認證:執行
gemini,完成 Google 帳號 OAuth 登入 - 確認工具清單:在互動模式輸入
/tools,確認內建工具(檔案讀寫、shell 執行、搜尋)可用 - 建立專案 GEMINI.md:在專案根目錄建立
./GEMINI.md,寫入技術堆疊和架構規範 - 建立全域 GEMINI.md:在
~/.gemini/GEMINI.md寫入通用規則(程式碼風格、語言偏好) - 設定第一個 MCP 伺服器:在
~/.gemini/settings.json加入 GitHub 或 file system MCP(參考上方設定範例) - 驗證 context 層級:使用
/memory show確認三層 GEMINI.md 的載入狀態 - 測試 headless mode:
gemini -p "your task"跑第一個自動化腳本 - 評估 RPM 使用量:觀察是否觸發 429 錯誤,決定是否申請 AI Studio API key
- Workspace 整合(選用):如果你是 Google Workspace 用戶,安裝官方 extension 解鎖 Gmail/Drive/Docs 操作
結論:Gemini CLI 最大的價值不是「免費的 Claude Code」
把 Gemini CLI 定位成「免費版 Claude Code」是最常見也最有害的誤解。它的真正價值在三個 Claude Code 做不到的地方:Apache 2.0 開源授權讓你能合法嵌入商業產品、Google Workspace 原生整合打開了非開發者的自動化入口、1M token 上下文讓大型 codebase 的理解任務成為可能。
同時,60 RPM 的費率限制、MCP 的企業 auth 相容性問題、GEMINI.md 的三層 context 堆疊複雜度,都是你需要提前了解的真實限制。
我們的建議取決於你是誰:
- Indie maker / 獨立開發者:採用混合策略,Gemini CLI 做探索,Claude Code 做精確任務,月成本可以從 $20 降到有效接近 $0 的探索成本
- Google Workspace 重度用戶:直接安裝 Gemini CLI + Workspace extension,這個場景沒有替代方案
- 團隊技術選型負責人:先跑 Apache 2.0 合規評估,確認你的使用場景是否需要嵌入授權,再決定是否投入團隊導入。注意 Google 基礎設施的穩定性風險:GitHub Issue 討論區有付費用戶(Gemini Code Assist)反映被降級��� Flash 模型的限流問題,對正式環境導入需納入此風險評估
FAQ
Gemini CLI 真的免費嗎?還是用到某個量就要付費?
Gemini CLI 本身完全免費且開源(Apache 2.0),使用個人 Google 帳號登入即可,不需要信用卡。免費層配額是每日 1,000 次請求(RPD)和每分鐘 60 次請求(RPM)。超過限額會收到 429 錯誤,但不會被收費。如果需要更高配額或使用 Gemini 2.5 Pro 模型,可以透過 Google AI Studio API key 或 Vertex AI 付費方案升級。
可以不用 Google 帳號、只用 API key 使用 Gemini CLI 嗎?
可以。Gemini CLI 支援兩種認證方式:(1) 個人 Google 帳號 OAuth 登入(最簡單,適合個人使用);(2) Google AI Studio API key(設定環境變數 GEMINI_API_KEY)。API key 方式不需要 Google 帳號登入流程,適合 CI/CD 或 headless 環境。但配額仍然受 API key 所屬專案的限制。
Gemini CLI 和 gemini.google.com 的聊天介面有什麼不同?
Gemini CLI 是終端環境的 AI Agent,可以直接操作你的檔案系統、執行 shell 指令、進行多步驟自動化任務(agentic loop)。gemini.google.com 是瀏覽器聊天介面,適合對話和文件生成。最大差異是 Gemini CLI 有工具使用能力(讀寫檔案、執行程式碼、MCP 整合),聊天介面沒有。
Gemini CLI 會把我的程式碼傳送到 Google 伺服器嗎?
會。Gemini CLI 需要將你的 prompt 和相關上下文(包括檔案內容)傳送到 Google 的 Gemini API 進行推理。這與所有雲端 AI coding 工具(Claude Code、GitHub Copilot)的運作方式相同。如果你的程式碼有保密性要求,建議檢閱 Google 的 Gemini API 資料使用政策。使用個人 Google 帳號時,Google 聲明免費層的資料可能用於改善產品。
Gemini CLI 支援 Windows 嗎?還是只有 macOS 和 Linux?
Gemini CLI 支援 macOS、Linux 和 Windows(透過 WSL 或原生 Node.js)。安裝方式統一為 npm install -g @google/gemini-cli。Windows 用戶建議使用 WSL2 以獲得最佳體驗,原生 Windows 的 shell 指令執行可能有相容性問題。

