Shareuhack | Gemini CLI 完整指南:免費 AI 終端 Agent 的真實能力與限制(2026)
Gemini CLI 完整指南:免費 AI 終端 Agent 的真實能力與限制(2026)

Gemini CLI 完整指南:免費 AI 終端 Agent 的真實能力與限制(2026)

April 19, 2026
LunaMiaEno
撰寫Luna·研究Mia·審查Eno·持續更新·14 分鐘閱讀

Gemini CLI 完整指南:免費 AI 終端 Agent 的真實能力與限制(2026)

Google 在 2025 年中開源了 Gemini CLI,一個能在終端直接操作檔案、執行指令、串接外部工具的 AI Agent。行銷重點是「免費、開源、1M token 上下文」,聽起來像是 Claude Code 的免費替代品。

但實際跑過幾週後,我們發現真實情況比行銷文案複雜得多。有些地方 Gemini CLI 確實做到 Claude Code 做不到的事(例如 Google Workspace 原生整合),但也有些限制是你不踩到不會發現的。

這篇指南的目的不是告訴你該選哪個,而是讓你在 5 分鐘內理解 Gemini CLI 的真實能力邊界,避免帶著錯誤期待入坑。

時效聲明:本文基於 2026 年 4 月的 Gemini CLI 官方文件和社群實踐。Google 的更新節奏快,具體配額、功能、MCP 相容性可能隨版本變動,建議搭配 Gemini CLI 官方文件使用。

TL;DR

  • 免費但有真實天花板:行銷說 1,000 RPD,但 60 RPM 才是你會先撞到的牆。Agentic loop 每個任務打多條子請求,10–15 個 prompt 就可能觸發限流
  • 不是「Google 版 Claude Code」:架構哲學根本不同——1M token 上下文、Apache 2.0 開源、Google Workspace 原生整合,這些是 Claude Code 沒有的
  • MCP 支援 ≠ 全部能用:社群伺服器(GitHub、Slack)運作良好,但企業工具的私有 auth(如 Atlassian)會直接失敗
  • 混合策略最實用:Gemini CLI 負責探索和原型,Claude Code 負責精確度要求高的任務

三個對 Gemini CLI 的常見誤解

在深入功能之前,先修正三個最常見的錯誤認知,避免你帶著錯誤期待走完整篇文章。

誤解一:「每天 1,000 次免費請求很夠用」

Google 的行銷數字是 1,000 RPD(requests per day),但免費層還有另一個限制:60 RPM(requests per minute)。在 agentic loop 裡,一個「審查這段程式碼」的任務可能觸發 5–10 條子請求(工具呼叫、上下文刷新、確認回合)。GitHub Discussions #2436 的用戶報告顯示,單次 session 10–15 個 prompt 就撞上 429 錯誤,從來沒接近過每日 1,000 次的上限。真實瓶頸是 RPM,不是 RPD。

誤解二:「就是 Google 版的 Claude Code」

兩者都是終端 AI Agent,但底層設計分歧明顯:Gemini CLI 多模態優先、1M token 上下文窗口(Claude Code 約 200K);Apache 2.0 開源,可以 fork、審計、嵌入自己的產品;免費層使用 Gemini Flash 預設模型,不需要付費訂閱即可啟動。這些不是表面差異——它們代表不同的使用場景和採用策略。

誤解三:「支援 MCP 就代表所有工具都能接」

Gemini CLI 的 MCP 支援處理社群維護的伺服器(GitHub MCP、file system、Slack)表現良好。但需要私有 auth handshake 的企業服務——已確認案例是 Atlassian MCP——會完全失敗,因為 Gemini CLI 無法完成所需的 token 交換流程。「支援 MCP 協定」和「所有 MCP 伺服器都能用」是兩件事。


5 分鐘安裝 + 第一個 Agentic 任務

整個安裝流程只需要 Node.js 18+ 和一個 Google 帳號。

安裝

npm install -g @google/gemini-cli

安裝完成後執行 gemini 啟動 CLI,首次使用會引導你完成 Google 帳號 OAuth 認證。

兩種認證方式

方式適用場景設定方法
Google 帳號 OAuth個人使用、快速上手啟動後瀏覽器自動跳轉授權
AI Studio API KeyCI/CD、headless、需要更高配額export GEMINI_API_KEY=your-key

個人 Google 帳號登入就夠用,不需要 Workspace 帳號或付費訂閱。如果你需要 headless 環境(CI/CD pipeline、排程腳本),使用 API key 方式。

第一個 Agentic 任務

認證完成後,給 Gemini CLI 一個有意義的任務來驗證 agent 能力:

gemini -p "Review the code in src/ directory, identify potential bugs, and create a summary in review.md"

這個指令會觸發 Gemini CLI 的 agentic loop:讀取檔案 → 分析程式碼 → 撰寫摘要 → 寫入檔案。如果你看到它自動切換工具、讀取多個檔案並產出結果,安裝就算成功。

提示-p 旗標是非互動模式(headless),直接傳入 prompt 並執行完畢後退出。互動模式直接輸入 gemini 即可。


費率限制的真相:60 RPM 才是真正的天花板

這一段對每個想認真使用 Gemini CLI 的人都很關鍵。

免費層的實際配額結構

根據 Google 官方文件,免費個人帳號(Personal Google Account)的限制是:

限制類型配額說明
RPM(每分鐘請求數)60這是你會先撞到的牆
RPD(每日請求數)1,000行銷重點,但幾乎不會先觸及
TPM(每分鐘 token 數)依模型而異Gemini Flash 較寬鬆

為什麼 RPM 是真正的瓶頸?

Agentic loop 的每個「任務」不等於一個 API 請求。一個「幫我重構這個函數」的指令,Gemini CLI 內部可能產生:

  1. 讀取目標檔案(1 次工具呼叫)
  2. 分析程式碼結構(1 次推理)
  3. 讀取相關依賴(2–3 次工具呼叫)
  4. 生成重構方案(1 次推理)
  5. 寫入修改(1 次工具呼叫)
  6. 確認結果(1 次推理)

一個看似簡單的任務就消耗了 7–8 個請求。在 60 RPM 的限制下,連續操作 7–8 分鐘就可能觸發限流。GitHub 上的用戶回報證實了這個模式:10–15 個 prompt 後收到 429 錯誤。

應對策略

  • 切換 AI Studio API key:如果你需要穩定的 RPM,透過 Google AI Studio 申請 API key,付費方案解鎖更高的 RPM 上限
  • 降低 context size:減少每次請求附帶的檔案數量,降低 token 消耗
  • Rate limit 觸發後的行為:遇到 429 錯誤時,Gemini CLI 不會自動 retry——它會中止當前任務並顯示錯誤訊息。若在 CI/CD 中使用,需在腳本層處理 retry 邏輯(例如加入 exponential backoff 的 wrapper)
  • 團隊注意:配額是 per-project 而非 per-key,多個 API key 不會乘以配額,建議參考 Google AI for Developers 配額文件確認最新限制。團隊評估時需要把這個因素計入成本

MCP 整合的邊界:哪些能用,哪些會壞

Gemini CLI 支援 Model Context Protocol(MCP),讓你可以把外部工具接入 CLI。但「支援 MCP」和「所有 MCP 伺服器都能跑」差距很大。

能用的:社群維護伺服器

MCP 伺服器傳輸協定狀態
GitHub MCPSTDIO穩定
File SystemSTDIO穩定
SlackSTDIO穩定
Google SearchSSE穩定

會壞的:企業私有 auth

已確認的失敗案例:Atlassian MCP。原因是 Gemini CLI 無法完成 Atlassian 要求的私有 token 交換流程。這不是 Gemini CLI 的 bug,而是 MCP 協定層面沒有統一企業 auth 標準的問題。

隱性風險:JSON Schema 被靜默修改

Gemini CLI 為了符合 Gemini API 格式,會自動 strip 掉 $schemaadditionalProperties JSON schema 屬性。如果你的 MCP 伺服器依賴嚴格的 schema 驗證,可能會在沒有錯誤訊息的情況下靜默失敗。

MCP 設定範例

~/.gemini/settings.json 中新增 MCP 伺服器:

{
  "mcpServers": {
    "github": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-github"],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "ghp_your_token"
      },
      "transport": "stdio"
    },
    "filesystem": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-filesystem", "/path/to/allowed/dir"],
      "transport": "stdio"
    }
  }
}

建議:整合新的 MCP 伺服器前,先確認該服務的 auth 機制是否為標準 OAuth 或 API key。需要私有 token 交換的服務(Atlassian、部分企業 SaaS)目前應預期不相容。


GEMINI.md 層級架構:比 CLAUDE.md 更複雜的 context 系統

如果你用過 Claude Code 的 CLAUDE.md,可能會以為 GEMINI.md 是同樣的東西。結構上類似,但行為差異足以讓你踩到坑。

三層堆疊機制

Gemini CLI 按以下順序載入 GEMINI.md,全部串接後送入每個 prompt:

1. ~/.gemini/GEMINI.md    (全域層 — 所有專案共用)
2. ./GEMINI.md            (專案層 — 專案根目錄)
3. ./src/GEMINI.md        (子目錄層 — 特定資料夾)

三層的內容會被串接而非覆蓋。這意味著 context 在層級間靜默累積,子目錄規則不會取代全域規則,而是追加在後面。

與 CLAUDE.md 的行為差異

特性GEMINI.mdCLAUDE.md
載入層級三層(全域 + 專案 + 子目錄)單層(每專案一個)
層級關係串接累積無層級問題
可視工具/memory show直接檢視檔案
context 膨脹風險高(三層疊加)

實用建議

  • 全域層~/.gemini/GEMINI.md):只放真正通用的規則,例如程式碼風格偏好、語言設定
  • 專案層./GEMINI.md):放 project-specific 規範,例如技術堆疊、架構約束
  • 避免在子目錄層定義衝突規則:因為串接機制,子目錄的規則是「追加」而非「覆蓋」,衝突規則會讓 Gemini 的行為變得不可預測
  • 定期用 /memory show 檢查:這是唯一能看到 Gemini CLI 實際載入了哪些 context 的方式

Apache 2.0 對開發者的實際意義

Gemini CLI 採用 Apache 2.0 授權,這在 AI coding CLI 中是獨特的定位(Claude Code 是 Anthropic 私有授權)。但「開源」的實際意義比直覺想像的更微妙。

你可以做什麼

  • Fork 用於內部工具:合法地將 Gemini CLI 嵌入你公司的開發工具鏈,不需要額外授權
  • 審計原始碼:確認 CLI 對你的程式碼做了什麼處理、資料如何傳送,這對合規審查很重要
  • 修改後不需公開:Apache 2.0 不要求你公開修改過的原始碼(不同於 GPL)

這不代表什麼

  • Fork ≠ 維護責任消失:第三方 fork 可能附帶不同的預設行為。如果你團隊使用的是非官方 fork 或鎖定舊版本,可能獲得與官方版本不同的體驗,且需自行承擔安全更新和相容性維護
  • 開源 ≠ 更安全:透明度確實提高了,但你需要主動版本管理策略。Google 官方版本有持續更新,但你 fork 出去的版本不會自動同步

對比 Claude Code 的授權差距

這不是「感覺上更開放」的差異。Apache 2.0 允許你將 Gemini CLI 嵌入商業產品並銷售,Claude Code 的私有 ToS 明確不允許這樣做。如果你的團隊需要在內部工具中嵌入 AI coding 能力,這是一個真正有法律意義的區別。


Google Workspace 原生整合:Claude Code 沒有的優勢

這是 Gemini CLI 相對 Claude Code 的真正差異化護城河——不是「功能更多」的量化比較,而是一個 Claude Code 完全沒有對應能力的使用場景。

具體能做什麼

Gemini CLI 的 Workspace extension(Google Cloud Community 教學系列,截至 2026 年 4 月)提供 Gmail、Drive、Docs、Calendar、Sheets 等 agent skills,涵蓋:

  • Gmail:從終端搜尋、分類、摘要郵件
  • Google Drive:搜尋和讀取文件內容,產出文件摘要
  • Google Docs:直接從 CLI 建立或編輯文件
  • Google Calendar:查詢行程、建立排程
  • Google Sheets:讀取和處理試算表資料

實際應用場景

搭配 headless mode,你可以將這些能力腳本化:

# 每天早上自動摘要未讀郵件
gemini -p "Summarize my unread Gmail from the last 24 hours and save to daily-summary.md"

# 從 Drive 文件產出週報
gemini -p "Read the project-updates folder in Drive and create a weekly summary"

使用門檻

  • 個人 Gmail 帳號可以使用基本功能
  • 完整 Workspace 整合(組織層級文件存取、管理員功能)需要付費 Google Workspace 帳號
  • 需要安裝 Workspace extension,非預裝功能;安裝指令:gemini /extensions install @google/workspace
  • 操作方式是終端指令,但不需要寫程式碼——自然語言描述任務即可
  • 注意:headless 模式下若 context 超出限制,CLI 可能靜默省略部分內容而不報錯,建議在重要自動化任務加上明確的輸出驗證步驟

對 Google Workspace 重度用戶來說,這代表了一個全新的自動化入口。在 Claude Code 裡,你沒有原生方式直接操作 Gmail 或 Drive。


免費 vs 付費決策框架

Gemini CLI 的免費層($0)對比 Claude Pro($20/月)看起來差距懸殊,但做決策不能只看價格。

2×2 決策矩陣

低精確度需求(原型/探索)高精確度需求(生產/重構)
輕度使用(每天 < 30 prompt)✅ Gemini CLI 免費層⚠️ Gemini CLI + AI Studio Key
重度使用(每天 > 30 prompt)⚠️ Gemini CLI + AI Studio Key❌ Claude Code 或付費 Gemini Pro

各象限說明

  • 輕度 + 低精確度:Gemini CLI 免費層完全夠用。Gemini Flash 預設模型處理探索性任務、文件閱讀、快速原型的品質可以接受
  • 輕度 + 高精確度:免費層的 RPM 足夠,但 Flash 模型在複雜多檔案重構的精確度低於 Claude Code(SWE-bench Verified 基準:Claude 3.5 Sonnet 49%,Gemini 相對較低)。建議用 AI Studio API key 切換到 Gemini 2.5 Pro
  • 重度 + 低精確度:60 RPM 會頻繁觸發限流,需要 AI Studio API key 解鎖更高配額
  • 重度 + 高精確度:這是 Claude Code 的主場。或者使用付費的 Gemini 2.5 Pro 方案

注意:上述精確度比較基於 SWE-bench Verified 基準測試數據,不同版本和任務類型的表現可能有差異,僅作為參考指標。

混合策略

對大多數 indie maker 而言,最務實的做法是:

  • Gemini CLI:用於探索新想法、閱讀大型 codebase(1M token 上下文優勢)、Google Workspace 自動化
  • Claude Code:用於精確度要求高的多檔案重構、需要穩定品質的生產任務

兩者不是二選一的關係,而是互補。


Gemini CLI vs Claude Code:場景分流決策樹

我們每天使用 Claude Code 做內容系統開發,同時在原型探索和大量文件讀取的場景測試 Gemini CLI。以下的比較來自實際使用經驗,不是規格表對照。

三個分叉點

分叉點 1:你需要 Google Workspace 整合嗎?

如果你的工作流重度依賴 Gmail、Drive、Docs,Gemini CLI 是目前唯一提供原生終端整合的 AI Agent。Claude Code 沒有對應功能,這個場景沒有替代方案。

分叉點 2:你需要 Apache 2.0 授權用於商業嵌入嗎?

如果你要將 AI coding CLI 嵌入公司的內部工具或商業產品,Gemini CLI 的 Apache 2.0 授權允許這樣做。Claude Code 的授權不允許。這是法律層面的區別,不是偏好問題。

分叉點 3:你需要最高精確度的複雜多檔案任務嗎?

根據我們的實際使用和 SWE-bench Verified 基準測試結果,Claude Code 在複雜多步驟除錯和多檔案重構的精確度上表現較好。如果你的日常工作以這類任務為主,Claude Code 仍然是更可靠的選擇。

另一方面,Gemini CLI 的 1M token 上下文在需要「讀完整個 codebase 再回答」的場景有明顯優勢。實際跑過後,在大型專案的程式碼理解任務上,Gemini CLI 因為能一次載入更多檔案,回答的完整度確實更好。

快速對照表

場景建議工具原因
Google Workspace 自動化Gemini CLI唯一原生支援
商業產品嵌入Gemini CLIApache 2.0 授權
大型 codebase 理解Gemini CLI1M token 上下文
複雜多檔案重構Claude CodeSWE-bench 精確度較高
多步驟除錯Claude Codeloop 穩定性較好
零預算探索Gemini CLI免費層可用
生產環境 CI/CD視精確度需求兩者皆可

相關閱讀:如果你對 AI coding CLI 的完整生態有興趣,可以參考我們的 AI Agent 框架比較指南


Gemini CLI 上手完整清單(10 項)

按照以下順序操作,你可以在一個下午完成從安裝到進階設定的全部流程:

  1. 安裝 CLInpm install -g @google/gemini-cli
  2. 認證:執行 gemini,完成 Google 帳號 OAuth 登入
  3. 確認工具清單:在互動模式輸入 /tools,確認內建工具(檔案讀寫、shell 執行、搜尋)可用
  4. 建立專案 GEMINI.md:在專案根目錄建立 ./GEMINI.md,寫入技術堆疊和架構規範
  5. 建立全域 GEMINI.md:在 ~/.gemini/GEMINI.md 寫入通用規則(程式碼風格、語言偏好)
  6. 設定第一個 MCP 伺服器:在 ~/.gemini/settings.json 加入 GitHub 或 file system MCP(參考上方設定範例)
  7. 驗證 context 層級:使用 /memory show 確認三層 GEMINI.md 的載入狀態
  8. 測試 headless modegemini -p "your task" 跑第一個自動化腳本
  9. 評估 RPM 使用量:觀察是否觸發 429 錯誤,決定是否申請 AI Studio API key
  10. Workspace 整合(選用):如果你是 Google Workspace 用戶,安裝官方 extension 解鎖 Gmail/Drive/Docs 操作

結論:Gemini CLI 最大的價值不是「免費的 Claude Code」

把 Gemini CLI 定位成「免費版 Claude Code」是最常見也最有害的誤解。它的真正價值在三個 Claude Code 做不到的地方:Apache 2.0 開源授權讓你能合法嵌入商業產品、Google Workspace 原生整合打開了非開發者的自動化入口、1M token 上下文讓大型 codebase 的理解任務成為可能。

同時,60 RPM 的費率限制、MCP 的企業 auth 相容性問題、GEMINI.md 的三層 context 堆疊複雜度,都是你需要提前了解的真實限制。

我們的建議取決於你是誰:

  • Indie maker / 獨立開發者:採用混合策略,Gemini CLI 做探索,Claude Code 做精確任務,月成本可以從 $20 降到有效接近 $0 的探索成本
  • Google Workspace 重度用戶:直接安裝 Gemini CLI + Workspace extension,這個場景沒有替代方案
  • 團隊技術選型負責人:先跑 Apache 2.0 合規評估,確認你的使用場景是否需要嵌入授權,再決定是否投入團隊導入。注意 Google 基礎設施的穩定性風險:GitHub Issue 討論區有付費用戶(Gemini Code Assist)反映被降級��� Flash 模型的限流問題,對正式環境導入需納入此風險評估

FAQ

Gemini CLI 真的免費嗎?還是用到某個量就要付費?

Gemini CLI 本身完全免費且開源(Apache 2.0),使用個人 Google 帳號登入即可,不需要信用卡。免費層配額是每日 1,000 次請求(RPD)和每分鐘 60 次請求(RPM)。超過限額會收到 429 錯誤,但不會被收費。如果需要更高配額或使用 Gemini 2.5 Pro 模型,可以透過 Google AI Studio API key 或 Vertex AI 付費方案升級。

可以不用 Google 帳號、只用 API key 使用 Gemini CLI 嗎?

可以。Gemini CLI 支援兩種認證方式:(1) 個人 Google 帳號 OAuth 登入(最簡單,適合個人使用);(2) Google AI Studio API key(設定環境變數 GEMINI_API_KEY)。API key 方式不需要 Google 帳號登入流程,適合 CI/CD 或 headless 環境。但配額仍然受 API key 所屬專案的限制。

Gemini CLI 和 gemini.google.com 的聊天介面有什麼不同?

Gemini CLI 是終端環境的 AI Agent,可以直接操作你的檔案系統、執行 shell 指令、進行多步驟自動化任務(agentic loop)。gemini.google.com 是瀏覽器聊天介面,適合對話和文件生成。最大差異是 Gemini CLI 有工具使用能力(讀寫檔案、執行程式碼、MCP 整合),聊天介面沒有。

Gemini CLI 會把我的程式碼傳送到 Google 伺服器嗎?

會。Gemini CLI 需要將你的 prompt 和相關上下文(包括檔案內容)傳送到 Google 的 Gemini API 進行推理。這與所有雲端 AI coding 工具(Claude Code、GitHub Copilot)的運作方式相同。如果你的程式碼有保密性要求,建議檢閱 Google 的 Gemini API 資料使用政策。使用個人 Google 帳號時,Google 聲明免費層的資料可能用於改善產品。

Gemini CLI 支援 Windows 嗎?還是只有 macOS 和 Linux?

Gemini CLI 支援 macOS、Linux 和 Windows(透過 WSL 或原生 Node.js)。安裝方式統一為 npm install -g @google/gemini-cli。Windows 用戶建議使用 WSL2 以獲得最佳體驗,原生 Windows 的 shell 指令執行可能有相容性問題。

這篇文章對你有幫助嗎?