Shareuhack | OWASP Agentic AI 安全成熟度評估框架 2026:你的 Agent 安全達到幾級了?
OWASP Agentic AI 安全成熟度評估框架 2026:你的 Agent 安全達到幾級了?

OWASP Agentic AI 安全成熟度評估框架 2026:你的 Agent 安全達到幾級了?

發布於 June 6, 2026·更新於 June 8, 2026
LunaMiaEno
撰寫Luna·研究Mia·審查Eno·持續更新·12 分鐘閱讀

OWASP Agentic AI 安全成熟度評估框架 2026:你的 Agent 安全達到幾級了?

83% 的組織計畫部署 agentic AI,但只有 29% 認為有能力保護它(Cisco State of AI Security 2026,via Practical DevSecOps)。這 54 個百分點的落差說明了什麼?問題不是「有沒有做安全」,而是「做到了哪個層級」。很多團隊裝了 Promptfoo、設了 WAF,就以為完成了;但根據 OWASP 在 2026 年 6 月正式發布的 Enterprise Adoption Maturity Model,這類做法頂多只到 Level 1(事後響應),距離可以負責任地生產部署的 Level 2,還有一段明確的鴻溝。

本文解析 OWASP 官方框架的完整二維矩陣(採用層級 AT0-AT5 × 治理成熟度 Level 0-3),補強 OWASP Agentic Top 10 中最常被忽略的 3 個多 agent 威脅(ASI06/ASI07/ASI08),並提供可操作的自評方法與升級路線圖。

TL;DR

  • OWASP 官方定義二維矩陣:6 個採用層級(AT0-AT5)× 4 個治理成熟度(Level 0-3)
  • 79% 組織停在 Level 1:有工具、無治理(Practical DevSecOps, 2026)
  • 3 個最常被忽略的多 agent 威脅:ASI06(記憶體毒化)、ASI07(agent 間通訊)、ASI08(串聯故障)
  • Level 1 到 Level 2 的關鍵不是更強的過濾器,而是可觀測性:工具調用日誌 + 命名所有者
  • OWASP 官方目前定義到 Level 3;Level 4-5 是 Practical DevSecOps / SANS / CSA 等業界框架的延伸,非 OWASP 官方定義

為什麼「有安全工具」不等於「安全成熟」

這是最常見的認知陷阱:裝了 Promptfoo 或 LLM Guard,就認為安全工作做好了。

Practical DevSecOps 的調查數據很直接:79% 的組織停在 Level 1(Reactive)(Practical DevSecOps AI Security Maturity Model 2026,樣本為其訓練學員與企業客戶群體)。Level 1 的真實樣貌是:有基本 prompt 過濾、有 WAF 擋在 LLM 前端、出了 incident 才啟動響應。但它沒有的東西更重要:

  • 沒有 AI 資產清單(不知道組織裡跑了哪些 agent)
  • 沒有工具調用日誌(agent 做了什麼沒有可追溯記錄)
  • 沒有命名所有者(出事了誰負責,不清楚)

成熟度框架的核心認知翻轉是:從「點狀防護」到「系統性治理」。就像有防火牆不等於有成熟的網絡安全姿態,有 LLM 過濾器不等於有 agentic AI 治理能力。

Level 2 的入場券是可觀測性,不是更強的過濾器。你能不能知道你的 agent「現在正在做什麼」、「剛才做了什麼」、「誰批准了這個操作」——這三個問題回答得出來,才算進入 Level 2。


OWASP Agentic AI Top 10 完整清單(ASI01-ASI10)

OWASP Top 10 for Agentic Applications 2026 定義了 10 個威脅(官方編號 ASI01-ASI10)。下表整理完整清單,並標注哪些已有完整繁中資源覆蓋:

代碼威脅名稱核心風險繁中資源覆蓋狀況
ASI01Agent Goal Hijack攻擊者透過直接/間接注入操控 agent 目標已覆蓋
ASI02Tool Misuse & Exploitation不安全的工具組合或過度調用產生有害結果部分覆蓋
ASI03Agent Identity & Privilege Abuse跨 agent 信任鏈的未授權操作已覆蓋
ASI04Agentic Supply Chain Compromise外部 agent、工具、schema、prompt 遭入侵已覆蓋
ASI05Unexpected Code ExecutionAgent 生成或觸發的代碼在未隔離環境執行已覆蓋
ASI06Memory & Context Poisoning記憶或上下文狀態的注入/洩漏,影響未來推理未覆蓋
ASI07Insecure Inter-Agent CommunicationAgent 間訊息遭攔截、注入或偽造未覆蓋
ASI08Cascading Agent Failures小型 agent 故障傳播,造成大規模衝擊未覆蓋
ASI09Human-Agent Trust Exploitation利用人類對 agent 的過度信任操控行為間接提及
ASI10Rogue AgentsAgent 因目標漂移或意外行為超越預期目標間接提及

ASI01-ASI05 的技術防護細節,可參考 OWASP Agentic AI 安全防護指南,這篇文章有完整的實作方法。

以下重點展開 3 個缺口威脅:

ASI06 記憶體毒化:最被低估的持久性威脅

為什麼危險:89% 的 agent 跨用戶/session 共享記憶體且無完整性驗證(Repello AI 2026 企業安全路線圖報告)。

一般 prompt injection 是即時攻擊,當次 session 結束就結束了。ASI06 記憶體毒化的特徵是「低頻植入、持久影響」——攻擊者在一次 session 中注入惡意資訊進入 agent 的長期記憶庫,後續數週的 agent 推理都可能受影響(Repello AI 2026 企業安全路線圖報告),且難以追溯攻擊發生點。

典型攻擊路徑

  1. 攻擊者透過一次 session 向 agent 記憶庫注入「用戶偏好」類的惡意資料
  2. 下次不同用戶使用 agent 時,毒化記憶體影響 agent 行為
  3. RAG 資料源投毒:汙染向量資料庫,影響所有依賴該知識庫的 agent

防護方法:按用戶/租戶隔離記憶體、對每個記憶體條目標記來源和 session、使用次要模型驗證記憶體寫入、設置記憶體條目過期機制。

ASI07 Agent 間通訊攻擊:多 Agent 架構的盲點

為什麼危險:多 agent 架構(orchestrator + sub-agents)在 2026 年成為主流。Agent 間通訊通常假設信任,但沒有加密或認證。

典型攻擊方式

  • MitM(中間人):攔截 A2A 或 MCP 協議的訊息
  • 注入:向 sub-agent 注入惡意指令,偽裝成 orchestrator 的合法指令
  • 重播攻擊:重複使用截獲的舊指令觸發意外行為
  • 身份偽冒:偽裝成合法 agent 發送指令

防護方法:為每個 agent 分配獨特加密身份(SPIFFE/SPIRE、inter-agent mTLS)、對 agent 間訊息進行簽名、每次下游請求都重新授權、完整記錄所有 agent 間通訊。

ASI08 串聯故障:架構設計層級的問題

為什麼危險:76% 的多 agent 系統缺乏 circuit breaker(Repello AI 2026 企業安全路線圖報告)。在 orchestrated multi-agent 系統中,一個子系統被入侵等同於整個 agent 網絡面臨威脅。

類比:2003 年美加大停電不是發電廠本身的問題,而是故障傳播機制沒有截斷點。ASI08 的問題同樣是架構設計問題,不是單點漏洞。

典型故障模式:一個被入侵的 agent 在多 agent 管道中傳播惡意指令;資源耗盡(一個 agent 觸發過度工具調用,消耗下游系統資源);狀態汙染(毒化輸出成為另一個 agent 的輸入)。

防護方法:實施 circuit breaker、設計安全失敗模式(agent 失敗時暫停並升級到人類,而非繼續)、隔離 agent 邊界、為可逆操作建立事務回滾機制。


OWASP Enterprise Adoption Maturity Model 解析

OWASP State of Agentic AI Security and Governance v2.01(2026 年 6 月 1 日)定義了一個二維矩陣:你部署了什麼(採用層級),以及你的治理做到什麼程度(治理成熟度)。

重要提醒:這兩個維度相互獨立。一個組織可以同時是 AT4(有代碼執行能力的 agent)但仍停在 Level 0(完全沒有治理)。這是最常見的高風險組合,也是最容易被忽略的診斷盲點。

維度一:採用層級 AT0-AT5(你部署了什麼)

層級名稱典型特徵
AT0Shadow AI組織未知情或未核准的 AI 工具使用
AT1Vendor Embedded Assistant完全由廠商控制的 AI 助理(你消費,不建置)
AT2Platform IntegratedAI 原生平台使用你的資料,但無法執行任意代碼
AT3Citizen Developer Agent低代碼/無代碼平台,用戶配置流程但不寫代碼,操作真實組織資料
AT4Code Executing Agent生成並執行代碼,具有本地或雲端權限
AT5Custom In-House Agent組織自建系統,控制身份、工具和邊界

安全責任的轉移點在 AT3:從 AT1-AT2 的「廠商主要負責」,轉為「組織必須主動治理」。AT4-AT5 的安全責任幾乎完全落在組織自身。

維度二:治理成熟度 Level 0-3(你的治理做到哪)

層級名稱核心特徵
Level 0Unaware and Ad Hoc無正式治理認識,影子 IT 實驗,日誌最少,使用通用 IT 事故處理
Level 1Experimentation Without Guardrails試點專案缺乏自主限制和決策範圍,偶爾紅隊測試,無持續監控,問責制模糊
Level 2Policy-Defined, Human-in-the-Loop正式政策、法規對齊(EU AI Act、GDPR),高影響決策需人工確認,命名所有者,建立日誌和版本控制
Level 3Integrated, Continuous OversightAgentic AI 視為關鍵基礎設施,即時儀表板、kill switches、治理即代碼(Governance-as-code)

OWASP 官方框架目前定義到 Level 3。業界有些框架(Practical DevSecOps 到 Level 4,SANS 到 Stage 5,CSA 到 Level 4)有更高層級的定義,但這些是各家機構自己的延伸框架,非 OWASP 官方標準,引用時需注意來源區別。

二維矩陣:高風險組合

Level 0Level 1Level 2Level 3
AT1-AT2低風險可接受超標準超標準
AT3中風險需改善最低要求良好
AT4高風險需立即改善最低要求目標
AT5極高風險不應部署最低要求良好

AT4-AT5 + Level 0-1 是需要立即關注的組合。AT3 + Level 0-1 屬於中高風險:AT3(公民開發者 agent)操作真實組織資料,雖然無任意代碼執行,但資料外洩和未授權操作的風險仍然存在,仍需至少達到 Level 2。根據上面的 54% 落差數據,大量組織正處於這個高風險位置。


安全成熟度自評方法

5 維度評分法(Practical DevSecOps, 2026)

各維度 0-10 分,總分對應成熟度層級:

維度0 分(Level 0)5 分(Level 1-2 邊界)10 分(Level 3)
AI 資產清單完全不知道有哪些 agent知道主要 agent,影子 AI 未盤點完整清單含影子 AI
政策與合規無任何 AI 政策有通用 AI 政策,未映射到法規正式政策對齊監管框架
監控與偵測無監控有基本 alert,無 runtime 監控即時工具調用監控
測試與驗證從未進行安全測試偶爾紅隊測試,無定期計畫每季紅隊 + 持續自動化測試
事故響應使用通用 IT 流程有 AI 專屬 playbook 但未演練演練過的 AI 事故處理流程

評分標準:0-10 = Level 0,11-25 = Level 1,26-40 = Level 2,41-50 = Level 3

79% 的組織按這個評分只能到 Level 1(11-25 分),主要拉低分數的是「監控與偵測」和「AI 資產清單」兩個維度。

企業版 vs. 個人開發者版的現實差異

企業版 Level 2 門檻

  • 命名的 agent 所有者(每個 agent 都知道誰負責)
  • 高影響操作的人工確認流程
  • 工具調用完整日誌,每次操作捕獲:agent 身份、授權者、存取資料、操作內容、政策結果、時間戳
  • NIST AI RMF 四個功能對齊(Govern/Map/Measure/Manage)
  • 每季紅隊測試

個人開發者 / 小型工具的 Level 2 門檻(現實可行版):

  • 工具調用基本日誌(記錄 agent 做了什麼、什麼時候做的)
  • 每個工具明確最小化(只給 agent 需要的工具,不開放全部)
  • 每個 agent 使用獨立身份(非共享帳號或 API Key)
  • 至少每次發布前跑一次手動安全審查

CISA 標準的 SHA-256 hash chain 日誌和 6 個月保留,對個人開發者不切實際。重要的是開始建立可觀測性的習慣,而不是完美符合企業合規標準。


從 Level 1 到 Level 3 的 90 天路線圖

來源:Repello AI 2026 年 OWASP Agentic AI Top 10 企業實施路線圖。

Phase 1(第 1-4 週):能見度建立

  • 清點所有 agent 部署,包含影子 AI
  • 對每個 agent 進行爆炸半徑評估(如果這個 agent 被入侵,最壞情況是什麼)
  • 建立 ASI 風險基線(對照 ASI01-ASI10 逐一確認有無對應控制)

Phase 2(第 5-8 週):快速修復

  • 縮小 service account 權限,實施短效憑證
  • 沙箱化代碼執行環境
  • 按用戶/租戶隔離 agent 記憶體(解決 ASI06 最低要求)
  • 建立工具調用日誌(Level 2 的最低要求)

Phase 3(第 9-12 週):主動防禦

  • 部署目標變更和工具誤用的預執行驗證
  • 實施行為異常偵測
  • 用簽名認證強化供應鏈(解決 ASI04)
  • 為多 agent 系統加入 circuit breaker(解決 ASI08)

Phase 4(持續):持續驗證

  • 針對 agentic 攻擊向量進行專業化紅隊測試
  • 維護行為基線並定期重新驗證
  • 建立 Governance-as-code 自動化政策執行

個人開發者的簡化路徑

完成 Phase 1 + Phase 2 的基礎工作(清單、最小化工具、工具調用日誌)就能達到適合個人工具的 Level 2 標準。Phase 3-4 是企業優先項。具體起點:

  1. 清單:列出你的 agent 使用的所有工具(shell、filesystem、API),確認每個工具的最小化授權
  2. 日誌:每次工具調用記錄 agent 身份、時間戳、操作內容(可以是簡單的 JSONL 日誌檔)
  3. 身份隔離:每個 agent 使用獨立 API key,不和其他服務共享

各成熟度層級的真實樣貌

以下場景根據 OWASP Level 定義描述典型組織的實際狀況,並非聲稱特定組織的親身經歷。

Level 0 典型場景:獨立開發者用 Claude Code 做 side project,從未審查工具權限,agent 有 shell 存取但不知道有沒有洩漏 API key。發生異常時用通用方式處理,沒有 AI 專屬 incident 流程。

Level 1 典型場景:小型 SaaS 公司,有部署 LLM Guard 在 API 前端,也有基本的 prompt 過濾。但沒有 AI 資產清單(不知道還有哪些 agent 在跑);因為一次 API key 洩漏事件,才開始臨時跑安全掃描。問責制模糊。

Level 2 典型場景:中型企業,有建立 AI 資產清單、每季進行一次紅隊測試、工具調用有基本日誌記錄。每個高影響決策需要人工確認。但監控是定期批次,不是即時告警。

Level 3 典型場景:大型金融機構或受監管行業,real-time dashboard 追蹤 agent 行為漂移;有 kill switches 可以即時暫停自主性;治理政策機器可讀、自動在 AI 生命週期中執行;每個決策完整可追溯。


結論

先花 5 分鐘做一次自評:對照上面的 5 維度評分表,把你的系統給個分數。如果總分在 11-25 之間,你在 Level 1,和 79% 的組織一樣(Practical DevSecOps, 2026)。

接下來的決策路徑很清楚:

如果你是個人開發者或小型工具,AT1-AT2 的優先行動是確認廠商的安全政策;AT4-AT5 則是把 Phase 1 + Phase 2 的基礎工作(工具最小化 + 工具調用日誌 + 獨立 agent 身份)優先排進這個月的開發計畫。

如果你是企業安全或工程主管,Level 2 是可以負責任地生產部署的最低門檻。根據 OWASP 框架,在沒有命名所有者、沒有工具調用日誌、沒有人工確認機制的情況下部署 AT4-AT5 的 agent,屬於 Level 0-1 的高風險組合,不建議上生產。

技術防護的具體實作(ASI01-ASI05 的工具鏈、配置方式、代碼層面的防護),可以到 OWASP Agentic AI 安全防護技術指南 繼續深入。

FAQ

OWASP Agentic AI 安全成熟度 Level 0-3 各代表什麼?

Level 0(Unaware and Ad Hoc):無正式治理,影子 IT 實驗;Level 1(Experimentation Without Guardrails):試點專案缺乏定義限制,問責制模糊;Level 2(Policy-Defined, Human-in-the-Loop):正式政策、命名所有者、高影響決策需人工確認;Level 3(Integrated, Continuous Oversight):即時儀表板、kill switches、治理即代碼。OWASP 官方目前定義到 Level 3。

如何評估我的 AI agent 系統在哪個成熟度層級?

使用 5 維度自評法:AI 資產清單完整性、政策與合規覆蓋、監控與偵測能力、測試與驗證頻率、事故響應成熟度,各項 0-10 分。總分 0-10 對應 Level 0,11-25 對應 Level 1,26-40 對應 Level 2,41-50 對應 Level 3。

AT 採用層級和治理成熟度 Level 有什麼不同?

AT 層級(AT0-AT5)描述「你部署了什麼類型的 agent」,從影子 AI 到自建系統。治理成熟度(Level 0-3)描述「你的安全治理做到什麼程度」。兩者相互獨立:一個組織可以是 AT4(有代碼執行能力的 agent)但仍停在 Level 0(完全沒有治理)。

ASI06 記憶體毒化和一般 prompt injection 有什麼差別?

Prompt injection 是即時攻擊,影響當次 session。ASI06 記憶體毒化是「低頻植入、持久影響」——攻擊者在一次 session 中汙染 agent 的長期記憶庫,影響後續數週的推理行為。89% 的 agent 跨用戶/session 共享記憶體且無完整性驗證(Repello AI 2026 企業安全路線圖報告),使這個攻擊面比 prompt injection 更難追溯。

從 Level 1 升到 Level 2 最關鍵的三件事是什麼?

1. 建立 AI 資產清單(盤點所有 agent 部署,含影子 AI);2. 建立工具調用日誌(每次 agent 操作都有可追溯記錄);3. 為每個高影響 agent 指定命名所有者(明確問責制)。Level 2 的門檻不是更強的過濾器,而是可觀測性。

個人開發者需要達到哪個成熟度層級才算負責任部署?

取決於你的 AT 層級。AT1-AT2(使用現成平台、不能執行代碼):廠商負主要責任,無需嚴格自評。AT4-AT5(你的 agent 能執行代碼、存取外部系統):最低要達到 Level 2,具體要求:工具調用日誌、每個工具明確最小化、每個 agent 使用獨立身份(非共享帳號)。

這篇文章對你有幫助嗎?

你的 AI coding agent 能讀取整個專案、執行指令、存取 API key。這篇指南整理 7 大威脅、11 條 best practices 和 8 個免費開源工具,讓你今天就完成安全防護。

AI Agent 安全防護實戰指南:你一個人就能做的 11 件事

下一篇閱讀約 15 分鐘

你的 AI coding agent 能讀取整個專案、執行指令、存取 API key。這篇指南整理 7 大威脅、11 條 best practices 和 8 個免費開源工具,讓你今天就完成安全防護。

下一篇

內容品質由社群守護

我們致力於提供準確的內容。發現問題?你的回饋能幫助所有讀者。

AI 工具評比報告,直送你的信箱