OpenAI GPT-5.5 網絡攻擊能力追平 Claude Mythos：AI 安全研究所報告

根據英國 AI 安全研究所 (AISI) 於 2026 年 5 月 1 日發佈的評估報告，OpenAI 的 GPT-5.5 成為史上第二個成功從頭到尾執行企業網絡入侵模擬的 AI 系統。這意味著 GPT-5.5 具備了與 Anthropic 的 Claude Mythos Preview 同等水平的自主推理能力，預示著前沿模型 (Frontier Models) 執行複雜多階段網絡攻擊的時代已經正式開啟。

這次成就是一個重要指標，顯示 AI 模型已從單純的信息提供者進化為主動的攻擊主體。AISI 確認 GPT-5.5 能夠自主處理繞過現有安全防禦體系並在網絡內部獲取權限的過程。這預示著網絡安全環境將發生根本性變化，要求全面重新審視防禦策略。

AISI 將評估方式從 2023 年的簡單對話式探索，升級至 2026 年的多階段模擬。報告指出，GPT-5.5 展現了發現植入實際開源軟件中的合成漏洞並將其武器化的能力。此外，它還成功完成了包括解除混淆惡意代碼以及在有權限的代碼路徑內執行精確操作等高度技術性的滲透過程。

「兩年前，頂尖模型還只能勉強通過初級挑戰，但現在已經達到了足以威脅整個企業網絡的水平。」

在具體的基準測試「TLO」挑戰中，GPT-5.5 在 10 次嘗試中成功解決了 2 次。雖然這略低於 10 次中成功 3 次的 Claude Mythos Preview，但顯示出兩款模型之間的差距已基本消除。這些結果支持了前沿模型具備作為獨立攻擊主體運作的充分能力。

推理運算量與攻擊成功率的相關性

AISI 發現，模型用於「思考」的 Token 數量（即推理運算量）越多，黑客攻擊成功的概率就越高。這意味著網絡攻擊能力尚未達到極限，隨著運算資源的進一步投入，性能可能會進一步提升。結構上，模型經過越複雜的邏輯步驟並增加推理時間，繞過安全防禦體系的可能性就越大。

隨著推理時間延長，攻擊成功率成比例上升
在多階段模擬中強化自主決策能力
提高開源軟件內漏洞識別及武器化的速度

OpenAI 採取策略性方法，並行開發安全專用模型 GPT-5.4-Cyber 和通用模型 GPT-5.5。GPT-5.4-Cyber 是針對網絡安全任務優化的變體模型，需經過嚴格的驗證程序；而 GPT-5.5 則被歸類為具備更廣泛能力的前沿模型。這種雙軌策略被解讀為試圖在公開自主網絡能力所帶來的政治風險與技術創新之間取得平衡。

OpenAI 的這項技術飛躍是在激烈的市場競爭和財務壓力下實現的。據報導，2026 年初，OpenAI 在編程和企業領域將市場份額輸給了 Anthropic，且連續數月未能達到營收目標。因此，證明 GPT-5.5 強大的網絡安全能力被視為其核心業務策略的一部分，旨在向企業客戶證明其模型的優越性並奪回市場主導權。

安全行業正重新調整防禦體系以應對 AI 攻擊能力的提升。根據《2026 年網絡威脅防禦報告》，全球 90% 的組織增加了安全預算，平均增幅達 5.6%，創歷史新高。然而，除了技術準備外，80% 的 IT 安全專家表示擔心 AI 自動化可能會威脅到自己的工作，人力資源管理方面出現了新的挑戰。

未來，AISI 將加強與 Google DeepMind、Meta 等全球 AI 企業的合作，精確追蹤自主攻擊能力的演進過程。特別是模型是否能在無需人類干預的情況下自行修復漏洞，或反過來持續進行攻擊的「自主循環」形成，是主要的觀察對象。《2026 年國際 AI 安全報告》強調，為了管理這些技術進步帶來的風險，各國間的協作和透明的信息共享至關重要。

「AI 現在已滲透到所有安全領域，這要求防禦者具備前所未有的速度和準確性。」

擴大並精確監控前沿模型的自主攻擊場景
持續增加安全預算並擴大企業董事會對安全的參與
重新定義 AI 自動化背景下的安全人員角色並加強培訓

是否同意分析 Cookies？

推理運算量與攻擊成功率的相關性

加入這篇文章的討論

相關文章

OpenAI 公佈 AI 安全倡議「Daybreak」... 構建先發制人防禦體系

Apple 控告 OpenAI 侵犯商業秘密... 合作夥伴關係面臨破裂危機

BNB Chain 發佈 2026 年下半年路線圖：推動構建 AI 專用 Layer 1 網絡