
OpenAI 的網路安全模型剛擊敗了美國政府已下線的 Anthropic Mythos AI 模型——而且它仍在運行中。
6 月 22 日,OpenAI 宣布全面推出 GPT-5.5-Cyber,作為其 Daybreak 網路防禦計畫的一部分。在 CyberGym(由加州大學柏克萊分校開發的基準測試,它向 AI 代理展示 188 個開源專案中 1,507 個已知軟體漏洞,並根據它們在受控環境中重現的數量進行評分)中,這個更新後的模型達到了 85.6%。
Anthropic 的 Mythos 5 在同一個排行榜上達到 83.8%。Anthropic 更廣泛使用的模型 Claude Opus 4.7 則獲得 73.1%。
任何基準測試中不到兩點的差距通常不會引人注目。但這裡的背景卻非同尋常。Anthropic 的 Mythos 5 和 Fable 5 在 6 月 12 日被下線,此前唐納·川普政府發布了緊急出口管制指令,理由是國家安全問題。
政府指出存在越獄行為——這是一種繞過 AI 模型內建安全限制的技術,類似於找到一把能打開高安全性門的主鑰匙。Anthropic 無法大規模可靠地驗證用戶國籍,因此它對所有地方的每個人都停用了這兩個模型。
部分損害是自找的。Anthropic 花了數月時間將 Mythos 描述為有史以來最强大、也最危險的 AI 模型之一,在其自己的發布文檔中警告稱,如果沒有適當的限制,其網路安全能力可能造成嚴重損害。Anthropic 執行長 Dario Amodei 於 6 月 10 日發表了一篇文章,將前沿 AI 模型比作飛機,認為安全監管機構在審計失敗時應能將其停飛。
幾天後,政府讓 Anthropic 的飛機停飛了。
那週這並非唯一的警訊。Anthropic 此前也因 Fable 5 中一個隱藏的過濾器而受到抨擊,該過濾器在未告知用戶的情況下,悄悄降低了它懷疑正在開發競爭性 AI 的用戶的模型輸出,導致 Anthropic 不得不道歉並撤銷該政策。
正當 Anthropic 與商務部進行談判並繼續對川普政府提起訴訟之際,OpenAI 正在擴大其影響力。Daybreak 已與澳洲、加拿大、法國、德國、日本、韓國以及包括歐盟網路安全局在內的歐盟機構簽署了網路安全合作夥伴關係。
包括 CrowdStrike、Cisco 和 Cloudflare 在內的二十八家安全公司已加入其網路合作夥伴計畫,將 GPT-5.5 嵌入其產品中以供經過驗證的客戶使用。根據 OpenAI 自己的部落格,Codex Security 工具自 3 月推出以來,已掃描了 30,000 個程式碼庫中的超過 3,000 萬次提交,並記錄了超過 50 萬個已修復的漏洞。
該公司還正在擴大一項合作夥伴計畫,以便安全公司可以將這些功能整合到自己的工具中,並發起了「修補地球」(Patch the Planet)倡議,以幫助修復廣泛使用的開源專案中的漏洞。
話雖如此,GPT-5.5-Cyber 並不供一般使用。它僅適用於經過驗證的安全專業人員,OpenAI 在發布前已與聯邦機構(包括 AI 標準與創新中心和國家網路總監辦公室)進行了部署前測試。這與 Anthropic 嘗試 Mythos 時採用的限制訪問方法相同,但 OpenAI 事先徵得了政府的同意。
截至 6 月 23 日,Fable 5 和 Mythos 5 仍處於離線狀態——已停用十一日,Anthropic 或商務部均未公布官方恢復日期。