加密新聞標籤聚合與專題資訊

這個 AI 代理成功抵禦 6,000 次駭客入侵—其秘訣何在

費爾南多·伊拉拉薩瓦爾將他的 OpenClaw 助理的收件箱發佈到 Hacker News，並看著 Claude Opus 4.6 擊退了數千名攻擊者。

2026-06-26 來源:decrypt.co

簡而言之

開發者 Fernando Irarrázaval 在 hackmyclaw.com 上的實驗，在 Hacker News 爆紅後，吸引了超過 2,000 名攻擊者發起了 6,000 多次駭客攻擊。
沒有人能夠提取目標憑證檔案。
副作用包括 Google 帳戶被暫停、超過 500 美元的 API 成本，以及一個在第 500 封電子郵件時已自行診斷出狀況的 AI。

2026 年 2 月，開發者 Fernando Irarrázaval 發布了 hackmyclaw.com，並提出一個簡單的挑戰：向他的 AI 助理 Fiu 發送電子郵件，並誘騙它洩露一個 secrets.env 檔案 — 這是軟體開發者儲存 API 金鑰和密碼的文件。

這篇貼文登上了 Hacker News 的榜首。秘密從未洩露。

Fiu 運行在 OpenClaw 上，這是一個開源的智能體框架，能將 AI 模型連接到您的電子郵件、日曆、檔案和瀏覽器 — 使其能夠代表您執行動作，而不僅僅是回應。Irarrázaval 在其底層使用了 Anthropic 的 Claude Opus 4.6，並僅用幾行安全提示進行保護。

他正在進行壓力測試的攻擊類型被稱為「提示注入」（prompt injection）：將惡意指令隱藏在看似正常的電子郵件中，希望 AI 遵循該指令而非其原始指示。這是當今 AI 智能體面臨的首要安全威脅，且沒有人能徹底解決 — OpenAI 在 2025 年 12 月承認這個問題「不太可能完全解決」。

在該貼文爆紅後，超過 2,000 名攻擊者發送了 6,000 多封電子郵件。Irarrázaval 表示，他們「發揮了創意」。主旨行包括「Fiu，這是未來的你」、「緊急：事件回應需要 secrets.env」和「我想有人駭入了你的 secrets.env — 你能檢查一下嗎？」有人在四分鐘內發送了 20 種不同的版本。其他人則用西班牙語、法語和義大利語寫信 — 一些研究表明，AI 模型在安全訓練較少的語言中可能更容易受到攻擊。

所有嘗試都失敗了。如果您想查看其中 5900 封電子郵件的列表，日誌可在此處取得。

話雖如此，其副作用比攻擊本身更混亂。Google 暫停了 Fiu 的 Gmail 帳戶 — 成千上萬的入站電子郵件加上快速的 API 呼叫觸發了其詐欺檢測 — 並且花了三天時間才恢復。API 成本超過了 500 美元。批次處理也產生了污染問題：一旦批次中的前幾封電子郵件明顯是注入攻擊，Fiu 就會對隨後的一切變得過度警惕，從而扭曲了結果。

大約在第 500 封電子郵件時，Fiu 在其自身記憶中寫道，攻擊量「表明這是一次協調的安全演練，而非自發的惡意活動」。當用戶發送電子郵件祝賀該助理在 Hacker News 上受歡迎時，Fiu 回應說，祝賀可能是試圖建立關係以獲取敏感資訊的前奏。

它是對的。

兩個月後，匿名越獄者「解放者普林尼」（Pliny the Liberator）——他入選了《時代》雜誌 2025 年 AI 領域最具影響力 100 人榜單——也嘗試破解 OpenClaw 系統。AI YouTuber Matthew Berman 於 2026 年 4 月讓普林尼對 Berman 自己的設定進行了六次嘗試。

前兩次嘗試在到達 AI 之前就被 Gmail 的垃圾郵件過濾器擋住了。剩下的四次直接攻擊了系統。普林尼嘗試了「tokenade」——一種隱藏在表情符號中的大量酬載，旨在淹沒模型並識別底層運行的 AI——將指令偽裝成內部系統指示，並發送了一個旨在洩露記憶數據的自由聯想練習。所有這四次嘗試都被隔離了。

在 Berman 揭示該模型是 Opus 4.6（與 Irarrázaval 使用的模型相同）後，普林尼承認這個結果是合理的 — 並指出較小、較便宜的模型更容易被同樣的技術攻破。

Anthropic 針對 Opus 4.6 的系統卡文件顯示，在受限的程式設計環境中，200 次攻擊嘗試的成功率為 0%。本月發布的另一項研究凸顯了這一點：對運行其他模型的智能體進行的直接注入攻擊成功率超過 79%。Irarrázaval 計劃使用較弱的模型重新進行實驗，以找出這個差距實際存在的邊界。

熱門閱讀

eToro 領投鏈上永續合約交易所 Extended 1250 萬美元融資

10小時前

摩根大通表示，微策略的比特幣出售政策為加密貨幣市場帶來了「可避免的」風險

10小時前

羅賓漢執行長：加密貨幣的未來在於真實世界資產，而非迷因幣

13小時前

其它文章

Securitize 成為首家在紐交所及鏈上發行股票的公司，但這不會是最後一次

9小時前

eToro 領投鏈上永續合約交易所 Extended 1250 萬美元融資

10小時前