人工智慧代理可以提升以太坊安全嗎?OpenAI與Paradigm創建測試平台
關鍵要點
- OpenAI與加密投資公司Paradigm合作推出EVMbench,一款測試AI代理發現及修補智慧合約漏洞能力的工具。
- EVMbench專注於以太坊虛擬機(EVM)環境中檢測、修補及利用高風險漏洞。
- 每週以太坊網路上的智慧合約部署數創下新高,顯示市場對可靠合約驗證的需求。
- 測試平台使用的漏洞多從公開的審計競賽中取得,如Code4rena,並包含來自Stripe的Tempo區塊鏈的審計場景。
WEEX Crypto News, 2026-02-19 09:43:01
在迅速發展的區塊鏈技術領域中,安全性問題始終備受關注。作為全球第二大加密貨幣網絡,以太坊以其高度的智能合約應用而聞名。然而,伴隨智能合約部署不斷增加,如何確保其安全性成為業內關注的焦點。為應對這一挑戰,OpenAI和Paradigm攜手創建了EVMbench,一款專門測試AI代理發現在以太坊虛擬機(EVM)環境中智能合約高風險漏洞並加以修補和利用的工具。
OpenAI與Paradigm的合作
OpenAI是ChatGPT的開發商,而Paradigm則是一家專注於加密市場的投資公司。這次合作旨在結合AI技術與區塊鏈安全的需求,為智能合約的穩定運行提供保障。EVMbench正是這一合作的成果,它著重評估AI模型在檢測(Detect)、修補(Patch)和利用(Exploit)模式下的表現。
在“檢測”模式中,AI代理會對庫存進行審核並根據其識別出實際漏洞的準確性打分。“修補”模式則要求AI代理在不破壞合約預期功能的情況下消除漏洞。而在“利用”階段,代理則試圖在沙盒區塊鏈環境中完成端到端的攻擊行動,並通過確定性交易重演進行評分。
智能合約擴張需求
以太坊網絡以其龐大的去中心化金融協議及代幣發行功能而聞名,每周部署的智能合約數量屢創新高。根據Token Terminal的數據顯示,2025年11月,以太坊網絡上每周部署的智能合約數達到歷史新高的170萬件,而就在上周,又有超過66.95萬件合約被部署。這些數據顯示了市場對智慧合約驗證和更新的強烈需求。
EVMbench的技術詳解
EVMbench共採用了120個精選漏洞,來源於40次審計,其中大多數是來自於Code4rena等公開審計競賽。它還包含了Tempo,Stripe策劃的以高吞吐量、低成本穩定幣支付為重點的區塊鏈層-1項目的安全審計過程中的場景。這確保了測試基於經濟上有意義的真實世界場景,特別是隨著人工智慧驅動的穩定幣支付不斷擴展。
Stripe於十二月份發佈了Tempo的公開測試網,聲稱此項目是與Visa、Shopify和OpenAI等公司共同研發。其目標是確保測試建構於有經濟價值的現實代碼之中。
AI代理及EVMbench的性能
在EVMbench的“利用”模式中,OpenAI的GPT-5.3-Codex通過Codex CLI運行,成績達到72.2%,相較於六個月前發佈的GPT-5成績為31.9%。不過,在“檢測”和“修補”任務中,性能表現稍遜,研究者指出這是由於代理有時未能徹底審計或難以保持合約完整性。
儘管如此,OpenAI的研究者認為EVMbench並不能完全捕捉真實世界的安全複雜性。但他們強調,隨著模型成為對攻擊者和防禦者的重要工具,在市場經濟環境中衡量AI性能至關重要。
矛盾的技術發展觀
在2025年1月,OpenAI的創始人Sam Altman表示,他們公司有信心可建立如傳統所理解的人工通用智慧(AGI)。然而,以太坊的共同創始人Vitalik Buterin則主張AI系統應包含“軟暫停”功能,以便在出現警示信號時能暫時限制大規模工業級AI運行。
強調經濟上的關聯性和安全性需求,EVMbench的推出不僅是技術界的一次試驗,也是區塊鏈安全的進一步保障。隨著以太坊智能合約不斷擴張,保障其安全性能成為關鍵。未來,隨著AI技術的不斷成熟,我們預期EVMbench將在保障區塊鏈環境的安全性方面發揮更關鍵的角色。
常見問題
EVMbench如何促進以太坊智能合約的安全性?
EVMbench結合AI技術與現實代碼場景,對智能合約的安全性進行多層次測試,從而有效識別和修補漏洞,提高整體的安全性。
OpenAI和Paradigm的合作對行業有何影響?
這次合作展示了大數據智能技術與區塊鏈領域的交集,通過工具的突破,提高合約的安全水平,推動行業的進一步發展。
EVMbench是如何運行的?
EVMbench在三種模式——檢測、修補和利用——下評估AI的表現,涵蓋漏洞識別、功能保護及實戰演習等多個環節。
AI代理在智能合約安全中的角色如何?
AI代理有助於提高智能合約的自動化審計與漏洞修補水平,減少人為失誤,提升整體安全性。
這項技術的未來發展如何?
隨著AI技術的進步,像EVMbench這樣的工具將愈發重要,不僅能提升以太坊的安全性能,也將引領其他區塊鏈技術的安全升級。
猜你喜歡

BitsLab 深度出品:Nanobot 用戶安全實踐指南

香港加密生態 2.0:穩定幣、RWA 與金融機構的新戰場

Polymarket 套利聖經:真正的差距在數學基礎設施

加密野蠻者 Jupiter 系:還欠市場一個答案

銀行卡支付 vs. 穩定幣支付:哪個更適合 AI 智能體(Agent)?

扎克伯格真沒招了!居然收購已經過時的龍蝦社交平台?

3月11日關鍵市場資訊差,一定要看!|Alpha早報

如何應對特朗普?收下這本「瞭解川普交易手冊」

AI算力戰火升級:這家初創公司想在太空挖比特幣

Claude Code推出/btw功能、马斯克X Money即將上線,英文區今天在聊啥?

Polymarket套利聖經:真正的差距在數學基礎設施

早報 | 騰訊正為微信打造 AI 智能體;Meta 宣布收購 Moltbook;英偉達計劃推出 AI 代理開源平台 NemoClaw

英偉達黃仁勳新文:AI 的“五層蛋糕”

詳解 ERC-8183:以太坊攻堅 AI Agent 互信難題的答案

股票代幣化革命:市場動態、產品架構與監管護城河全景報告

現在的龍蝦 Skill 只是當年的水果忍者,只為了讓你熟悉使用

3月10日市場關鍵情報,你錯過了多少?
