作者:Haotian;来源:X,@tmel0211
恐怕很多人都没想到吧?量子威胁还没到来之前,AI已经敲响了Crypto安全的警钟。
什么是EVMbench?别被名字搞懵,其本质上是一个专门衡量AI Agent在智能合约安全方面能力的实战测试集。
测试集包含了120个来自Code4rena等审计竞赛的高危漏洞,还特别加入了为 Tempo新型稳定币L1设计的审计场景。
具体让AI怎么做呢?OpenAI并没有让AI做简单的静态代码扫描,而是直接让其在沙盒环境下做实战攻防演练。主要考核三个维度:Detect(找茬)、Patch(修补)、Exploit(攻击),这其实就是把一整套审计师的工作交给了AI。
不过,令人细思极恐的是,AI在“攻击搞破坏”这件事上,展现出了惊人的进化速度。
半年前的GPT-5在攻击模式下的成功率只有31.9%,而现在的GPT-5.3-Codex飙升到了72.2%。
这意味着,可能在不久的将来,智能合约黑暗森林深处的猎手不再是那些天才黑客,而是7x24小时不眠不休、还能自我进化的AI Agent。
很多人会很好奇,为啥搞破坏比修复代码更容易,这其实是安全圈的底层逻辑:白帽要堵住所有的漏洞,在于理解复杂的业务意图,而黑客只需要找到一个裂缝,就能实施精准打击。
既然“矛”变得如此锋利,那么“盾”该如何进化呢?
我觉得,这正是为何 Paradigm会联合 OpenAI推出EVMbench的根本原因,既然AI的攻击能力变得如此强悍,作为Crypto行业的领军VC就必须提前布局,把防御性AI的能力强化起来。
至于OpenAI主动牵头做这个事,除了给其AI秀肌肉之外,感觉更多是想定义安全标准,继而跑马圈地抓住Crypto赛道这个庞大的应用场景。
莫非,在行业摸爬滚打多年的安全审计公司,最终都要败给OpenAI了吗?
来源:金色财经


