icon

英国AISI:AI黑客能力每4.7个月翻倍,Claude与GPT-5.5测试指标已「爆表」

据动察 Beating 监测,英国人工智能安全研究所(AISI)最新报告指出,AI 自主执行网络安全任务的能力正经历超预期爆发。自 2024 年底以来,AI 能够独立完成的网络任务长度每 4.7 个月就会翻一倍,而近期发布的 Claude Mythos Preview 和 GPT-5.5 甚至直接打穿了这条增长曲线。为了控制变量,AISI 将单次任务的算力限制在 250 万 token。但在这种人为削弱的条件下,Claude Mythos Preview 和 GPT-5.5 在耗时达 12 小时的最高难度任务中,依然取得了接近 100% 的成功率。报告承认,这两个模型已经触及了现有测试集能衡量能力的上限。在更贴近实战的企业网络靶场(Cyber Ranges)测试中,AISI 共设置了两个攻击场景。新版 Claude Mythos Preview 首次将这两个靶场全部打通:除了在 The Last Ones 靶场中 10 次成功 6 次,它还成了首个攻破高难度靶场 Cooling Tower 的模型(10 次成功 3 次)。GPT-5.5 也在 The Last Ones 靶场中取得了 10 次尝试成功 3 次的成绩。前沿模型的网络攻防能力进化已经从「以年计」切换到「以月计」。现有的安全评估体系正被快速击穿,留给企业建立防线的窗口期正在急剧收窄。
雷電財經提醒:請廣大讀者理性看待區塊鏈,切實提高風險意識,警惕各類虛擬代幣發行與炒作,站內所有內容僅系市場信息或相關方觀點,不構成任何形式投資建議。如發現站內內容含敏感信息,可通過 舉報 聯繫我們 ,我們會及時處理。
12:03 , 2026-05-14

英国AISI:AI黑客能力每4.7个月翻倍,Claude与GPT-5.5测试指标已「爆表」