英国AISI：AI黑客能力每4.7个月翻倍，Claude与GPT-5.5测试指标已「爆表」_雷電財經

据动察 Beating 监测，英国人工智能安全研究所（AISI）最新报告指出，AI 自主执行网络安全任务的能力正经历超预期爆发。自 2024 年底以来，AI 能够独立完成的网络任务长度每 4.7 个月就会翻一倍，而近期发布的 Claude Mythos Preview 和 GPT-5.5 甚至直接打穿了这条增长曲线。为了控制变量，AISI 将单次任务的算力限制在 250 万 token。但在这种人为削弱的条件下，Claude Mythos Preview 和 GPT-5.5 在耗时达 12 小时的最高难度任务中，依然取得了接近 100% 的成功率。报告承认，这两个模型已经触及了现有测试集能衡量能力的上限。在更贴近实战的企业网络靶场（Cyber Ranges）测试中，AISI 共设置了两个攻击场景。新版 Claude Mythos Preview 首次将这两个靶场全部打通：除了在 The Last Ones 靶场中 10 次成功 6 次，它还成了首个攻破高难度靶场 Cooling Tower 的模型（10 次成功 3 次）。GPT-5.5 也在 The Last Ones 靶场中取得了 10 次尝试成功 3 次的成绩。前沿模型的网络攻防能力进化已经从「以年计」切换到「以月计」。现有的安全评估体系正被快速击穿，留给企业建立防线的窗口期正在急剧收窄。

英国AISI：AI黑客能力每4.7个月翻倍，Claude与GPT-5.5测试指标已「爆表」

關聯標籤

市場行情 (24h)

恐懼貪婪指數

英国AISI：AI黑客能力每4.7个月翻倍，Claude与GPT-5.5测试指标已「爆表」