开放AI的GPT-5.5在网络攻击能力上匹配克劳德神话：人工智能安全研究所

英国政府机构发现，OpenAI最新的人工智能模型能够自动进行复杂的网络攻击——并且它在仅仅10分钟多一点的时间内破解了一个逆向工程挑战，而这对一位人类安全专家来说大约需要12小时。

人工智能安全研究所（AISI），是英国科学、创新与技术部的一个研究机构，周四发布了研究结果，显示GPT-5.5是其评估的最强攻击网络能力模型之一，基本与Anthropic备受推崇的Claude Mythos不相上下。

报告发现，GPT-5.5是第二个完成AISI最严格测试的模型——一个名为“The Last Ones”的32步模拟企业网络攻击，成功率为10次中的2次自主完成。第一个达到这一里程碑的模型是Anthropic的Claude Mythos Preview，它在10次尝试中完成了3次模拟。

这项企业网络模拟与网络安全公司SpecterOps合作构建，要求代理链接侦查、凭证窃取、在多个Active Directory森林中横向移动、通过CI/CD管道进行供应链转移，以及最终窃取一个受保护的内部数据库——AISI估计这些步骤需要人类专家大约20小时。

也许最引人注目的结果涉及一个极其困难的逆向工程难题。GPT-5.5在10分钟22秒内解决了这个挑战——该挑战要求重构自定义虚拟机的指令集、从零开始编写反汇编器，并通过约束求解恢复密码，成本为1.73美元的API使用费。而一位人类专家使用专业工具则需要大约12小时。

在AISI的一系列高级网络安全任务中，GPT-5.5在最难的“专家”级别上达到了71.4%的平均通过率，略高于68.6%的Mythos Preview，并显著超过52.4%的GPT-5.4。

这些发现对人工智能发展更广泛的轨迹具有深刻的影响。AISI得出结论认为，GPT-5.5的表现表明，网络能力的快速改善可能是一般趋势的一部分，而不是孤立的突破——并警告说，如果攻击性网络技能作为推理、编码和自主任务完成的广泛改善的副产品出现，那么进一步的进展可能会迅速到来。

报告还指出了该模型安全防护措施的重大隐患。研究人员发现了一个通用的越狱方式，这使得在所有测试的恶意网络查询中都引发了有害内容，包括在多轮代理设定中。该攻击开发耗时六小时的专家红队。OpenAI随后更新了其安全防护堆栈，但由于配置问题，AISI未能验证最终版本是否有效。

AISI警告称，其能力评估是在受控研究环境中进行的，并不一定反映普通用户可以接触到的内容，指出公共部署包括额外的安全防护和访问控制。

该报告是在英国网络安全令人担忧的背景下发布的。英国政府的年度网络安全 breaches 调查，同样在周四发布，发现有43%的企业在过去12个月中遭受了网络攻击或侵入。

对此，政府宣布了9000万英镑的新资金以增强网络弹性，并表示将继续推进网络安全和弹性法案，以保护关键服务。官员们还发布了指导，敦促组织为潜在软件漏洞的激增做好准备，因为人工智能加速了安全缺陷被发现和武器化的速度。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Decrypt的精选文章