英国政府机构发现,OpenAI最新的人工智能模型能够自动进行复杂的网络攻击——并且它在仅仅10分钟多一点的时间内破解了一个逆向工程挑战,而这对一位人类安全专家来说大约需要12小时。
人工智能安全研究所(AISI),是英国科学、创新与技术部的一个研究机构,周四发布了研究结果,显示GPT-5.5是其评估的最强攻击网络能力模型之一,基本与Anthropic备受推崇的Claude Mythos不相上下。
报告发现,GPT-5.5是第二个完成AISI最严格测试的模型——一个名为“The Last Ones”的32步模拟企业网络攻击,成功率为10次中的2次自主完成。第一个达到这一里程碑的模型是Anthropic的Claude Mythos Preview,它在10次尝试中完成了3次模拟。
这项企业网络模拟与网络安全公司SpecterOps合作构建,要求代理链接侦查、凭证窃取、在多个Active Directory森林中横向移动、通过CI/CD管道进行供应链转移,以及最终窃取一个受保护的内部数据库——AISI估计这些步骤需要人类专家大约20小时。
也许最引人注目的结果涉及一个极其困难的逆向工程难题。GPT-5.5在10分钟22秒内解决了这个挑战——该挑战要求重构自定义虚拟机的指令集、从零开始编写反汇编器,并通过约束求解恢复密码,成本为1.73美元的API使用费。而一位人类专家使用专业工具则需要大约12小时。
在AISI的一系列高级网络安全任务中,GPT-5.5在最难的“专家”级别上达到了71.4%的平均通过率,略高于68.6%的Mythos Preview,并显著超过52.4%的GPT-5.4。
这些发现对人工智能发展更广泛的轨迹具有深刻的影响。AISI得出结论认为,GPT-5.5的表现表明,网络能力的快速改善可能是一般趋势的一部分,而不是孤立的突破——并警告说,如果攻击性网络技能作为推理、编码和自主任务完成的广泛改善的副产品出现,那么进一步的进展可能会迅速到来。
报告还指出了该模型安全防护措施的重大隐患。研究人员发现了一个通用的越狱方式,这使得在所有测试的恶意网络查询中都引发了有害内容,包括在多轮代理设定中。该攻击开发耗时六小时的专家红队。OpenAI随后更新了其安全防护堆栈,但由于配置问题,AISI未能验证最终版本是否有效。
AISI警告称,其能力评估是在受控研究环境中进行的,并不一定反映普通用户可以接触到的内容,指出公共部署包括额外的安全防护和访问控制。
该报告是在英国网络安全令人担忧的背景下发布的。英国政府的年度网络安全 breaches 调查,同样在周四发布,发现有43%的企业在过去12个月中遭受了网络攻击或侵入。
对此,政府宣布了9000万英镑的新资金以增强网络弹性,并表示将继续推进网络安全和弹性法案,以保护关键服务。官员们还发布了指导,敦促组织为潜在软件漏洞的激增做好准备,因为人工智能加速了安全缺陷被发现和武器化的速度。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。