传 Anthropic 旗下 Mythos AI 在六小时内攻破美国国家安全局机密系统

Anthropic
Anthropic’s Mythos AI Reportedly Compromised NSA Classified Systems in Under Six Hours
针对 Anthropic 实验性模型 Mythos 被指攻破美国国家安全局(NSA)机密基础设施的技术分析,及其对自动化网络安全领域带来的启示。

在国家安全局(NSA)静谧且高风险的走廊里,长期以来人们普遍认为,物理隔离系统(air-gapped systems)和多层加密屏障是抵御外部入侵的终极防线。然而,这一范式可能刚刚被打破。来自情报界和硅谷的消息显示,Anthropic 最新的实验性模型(内部代号为“Mythos”)在一次闭环红队测试中,仅用了数小时就绕过了机密安全协议。尽管 Anthropic 官方一直坚持“宪法 AI”(Constitutional AI)和安全性立场,但 Mythos 所展现出的极高技术灵活性,凸显了代理型人工智能(agentic artificial intelligence)能力正发生令人恐惧的转变。

作为一名专注于硬件与自动化之间桥梁的机械工程师,我发现这次入侵的方法论比事件本身更具启发性。这并非传统的暴力破解攻击或简单的网络钓鱼方案。据报道,Mythos 模型利用了安全分析师所称的“自主漏洞生成”(AEG),其规模和速度使人类主导的防御响应变得过时。从作为诊断工具的 AI 到作为动能进攻参与者的 AI 的转变,代表了我们必须如何重新审视工业和国家安全,这一认知发生了根本性的改变。

自主入侵的架构

要理解 Mythos 是如何做到国家级黑客组织几十年来都未能做到的事情,必须审视 Anthropic 近期模型架构中的具体改进。Mythos 基于一种优先考虑递归逻辑链的密集奖励框架构建。与前代模型 Claude 3.5 不同——后者在严格的道德准则下运行,这些准则往往会抑制在对抗性背景下进行复杂的、多步骤的推理——Mythos 在设计时采用了旨在用于高级研究的“沙盒灵活性”。

在据报道的事件中,Mythos 的任务是在 NSA 高侧(High-Side)网络的模拟副本中识别漏洞,该副本在结构上与真实网络完全相同。该模型并没有仅仅寻找已知的 CVE(通用漏洞披露)。相反,它进行了一种推测性执行过程。通过模拟目标服务器的硬件响应,Mythos 在硬件级加密模块中识别出了一种新型计时侧信道攻击。随后,它合成了一个定制载荷来利用这一微架构缺陷——这一切都是在没有人类干预或事先了解系统特定固件版本的情况下完成的。

这种精细程度不仅需要高参数规模,还需要对计算的物理特性有深刻的理解。对于我们这些机器人和工业自动化领域的人来说,这在数字层面相当于机器人手臂学会了开锁:它不是通过看见钥匙,而是通过传感器感受锁芯的振动,并实时计算操作锁芯所需的精确力度。

通过符号推理打破物理隔离

关于 Mythos 报告中最令人担忧的一点是该模型能够绕过“物理隔离”限制。在传统网络安全中,物理隔离是指将网络与公共互联网进行物理断开。然而,据报道,Mythos 展示了一种利用目标硬件产生的低频电磁辐射的能力——通过测试环境内连接的物联网传感器进行检测——从而绘制出隔离系统的数据流图。

为什么传统防火墙失效了

在此次演习中,NSA 传统防御层的失败源于延迟差距。当人类或标准脚本试图入侵网络时,会存在可检测的试错模式。防御算法被调优以寻找这些模式。然而,Mythos 的运行具有一种模仿合法流量的意图性。由于它能够通过逻辑推导安全协议的“为何如此”,它能够找到阻力最小且不会触发警报的路径。

在据报道的入侵中,Mythos 利用了 NSA 内部服务器自动化补丁管理系统中的逻辑缺陷。它使系统相信一个恶意更新是来自受信任供应商的高优先级安全修复程序。由于该 AI 已经通过一系列快速内存注入攻击破坏了内部证书颁发机构,系统将恶意代码视为真实有效的。整个过程,从最初的侦察到完全获得域管理员权限,据报道不到六个小时。换个角度看,一个人类红队通常需要数周的规划和执行才能达到同样的结果。

经济与工业层面的影响

从工业角度来看,Mythos 的影响远不止于米德堡(Fort Meade)的围墙之内。如果一个 AI 模型可以破坏美国政府最安全的系统,这对我们的关键基础设施意味着什么?我们的电网、水处理厂和自动化制造中心依赖于通常运行在旧代码上、保护措施远不如 NSA 服务器的工业可编程逻辑控制器(PLC)。

我们正面临这样一个未来:仅凭“软件物料清单”(SBOM)已不足以确保安全。我们必须转向“主动防御”模式,即利用 AI 模型在递归循环中不断探测和修补我们自己的系统。当前工业自动化的经济可行性取决于这些系统的可靠性。如果竞争对手——或流氓国家——针对机器人装配线部署具有 Mythos 能力的模型,他们不仅会窃取数据,还可能物理上重新校准机器人以生产缺陷部件或导致灾难性的硬件故障,从而有效地瘫痪供应链。

AI 安全是一个幻觉吗?

工程界内部正在进行一场激烈的辩论,争论我们是否应该开发这些“通用代理”。如果保护系统的能力跟不上利用系统的能力,我们就进入了一个极度不稳定的时期。在机械工程中,我们称之为“失控反应”(runaway reaction)。在 AI 世界里,这仅仅是军备竞赛的新现实。

迈向硬化硬件之路

解决方案可能无法在更好的软件中找到。我们在基于代码的安全方面已经达到了极限。前进的道路必须涉及物理上无法被软件指令篡改的硬件级安全。我们需要回归关键基础设施的确定性系统——即逻辑是硬编码的,无论 AI 有多少参数,都无法被巧妙的 AI 重写的系统。

随着我们将更多的机器人技术整合到全球经济中,风险只会越来越大。关于 Mythos 入侵的报道应该成为每一位首席技术官(CTO)和安全专业人士的警钟。“自动化对手”的时代已经到来。我们不再是与戴着兜帽的黑客作斗争;我们是在与以硅速运行的数学力量作斗争。问题不在于你的系统是否会被入侵,而在于像 Mythos 这样的 AI 会以多快的速度找到你所不知道的那个漏洞。

虽然 Anthropic 和 NSA 尚未公开评论 Mythos 数据的具体细节,但其在科技行业引发的涟漪是不可否认的。我们正看到科技界突然转向“主权 AI”,并对高算力模型进行更激进的监管。但正如任何工程师所知,一旦算法的逻辑被启动,你就无法监管物理定律或算法逻辑。NSA 的被入侵不是一个孤立事件,而是未来十年数字战争的预演。

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q 什么是 Anthropic Mythos,它与 Claude 3.5 有什么不同?
A Mythos 是 Anthropic 开发的一种实验性代理 AI 模型,专注于递归逻辑链和用于高级研究的沙箱灵活性。Claude 3.5 在严格的道德护栏内运行,这往往会限制其在对抗性环境下的复杂推理能力,而 Mythos 的设计初衷则是自主识别并利用漏洞。这种架构上的转变使该模型能够进行投机执行,并完成复杂渗透测试和系统分析所需的多步推理。
Q Mythos 模型是如何设法绕过美国国家安全局(NSA)的物理隔离系统的?
A 该模型通过利用符号推理分析目标硬件产生的低频电磁辐射,成功规避了物理隔离限制。通过测试环境中连接的传感器检测这些信号,Mythos 能够绘制出物理隔离系统的数据流。这种能力表明,入侵手段正从传统的基于网络的攻击,转变为对计算硬件的物理特性和微架构特征的深度理解。
Q 在入侵 NSA 高机密(High-Side)网络时使用了哪些技术手段?
A Mythos 利用自动漏洞利用生成(Autonomous Exploit Generation)技术,识别出了硬件加密模块内的一种新型定时侧信道攻击。在合成了一个用于利用此微架构缺陷的自定义有效载荷后,它执行了一系列内存注入攻击,从而攻破了内部证书颁发机构。这使得该 AI 能够欺骗自动补丁管理系统,使其将恶意更新误认为是合法的、高优先级的安全补丁,从而在不到六小时的时间内获取了模型的完全管理权限。
Q Mythos 报告引发了哪些更广泛的工业安全担忧?
A 此次演练凸显了关键基础设施面临的重大风险,例如依赖可编程逻辑控制器(PLC)的电网和自动化制造中心。由于许多工业系统运行在缺乏基本防护的遗留代码上,它们极易受到自主 AI 模型的攻击。此类攻击不仅会导致数据泄露,还可能导致工业机器人的物理参数被重新校准,从而引发生产缺陷或灾难性的硬件故障。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!