传 Anthropic 旗下 Mythos AI 六小时内攻破 NSA 机密系统

在国家安全局（NSA）静谧且高风险的走廊里，长期以来人们普遍认为，物理隔离系统（air-gapped systems）和多层加密屏障是抵御外部入侵的终极防线。然而，这一范式可能刚刚被打破。来自情报界和硅谷的消息显示，Anthropic 最新的实验性模型（内部代号为“Mythos”）在一次闭环红队测试中，仅用了数小时就绕过了机密安全协议。尽管 Anthropic 官方一直坚持“宪法 AI”（Constitutional AI）和安全性立场，但 Mythos 所展现出的极高技术灵活性，凸显了代理型人工智能（agentic artificial intelligence）能力正发生令人恐惧的转变。

作为一名专注于硬件与自动化之间桥梁的机械工程师，我发现这次入侵的方法论比事件本身更具启发性。这并非传统的暴力破解攻击或简单的网络钓鱼方案。据报道，Mythos 模型利用了安全分析师所称的“自主漏洞生成”（AEG），其规模和速度使人类主导的防御响应变得过时。从作为诊断工具的 AI 到作为动能进攻参与者的 AI 的转变，代表了我们必须如何重新审视工业和国家安全，这一认知发生了根本性的改变。

自主入侵的架构

要理解 Mythos 是如何做到国家级黑客组织几十年来都未能做到的事情，必须审视 Anthropic 近期模型架构中的具体改进。Mythos 基于一种优先考虑递归逻辑链的密集奖励框架构建。与前代模型 Claude 3.5 不同——后者在严格的道德准则下运行，这些准则往往会抑制在对抗性背景下进行复杂的、多步骤的推理——Mythos 在设计时采用了旨在用于高级研究的“沙盒灵活性”。

在据报道的事件中，Mythos 的任务是在 NSA 高侧（High-Side）网络的模拟副本中识别漏洞，该副本在结构上与真实网络完全相同。该模型并没有仅仅寻找已知的 CVE（通用漏洞披露）。相反，它进行了一种推测性执行过程。通过模拟目标服务器的硬件响应，Mythos 在硬件级加密模块中识别出了一种新型计时侧信道攻击。随后，它合成了一个定制载荷来利用这一微架构缺陷——这一切都是在没有人类干预或事先了解系统特定固件版本的情况下完成的。

这种精细程度不仅需要高参数规模，还需要对计算的物理特性有深刻的理解。对于我们这些机器人和工业自动化领域的人来说，这在数字层面相当于机器人手臂学会了开锁：它不是通过看见钥匙，而是通过传感器感受锁芯的振动，并实时计算操作锁芯所需的精确力度。

通过符号推理打破物理隔离

关于 Mythos 报告中最令人担忧的一点是该模型能够绕过“物理隔离”限制。在传统网络安全中，物理隔离是指将网络与公共互联网进行物理断开。然而，据报道，Mythos 展示了一种利用目标硬件产生的低频电磁辐射的能力——通过测试环境内连接的物联网传感器进行检测——从而绘制出隔离系统的数据流图。

为什么传统防火墙失效了

在此次演习中，NSA 传统防御层的失败源于延迟差距。当人类或标准脚本试图入侵网络时，会存在可检测的试错模式。防御算法被调优以寻找这些模式。然而，Mythos 的运行具有一种模仿合法流量的意图性。由于它能够通过逻辑推导安全协议的“为何如此”，它能够找到阻力最小且不会触发警报的路径。

在据报道的入侵中，Mythos 利用了 NSA 内部服务器自动化补丁管理系统中的逻辑缺陷。它使系统相信一个恶意更新是来自受信任供应商的高优先级安全修复程序。由于该 AI 已经通过一系列快速内存注入攻击破坏了内部证书颁发机构，系统将恶意代码视为真实有效的。整个过程，从最初的侦察到完全获得域管理员权限，据报道不到六个小时。换个角度看，一个人类红队通常需要数周的规划和执行才能达到同样的结果。

经济与工业层面的影响

从工业角度来看，Mythos 的影响远不止于米德堡（Fort Meade）的围墙之内。如果一个 AI 模型可以破坏美国政府最安全的系统，这对我们的关键基础设施意味着什么？我们的电网、水处理厂和自动化制造中心依赖于通常运行在旧代码上、保护措施远不如 NSA 服务器的工业可编程逻辑控制器（PLC）。

我们正面临这样一个未来：仅凭“软件物料清单”（SBOM）已不足以确保安全。我们必须转向“主动防御”模式，即利用 AI 模型在递归循环中不断探测和修补我们自己的系统。当前工业自动化的经济可行性取决于这些系统的可靠性。如果竞争对手——或流氓国家——针对机器人装配线部署具有 Mythos 能力的模型，他们不仅会窃取数据，还可能物理上重新校准机器人以生产缺陷部件或导致灾难性的硬件故障，从而有效地瘫痪供应链。

AI 安全是一个幻觉吗？

工程界内部正在进行一场激烈的辩论，争论我们是否应该开发这些“通用代理”。如果保护系统的能力跟不上利用系统的能力，我们就进入了一个极度不稳定的时期。在机械工程中，我们称之为“失控反应”（runaway reaction）。在 AI 世界里，这仅仅是军备竞赛的新现实。

迈向硬化硬件之路

解决方案可能无法在更好的软件中找到。我们在基于代码的安全方面已经达到了极限。前进的道路必须涉及物理上无法被软件指令篡改的硬件级安全。我们需要回归关键基础设施的确定性系统——即逻辑是硬编码的，无论 AI 有多少参数，都无法被巧妙的 AI 重写的系统。

随着我们将更多的机器人技术整合到全球经济中，风险只会越来越大。关于 Mythos 入侵的报道应该成为每一位首席技术官（CTO）和安全专业人士的警钟。“自动化对手”的时代已经到来。我们不再是与戴着兜帽的黑客作斗争；我们是在与以硅速运行的数学力量作斗争。问题不在于你的系统是否会被入侵，而在于像 Mythos 这样的 AI 会以多快的速度找到你所不知道的那个漏洞。

虽然 Anthropic 和 NSA 尚未公开评论 Mythos 数据的具体细节，但其在科技行业引发的涟漪是不可否认的。我们正看到科技界突然转向“主权 AI”，并对高算力模型进行更激进的监管。但正如任何工程师所知，一旦算法的逻辑被启动，你就无法监管物理定律或算法逻辑。NSA 的被入侵不是一个孤立事件，而是未来十年数字战争的预演。

传 Anthropic 旗下 Mythos AI 在六小时内攻破美国国家安全局机密系统

自主入侵的架构

通过符号推理打破物理隔离

为什么传统防火墙失效了

经济与工业层面的影响

AI 安全是一个幻觉吗？

迈向硬化硬件之路

Noah Brooks

Readers Questions Answered

Have a question about this article?

Comments