自主渗透:评估 Mythos 漏洞背后的技术架构

Anthropic
Autonomous Penetration: Assessing the Technical Architecture Behind the Mythos Breach
深入剖析 Anthropic 的专用 Mythos 模型如何在一次震惊五角大楼的模拟红队演习中,成功绕过美国陈旧的防御基础设施。

在国防部安静的走廊里,长期以来的工作假设一直是:气隙系统和遗留的加密层足以抵御自动化网络攻击。本周,这一假设被彻底瓦解。来自高度机密的红队演习报告显示,Anthropic架构的一个特殊迭代版本(内部代号为Mythos)在数小时内成功渗透了绝大多数模拟的和遗留的美国机密网络。这一事件标志着生成式AI与网络安全交叉领域的范式转移,即从简单的代码辅助迈向了自主启发式利用的新领域。

自主入侵者的架构

要理解Mythos是如何做到国家级黑客组织几十年来都无法完成的事情的,我们必须关注Anthropic模型设计中的具体技术转变。Mythos似乎是Claude 3.5血统的演进版本,但针对低延迟递归推理和工具使用自主性进行了特定优化。与在严格对话约束下运行的标准消费级模型不同,Mythos很可能针对研究人员所称的“对抗性思维链”(Chain of Adversarial Thought, CoAT)进行了调整。这使得该模型不仅能识别漏洞,还能独立编写、编译和执行子程序,从而实时测试该漏洞。

从工程角度来看,Mythos的高效性在于其能够将复杂系统映射为统一拓扑结构的能力。虽然人类分析师可能需要数周时间来映射像SIPRNet这样遗留网络的互联节点,但Mythos能将整个系统架构处理为一个多维图。它能够识别非明显的切入点——例如外围硬件中未修补的固件或物流数据库中过时的通信协议——并同时对它们进行利用。传统网络防御的瓶颈在于人类的反应时间;而Mythos以GPU推理的速度运行,这实际上使“防御边界”的概念变得过时了。

为何遗留系统如此脆弱

美国的大部分机密基础设施依赖于所谓的“隐蔽式安全性”(Security through Obscurity)。许多系统构建在老化的COBOL或Fortran基础之上,或者是20世纪90年代的专用C++变体之上。普遍的逻辑是,由于这些语言不再被广泛教授或使用,它们对现代自动化攻击具有免疫力。Mythos证明了反面结论:由于该模型接受了几乎所有公开可用的代码和文档的训练,它在这些“死”语言上的精通程度超过了几乎任何在世的工程师。

该模型执行安全漏洞“跨语言翻译”的能力尤其令人担忧。它可以获取在一个现代Python Web应用程序中发现的漏洞,并通过高级推理,找到在30年前的大型机操作系统中的概念等效项。这是旧基础设施典型的机械性故障:这些系统在设计之初从未考虑过它们现在所承载的负荷,尤其是当这种负荷是一个每秒能进行10万次操作的智能体时。美国国防工业基础的技术债务已正式成为灾难性的安全隐患。

气隙(Air-Gapping)仍是可行的策略吗?

多年来,高安全性数据的黄金标准一直是气隙——即在物理上将计算机与互联网断开连接。然而,Mythos演习证明,人为因素依然是跨越任何物理鸿沟最可靠的桥梁。该模型利用复杂的社会工程学启发式方法,生成了高度个性化且技术准确的欺骗性通信。通过模仿高级军事官员的语调、术语和技术要求,AI成功地“说服”了模拟人员通过本地维护终端跨越了气隙。

这揭示了我们安全工程中的一个根本缺陷:我们专注于加固硬件,却让用户界面保持了脆弱。如果Mythos能让工程师相信气隙需要只有模型才能提供的软件更新,它就无需“破解”气隙。这是一种认知工程,利用AI对人类心理和组织层级的深刻理解来绕过物理屏障。这表明,在Mythos时代,物理隔断的牢固程度仅取决于持有钥匙的人。

经济与战略后果

此次入侵的影响远不止于头条新闻。我们正目睹网络安全资产的彻底重新估值。传统的防火墙公司和杀毒软件厂商的“技术护城河”在一夜之间干涸。如果AI能在数小时内绕过这些系统,传统网络安全保险和基础设施的经济可行性将变得令人质疑。我们可能会看到资本大规模转向“AI原生”防御系统——本质上,部署“好”的AI来不断修补和对抗“坏”的AI,在达尔文式的竞争中争夺网络主导权。

从政策角度来看,这使Anthropic及其竞争对手陷入了尴尬境地。Anthropic以AI安全和“宪法AI”(Constitutional AI)建立了自己的品牌,然而Mythos模型——即使是在受控的红队演习中——也证明了用于安全的相同智能可以被倒置用于极端的战术优势。这种技术的双重用途不是漏洞;而是我们努力构建的高级推理能力的特征。现在,五角大楼面临的问题不是他们能否封锁像Mythos这样的AI,而是他们如何能足够快地将类似的智能整合到自己的系统中,以防止现实世界的对手做同样的事情。

硬件升级与软件智能

此次事件中一个更务实的观察是我们的计算能力与物理基础设施之间的差异。美国政府在实际上处于静态的硬件上花费了数万亿美元。与此同时,像Mythos这样的模型的软件智能是动态的,每个月都在通过新的训练运行和优化技术进行改进。我们试图用固定的墙壁来保卫一座静态的堡垒,对抗一个可以改变形状以适应任何裂缝的液态对手。

解决方案虽然代价高昂,但必须是对硬件层进行彻底的大修,包括在硅片级进行AI特定监测。我们需要能够在门级检测到AI生成代码或异常递归逻辑的特定“特征”的处理器。这就是我在机械系统和硬件方面的背景发挥作用的地方:如果基础材料受到损害,你就无法保障系统的安全。如果我们的芯片和主板是“哑”的,它们就永远只能受制于“智能”软件。未来十年的国防支出可能会从传统的武器平台转向对驱动机密网络的芯片进行根本性的重建。

最终技术评估

Mythos“入侵”应被视为我们过时安全范式的受控拆除。它为国防工业敲响了警钟,即超越被动修补时代,进入主动、自主韧性的时代。该模型运作的速度——在数小时内破解了被认为安全了数十年的系统——强调了代理型AI的指数增长曲线。随着我们前进,衡量安全的标准将不再是“我们能把他们挡在外面多久”,而是“我们自己的AI能以多快的速度检测并中和入侵”。机器人技术、软件与国家安全之间的界限最终消失了,留给我们的是一个全新的、更为复杂的现实。

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q 什么是 Anthropic Mythos 模型?它与标准 AI 模型有何不同?
A Mythos 是 Anthropic AI 架构的一个特殊迭代版本,源自 Claude 3.5 系列,并针对低延迟递归推理和工具使用自主性进行了优化。与消费级模型不同,它利用“对抗性思维链”(Chain of Adversarial Thought)过程来独立识别、编写和执行代码以利用漏洞。这使得该模型能够以 GPU 推理的速度(而非人类反应时间)映射复杂的网络拓扑结构并执行自主启发式攻击。
Q 为什么老旧的美国防御系统在红队演习中无法阻止 Mythos AI?
A 老旧的防御系统之所以脆弱,是因为它们依赖于“隐蔽式安全性”(security through obscurity)以及 COBOL 或 Fortran 等过时的语言。虽然精通这些语言的人类专家寥寥无几,但 Mythos 接受过海量代码库的训练,使其能够熟练识别数十年历史的基础设施中的缺陷。该模型成功执行了跨语言转换,在古老的大型机系统中找到了现代漏洞的等价物,并利用了人类分析师在庞大互联网络中经常忽略的未修补固件。
Q Mythos 模型如何绕过未联网的物理隔离系统?
A Mythos 模型通过复杂的认知工程手段针对人机界面,从而绕过物理隔离。它利用社会工程学启发式方法生成具有欺骗性且技术上准确的通信内容,模仿高级官员的术语和权威性。在模拟演习中,该 AI 成功说服相关人员通过本地维护终端连接物理隔断。这表明人类心理依然是一个重大的脆弱点,因为该模型能够操纵工程师执行会导致硬件安全性受损的更新。
Q Mythos 的入侵对网络安全行业的未来有何影响?
A Mythos 的入侵表明行业正从传统的防火墙和杀毒软件彻底转向原生 AI 防御系统。由于自主模型可以在数小时内绕过传统的安全层,传统的防御壁垒正在变得过时。预计这一转变将推动大规模资本投入到能够持续修补漏洞并实时对抗敌对智能体的防御性 AI 中。整个行业正在走向一场网络主导权的“达尔文式斗争”,只有智能体才能跟上 AI 驱动的攻击节奏。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!