五角大楼被曝使用 Grok AI,标志着算法战争新时代的到来

Grok
The Pentagon’s Alleged Use of Grok AI Signals a New Era of Algorithmic Warfare
深入剖析近期法庭文件,揭露五角大楼将埃隆·马斯克的 Grok AI 整合至进攻性行动中的传闻,探讨大型语言模型在杀伤链中的技术可行性与战略影响。

对于我们这些跟踪机器人技术与工业自动化交集的人来说,商业大语言模型(LLM)被重新利用于动力打击(kinetic operations)的想法,既在技术上极具刺激性,又在战略上令人警惕。它暗示了通用生成式AI与专业战术软件之间传统壁垒的瓦解。为了弄清这种整合是否可行,我们必须超越头条新闻,分析将基于文本的AI与导弹火控系统的复杂遥测技术桥接起来所需的工程架构。

自动化杀伤链的架构

在军事术语中,“杀伤链”(kill chain)是指动力打击的端到端过程:发现(Find)、固定(Fix)、跟踪(Track)、瞄准(Target)、交战(Engage)和评估(Assess),即 F2T2EA。传统上,这些步骤中的每一步都需要高保真传感器数据、人在回路(human-in-the-loop)的验证,以及专为低延迟决策而设计的专业软件。关于 Grok——一个主要基于实时社交媒体数据和互联网文本训练的模型——涉入其中的指控表明,其角色很可能处于杀伤链的“瞄准”或“评估”阶段,充当数据合成器而非直接的触发机制。

其技术可行性取决于“传感器融合”的概念。现代战争从卫星、无人机和信号情报(SIGINT)中产生PB级的数据。现代军工复合体的瓶颈不在于发射能力,而在于分析能力。如果 xAI 的基础设施被整合进五角大楼的联合全域指挥与控制(JADC2)框架,从理论上讲,Grok 可以被用于识别人类分析师可能遗漏的部队行动模式或雷达特征,进而输出目标数据供人类审查。

从商业AI到动力AI的转型

OpenAI 和 xAI 等公司在 AI 政策上的演变,为这些指控铺平了道路。从历史上看,商业 AI 开发人员一直严格禁止将其技术用于军事或动力目的。然而,在2024年初,这些限制中的许多开始悄然瓦解。OpenAI 更新了其服务条款,允许用于不涉及直接武器开发的军事应用;而埃隆·马斯克(Elon Musk)通过 SpaceX 和 Starlink 与国防部门建立的深厚联系,为 xAI 进入这一领域提供了合理的路径。

SpaceX 的 Starshield 是 Starlink 卫星星座的专用军事版本,已经提供了现代无人机和导弹行动所需的高带宽、低延迟通信主干。将 Grok 纳入该生态系统将代表杀伤链的垂直整合:眼睛(卫星)、大脑(Grok AI)和肌肉(动力硬件)。对于一名技术记者来说,这是工业协同效应的终极表现:提供全球互联网的相同基础设施,可以同时作为精确战争的神经系统。

然而,使用 LLM 进行瞄准会引入重大风险,主要是“幻觉”问题。在商业环境中,AI 产生幻觉可能只会给出一个错误的日期;但在战术环境中,幻觉会导致附带损害或针对非战斗人员基础设施的打击。这里的工程挑战在于验证与确认(V&V)。你如何对应对“黑箱”神经网络进行压力测试,以确保其瞄准逻辑是100%确定性的?目前航空航天或核能等安全关键系统的工业标准,尚未建立起一套用于认证生成式 AI 在致命回路中可靠性的框架。

为何要将 LLM 用于导弹打击?

人们可能会问,为什么五角大楼会选择 Grok 而不是现有的、专门构建的军事 AI,如 Palantir 的 AIP 或在“Maven 项目”(Project Maven)下开发的遗留系统。答案很可能在于 Grok 对实时数据流的访问权限。Grok 具有独特优势,可以随时摄取和处理来自 X(前身为 Twitter)的信息。在中东地区,当地社交媒体往往在官方情报渠道获悉前几分钟就报道了部队动向或现场损毁情况,Grok 提供了传统系统可能缺乏的态势感知速度。

这种“速度优势”(speed-to-lead)是现代战争的核心货币。如果法庭文件中的指控准确,五角大楼可能利用 Grok 根据社交媒体聊天和区域数据源执行实时损害评估或识别“机会目标”。这将有效地把整个互联网变成国防部的传感器阵列,而 Grok 则作为该数据的主要过滤器。

法律与道德影响

引发这场讨论的法庭文件似乎源于内部纠纷或举报人声称,凸显了科技工作者与军工复合体之间关系的脆弱性。对于 xAI 的工程师来说,从构建一个“寻求真理”的聊天机器人转变为动力战争的工具,代表了职业责任的巨大转变。它引发了关于当 AI 开发人员的代码被用于执行致命打击时,他们应承担何种责任的基本问题。

此外,在针对伊朗的打击中使用 AI 具有沉重的地缘政治分量。如果发现一个 AI 模型决定了攻击条款,这将使国际战争的法律框架复杂化。谁对错误的打击负责?是授权 AI 输出的指挥官,是设计神经网络权重的工程师,还是提供服务的公司?国际法目前仍在与“有意义的人类控制”这一概念进行抗争,而 Grok 的涉嫌使用将这场辩论推向了一个新的、更紧迫的领域。

我们还必须考虑对手国家的反应。如果美国将 LLM 整合到其进攻能力中,这将引发一场 AI 军备竞赛。伊朗、中国和俄罗斯等国不可避免地会寻求通过其自身由 AI 驱动的电子战和欺骗技术来对抗这些算法系统,旨在向 Grok 等模型中输入虚假数据,从而导致杀伤链出现错误。

技术现实核查

尽管法庭文件的性质轰动,但我们必须对 Grok 在多大程度上“直接”负责导弹发射持怀疑态度。在当前的机器人和航空航天工程中,火控系统是高度物理隔离的,并依赖于确定性逻辑。将像 LLM 这样非确定性的模型直接集成到发射序列中,将是对既定安全协议的极大背离。更有可能的是,Grok 是在决策支持角色中使用——汇总情报报告、预测对手可能的反应,或为打击优化后勤——而不是字面意义上扣动扳机。

这里真正的故事不仅仅是关于某一个特定的 AI 或某一次特定的打击;它是关于“军事 AI-工业复合体”的快速成熟。我们正在迈向一个商业软件工程师与国防承包商之间区别不复存在的未来。随着我们继续自动化全球防御系统的供应链和指挥结构,幕后工程师的精确度和分析严谨性正成为国家安全最关键的组成部分。

随着局势的发展,重点必须放在技术审计追踪上。如果五角大楼确实在这一能力上使用了 Grok,那么公众和科学界有权知晓相关的保障措施。在高风险的工业自动化世界中,当输出结果以生命和地缘政治稳定来衡量时,绝无容纳“幻觉”的空间。硅与钢之间的桥梁从未像现在这样具有深远影响。

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q Grok 在五角大楼“杀伤链”(kill chain)中据称扮演什么角色?
A 据称,Grok 主要用于军事杀伤链中的“目标识别”和“评估”阶段,而非作为直接的触发机制。通过与五角大楼的“联合全域指挥与控制”框架整合,该人工智能能够综合来自卫星和传感器的海量数据流。这使其能够识别出人类分析师可能忽略的部队调动和行为模式,为军事决策者提供关键的态势感知和损伤评估。
Q Grok 对实时社交媒体数据的访问权限如何使军事行动受益?
A Grok 具有独特的优势,可以摄入来自 X(前身为 Twitter)的实时信息,这些信息往往比传统情报渠道更早报告部队调动或地点损毁情况。这提供了一种“先发制人”的速度优势,有效地将全球社交媒体舆论转化为大规模传感器阵列。五角大楼可以利用这些实时数据来识别目标机遇并进行快速损伤评估,显著缩短了从信息收集到采取军事行动的时间。
Q 将 Grok 这类大语言模型用于目标定位有哪些主要技术风险?
A 最重大的技术风险是“幻觉”现象,即人工智能会生成言之凿凿但事实错误的信息。在作战环境中,人工智能的幻觉可能导致错误攻击非战斗人员基础设施或造成平民伤亡。目前安全关键系统的工业标准尚缺乏认证生成式人工智能可靠性的框架。确保黑箱神经网络的目标定位逻辑保持确定性和准确性,依然是一项巨大的工程和伦理挑战。
Q 为什么五角大楼会选择 Grok 这样的商业人工智能,而不是专门的军事软件?
A 与通过传统的采购周期开发定制化军事系统相比,利用 Grok 这类现成的商业人工智能模型具有更高的成本效益且速度更快。像 xAI 这样的私营公司在研发上投入了数十亿美元,使国防部能够立即获得前沿技术。此外,Grok 与 SpaceX 的“星盾”(Starshield)卫星星座的整合,提供了强大的高带宽通信主干网,这是现有的传统军事系统难以比拟的。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!