生成式 AI 在动能导弹指挥中的技术局限性

Grok
The Technical Impossibility of Generative AI in Kinetic Missile Command
通过深度分析,探讨为何 xAI 的 Grok 无法用于火力控制;文章对比了网络传播的虚假信息与五角大楼实际的 AI 集成策略。

认为像 Grok 这样集成社交媒体的大型语言模型(LLM)能够与美国战略导弹库存实现对接的观点,忽略了现代战争中固有的物理和数字安全保障。虽然美国国防部(DoD)确实在积极追求人工智能,但目前正在开发的系统专注于预测性后勤、用于目标识别的计算机视觉以及信号处理,而不是将动力导弹发射程序的钥匙交给一个生成式聊天机器人。要理解为什么这种场景在目前技术上是不可能的,我们必须审视概率模型与确定性火控系统之间的结构性差异。

大型语言模型(LLM)的随机性与确定性火控

将生成式人工智能集成到发射回路中,会将工程师所谓的“幻觉”引入高风险环境。在标准的聊天机器人界面中,幻觉可能只会导致关于历史日期的事实错误。而在涉及 2,000 枚导弹的动力打击场景中,坐标映射或计时逻辑中的幻觉将导致灾难性的附带损害或任务失败。五角大楼目前的火控系统,如“宙斯盾”战斗系统(Aegis Combat System)或综合防空反导作战指挥系统(IBCS),运行在加固的闭环架构上,这些系统将可靠性置于生成式人工智能所提供的“创造力”之上。

此外,运行像 Grok 这样的模型所需的计算开销是巨大的,需要数千个 NVIDIA H100 GPU。这些模型通常托管在集中式云集群中。军事打击,尤其是涉及快速反应弹道导弹的打击,不能依赖云端 API 的延迟。“杀伤链”(Kill Chain)——即发现、定位、跟踪、瞄准、交战和评估的过程——需要边缘计算,即处理能力必须物理位于平台之上或本地化的低延迟网络内。Grok 以目前的形式属于集中式智能,这使其在通信频繁受到干扰的激烈电子战环境中成为一种负担。

Maven 项目与军事人工智能的真实面貌

如果五角大楼不是在使用 Grok 发射导弹,那么它实际上在用人工智能做什么?答案在于 Maven 项目(Project Maven),其正式名称为算法战跨职能小组(Algorithmic Warfare Cross-Functional Team)。Maven 项目成立于 2017 年,专注于计算机视觉。其目标是自动化处理无人机捕获的大量视频数据。与其让一名人类分析师盯着屏幕十二个小时来识别特定的车辆类型,人工智能算法可以实时标记感兴趣的对象。这是一个分类任务,与 LLM 的生成任务有着本质的区别。

五角大楼的“复制器”(Replicator)计划是另一个重点领域,旨在部署数千个自主的、可损耗系统(低成本无人机)以对抗近同等对手。这些系统利用人工智能进行导航和蜂群行为控制,但即便如此,“人在回路”(human-in-the-loop)的原则依然处于核心地位。规定自主武器开发的 DoD 第 3000.09 号指令要求,人类必须对武力的使用行使适当水平的判断权。允许人工智能独立发起 2,000 枚导弹规模的打击,将直接违反这一现行军事政策,同时对于管理硬件的技术团队而言也是一场后勤噩梦。

人工智能在军事中的集成也体现在联合全域指挥与控制(JADC2)框架中。JADC2 旨在将海陆空、海军陆战队和太空军等各军种的传感器连接到一个单一的网络中。人工智能在此处的作用是数据融合:获取来自近地轨道卫星和太平洋潜艇的不同数据点,并将它们合成一个供人类指挥官参考的连贯“通用作战图”。这是一个信息处理任务,而非命令执行任务。

Grok 集成的经济与硬件现实

从工业和经济角度来看,将第三方商业人工智能集成到国防部最敏感的系统中,成本高昂且不切实际。联邦政府优先考虑“主权”技术栈——即每一行代码都可以审计、每一个硬件组件都来自可信供应商的系统。Grok 建立在对互联网的大规模抓取和来自 X 平台实时数据的基础上。对于五角大楼而言,这代表了不可接受的安全风险。对手理论上可以“毒化”商业 LLM 的训练数据来影响其输出,这种漏洞被称为对抗性攻击。

此外,导弹发射的物理基础设施涉及一系列机械联锁装置和加密密钥。要“发射”2,000 枚导弹,需要与发射井、移动发射车和海军发射管对接。这些系统使用遗留协议和专门的硬件接口,与 LLM 所处的基于 Python 的高级环境并不兼容。弥合现代人工智能与遗留的“民兵 III”型导弹发射井或“战斧”导弹发射器之间的鸿沟,需要数年的系统工程、测试和认证——而 xAI 的产品尚未经历这一过程。

埃隆·马斯克与国防部的关系主要通过 SpaceX 及其“Starshield”项目进行。Starshield 为政府使用提供安全的卫星通信和地球观测能力。这是一种“硬件即服务”模式,利用了“星链”(Starlink)星座已证实的可靠性。虽然 SpaceX 为数据提供了“管道”,但它并不为火控序列提供“大脑”。这种区别至关重要:为无人机飞行员提供安全的通信链路,与人工智能机器人决定发动导弹打击有着天壤之别。

作为混合战争工具的虚假信息

声称 Grok 参与军事打击的病毒式报道的出现,突显了信息时代的一项新挑战:以人工智能为主题的讽刺和虚假信息的武器化。这些故事通常起源于恶搞网站或优先考虑点击率而非技术准确性的“垃圾新闻”聚合平台。然而,当这些故事被大型媒体报道或由有影响力的人物分享时,它们可能会产生对技术能力的错误认知,从而影响国际关系和公众对技术的信任。

总之,在当前的技术栈下,使用 Grok 进行动力导弹指挥的技术障碍是不可逾越的。考虑到软件的随机性、缺乏加固的硬件集成、云模型的延迟问题,以及严格的“人在回路”军事准则,所谓人工智能主导的导弹打击只能属于科幻小说的范畴。五角大楼人工智能战略的未来是增强,而非替代。在这个未来,计算机视觉和数据融合将为人类操作员提供更好的信息,确保如果 2,000 枚导弹真的被发射,那将是人类指挥的结果,而不是一个产生幻觉的聊天机器人。

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q 为什么像 Grok 这样的大型语言模型不适合用于导弹火控系统?
A 大型语言模型具有概率性且容易产生幻觉,这可能导致在动能打击过程中出现坐标映射或时机判断上的灾难性错误。军事火控系统需要由“宙斯盾”作战系统等闭环架构所提供的确定性可靠性。此外,Grok 依赖于集中式云处理和大规模 GPU 集群,与快速响应弹道导弹所需的本地化边缘计算相比,会产生不可接受的延迟和安全风险。
Q 五角大楼的“Maven 项目”(Project Maven)在人工智能方面的主要目的是什么?
A Maven 项目,即算法战跨职能小组,主要侧重于计算机视觉而非生成式任务。其主要目标是实现无人机捕获的海量视频数据中目标对象的自动识别。通过使用算法实时分类车辆类型和其他目标,该项目减轻了人类分析人员的负担。这种人工智能的应用定位是数据处理工具,而非自主决策系统。
Q 国防部指令 3000.09 如何影响自主武器的使用?
A 国防部指令 3000.09 确立了武器系统自主性的政策,要求人类指挥官和操作员必须对武力的使用行使适当程度的判断。这一“人在回路”(human-in-the-loop)原则禁止人工智能独立发起动能打击。军事战略优先考虑人类的问责制和伦理监督,确保技术仍然是用于数据融合和态势感知的辅助工具,而不是人类指挥与控制的替代品。
Q 有哪些技术壁垒阻碍了商业人工智能模型与现有导弹发射井的对接?
A 大多数战略导弹库存使用遗留硬件和专门的加密协议,这些与现代人工智能所使用的基于 Python 的环境不兼容。整合商业模型需要数年的系统工程工作,以弥合高级软件与机械联锁装置之间的差距。此外,五角大楼要求采用经过审计的自主技术栈,以防止对抗性数据投毒,对于像 Grok 这样基于公共互联网数据训练的模型而言,这仍然是一个巨大的风险。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!