生成式 AI 在动能导弹指挥中的技术局限性

认为像 Grok 这样集成社交媒体的大型语言模型（LLM）能够与美国战略导弹库存实现对接的观点，忽略了现代战争中固有的物理和数字安全保障。虽然美国国防部（DoD）确实在积极追求人工智能，但目前正在开发的系统专注于预测性后勤、用于目标识别的计算机视觉以及信号处理，而不是将动力导弹发射程序的钥匙交给一个生成式聊天机器人。要理解为什么这种场景在目前技术上是不可能的，我们必须审视概率模型与确定性火控系统之间的结构性差异。

大型语言模型（LLM）的随机性与确定性火控

将生成式人工智能集成到发射回路中，会将工程师所谓的“幻觉”引入高风险环境。在标准的聊天机器人界面中，幻觉可能只会导致关于历史日期的事实错误。而在涉及 2,000 枚导弹的动力打击场景中，坐标映射或计时逻辑中的幻觉将导致灾难性的附带损害或任务失败。五角大楼目前的火控系统，如“宙斯盾”战斗系统（Aegis Combat System）或综合防空反导作战指挥系统（IBCS），运行在加固的闭环架构上，这些系统将可靠性置于生成式人工智能所提供的“创造力”之上。

此外，运行像 Grok 这样的模型所需的计算开销是巨大的，需要数千个 NVIDIA H100 GPU。这些模型通常托管在集中式云集群中。军事打击，尤其是涉及快速反应弹道导弹的打击，不能依赖云端 API 的延迟。“杀伤链”（Kill Chain）——即发现、定位、跟踪、瞄准、交战和评估的过程——需要边缘计算，即处理能力必须物理位于平台之上或本地化的低延迟网络内。Grok 以目前的形式属于集中式智能，这使其在通信频繁受到干扰的激烈电子战环境中成为一种负担。

Maven 项目与军事人工智能的真实面貌

如果五角大楼不是在使用 Grok 发射导弹，那么它实际上在用人工智能做什么？答案在于 Maven 项目（Project Maven），其正式名称为算法战跨职能小组（Algorithmic Warfare Cross-Functional Team）。Maven 项目成立于 2017 年，专注于计算机视觉。其目标是自动化处理无人机捕获的大量视频数据。与其让一名人类分析师盯着屏幕十二个小时来识别特定的车辆类型，人工智能算法可以实时标记感兴趣的对象。这是一个分类任务，与 LLM 的生成任务有着本质的区别。

五角大楼的“复制器”（Replicator）计划是另一个重点领域，旨在部署数千个自主的、可损耗系统（低成本无人机）以对抗近同等对手。这些系统利用人工智能进行导航和蜂群行为控制，但即便如此，“人在回路”（human-in-the-loop）的原则依然处于核心地位。规定自主武器开发的 DoD 第 3000.09 号指令要求，人类必须对武力的使用行使适当水平的判断权。允许人工智能独立发起 2,000 枚导弹规模的打击，将直接违反这一现行军事政策，同时对于管理硬件的技术团队而言也是一场后勤噩梦。

人工智能在军事中的集成也体现在联合全域指挥与控制（JADC2）框架中。JADC2 旨在将海陆空、海军陆战队和太空军等各军种的传感器连接到一个单一的网络中。人工智能在此处的作用是数据融合：获取来自近地轨道卫星和太平洋潜艇的不同数据点，并将它们合成一个供人类指挥官参考的连贯“通用作战图”。这是一个信息处理任务，而非命令执行任务。

Grok 集成的经济与硬件现实

从工业和经济角度来看，将第三方商业人工智能集成到国防部最敏感的系统中，成本高昂且不切实际。联邦政府优先考虑“主权”技术栈——即每一行代码都可以审计、每一个硬件组件都来自可信供应商的系统。Grok 建立在对互联网的大规模抓取和来自 X 平台实时数据的基础上。对于五角大楼而言，这代表了不可接受的安全风险。对手理论上可以“毒化”商业 LLM 的训练数据来影响其输出，这种漏洞被称为对抗性攻击。

此外，导弹发射的物理基础设施涉及一系列机械联锁装置和加密密钥。要“发射”2,000 枚导弹，需要与发射井、移动发射车和海军发射管对接。这些系统使用遗留协议和专门的硬件接口，与 LLM 所处的基于 Python 的高级环境并不兼容。弥合现代人工智能与遗留的“民兵 III”型导弹发射井或“战斧”导弹发射器之间的鸿沟，需要数年的系统工程、测试和认证——而 xAI 的产品尚未经历这一过程。

埃隆·马斯克与国防部的关系主要通过 SpaceX 及其“Starshield”项目进行。Starshield 为政府使用提供安全的卫星通信和地球观测能力。这是一种“硬件即服务”模式，利用了“星链”（Starlink）星座已证实的可靠性。虽然 SpaceX 为数据提供了“管道”，但它并不为火控序列提供“大脑”。这种区别至关重要：为无人机飞行员提供安全的通信链路，与人工智能机器人决定发动导弹打击有着天壤之别。

作为混合战争工具的虚假信息

声称 Grok 参与军事打击的病毒式报道的出现，突显了信息时代的一项新挑战：以人工智能为主题的讽刺和虚假信息的武器化。这些故事通常起源于恶搞网站或优先考虑点击率而非技术准确性的“垃圾新闻”聚合平台。然而，当这些故事被大型媒体报道或由有影响力的人物分享时，它们可能会产生对技术能力的错误认知，从而影响国际关系和公众对技术的信任。

总之，在当前的技术栈下，使用 Grok 进行动力导弹指挥的技术障碍是不可逾越的。考虑到软件的随机性、缺乏加固的硬件集成、云模型的延迟问题，以及严格的“人在回路”军事准则，所谓人工智能主导的导弹打击只能属于科幻小说的范畴。五角大楼人工智能战略的未来是增强，而非替代。在这个未来，计算机视觉和数据融合将为人类操作员提供更好的信息，确保如果 2,000 枚导弹真的被发射，那将是人类指挥的结果，而不是一个产生幻觉的聊天机器人。

生成式 AI 在动能导弹指挥中的技术局限性

大型语言模型（LLM）的随机性与确定性火控

Maven 项目与军事人工智能的真实面貌

Grok 集成的经济与硬件现实

作为混合战争工具的虚假信息

Noah Brooks

Readers Questions Answered

Have a question about this article?

Comments