美军并未将埃隆·马斯克的 Grok 用于军事打击

Grok
The US Military Is Not Using Elon Musk’s Grok for Kinetic Strikes
有报道称美军在中东地区的打击任务中使用了埃隆·马斯克旗下 xAI 公司的“Grok”模型,这反映出对算法战争及军事软件架构的严重误解。

在算法战争飞速发展的背景下,数字媒体中近期流传着一种耸人听闻的说法:美国军方正在利用 Elon Musk 旗下 xAI 公司开发的 Grok AI 来识别并打击中东地区的目标。虽然这一标题完美结合了高风险地缘政治与对名流科技的狂热追捧,但对美国国防部 (DoD) 当前 AI 基础设施进行的技术审计表明,事实远比这复杂得多,且与 Musk 并无太大关联。这种混淆突显了公众在理解生成式大语言模型 (LLM) 与支撑现代杀伤链 (kill chain) 的专业计算机视觉及传感器融合算法之间,存在着日益扩大的认知差距。

算法定位的架构

要理解为何像 Grok 这样面向消费者的 LLM 在动能打击环境下毫无用处,就必须审视“杀伤链”的机械要求。军方运作遵循被称为 F2T2EA 的周期:发现 (Find)、锁定 (Fix)、跟踪 (Track)、瞄准 (Target)、交战 (Engage) 和评估 (Assess)。这些阶段中的每一个都需要特定类型的计算输出。像 Grok 或 ChatGPT 这样的生成式 AI,旨在进行概率性的语言预测——它猜测句子中下一个最可能的标记 (token)。它本质上是一种表达引擎,而非空间识别引擎。

为什么生成式 AI 在战斗后勤中失效

使用像 Grok 这样的模型进行军事定位的主要技术障碍在于幻觉和延迟问题。在机械工程背景下,我们根据系统的可靠性和故障模式来评估系统。LLM 的故障模式是“自信的错误”——即模型给出的答案在语法上是正确的,但事实却不存在。在战争中,区分平民车辆与武装皮卡可能仅取决于几个像素的差异,而基于 Transformer 的 LLM 的概率性本质是一种负担,而非优势。

此外,国防部对数据孤岛的要求极高。Elon Musk 的 Grok 是基于社交媒体平台 X 的实时数据训练的。从安全角度来看,将机密监控数据输入到商业第三方模型中,是严重的作战安全 (OPSEC) 漏洞。美军更倾向于使用“气隙”隔离或高度受控的云环境,例如通过与 Amazon、Google、Microsoft 和 Oracle 等供应商签订的联合战斗云能力 (JWCC) 合同所提供的环境。这些系统旨在确保用于训练模型的数据始终保留在国防情报企业的受控边界内。

幕后的真正工具

如果军方没有使用 Musk 的 Grok,那他们到底在用什么?答案在于 Project Maven 的成熟。最初,这只是与 Google 的一项争议性合作,后来被内部化并分发给各国防承包商。Maven 已不仅仅是简单的图像识别,它现在充当了一个全面的传感器融合引擎。它从不同来源(信号情报 SIGINT、电子情报 ELINT 和地理空间情报 GEOINT)获取数据,并将它们合成为通用作战图 (COP)。

Palantir 和 Anduril 等公司的工程师开发了中间件,允许这些迥异的数据流进行互通。当中央司令部 (CENTCOM) 的官员谈到 AI 协助缩小目标范围时,他们指的是一个已经标记了特定热特征或符合预定义威胁模式的移动轨迹的系统。随后,人类分析师会对这些被标记的数据进行审查。这是一个“人在回路” (human-in-the-loop) 的系统。那种认为将军问 AI “我们今天该炸哪里?”并从聊天机器人那里得到回复的想法,完全是电影虚构,它忽视了使用致命武力所必需的严格程序审查。

名词趋同的危险

对 Grok 的困惑突显了科技行业的一个重要问题:术语的循环使用。当多个不同的系统被赋予相同或相似的名称时,就会制造出可能影响公共政策和国际关系的误导迷雾。如果一个军事内部工具因为能帮助分析师理解数据而被口语化地称为“grokking engine”,记者或分析师很容易将其与 xAI 的产品混为一谈。然而,从技术角度来看,两者之间的共同点就像飞行模拟器与商用客机之间的关系一样——它们可能共享概念空间,但在工程设计和效用上却大相径庭。

此外,xAI 的商业成功取决于人们将 Grok 视为一种强大且能理解世界的智能的认知。让有关其军事用途的传言流传,可能通过暗示该 AI 比实际更“强硬”或更具能力而达到营销目的。然而,对于我们这些专注于机器人与自动化机械和工业现实的人来说,必须根据数据完整性法则和战术硬件的具体需求来审视这些谣言。

军事 AI 的经济可行性

从经济角度来看,AI 在军事中的整合并非要用“智能”机器人取代人类,而是要提高数据流水线的效率。美军目前拥有的传感器数据远超人类分析师的处理能力。分析师经常被数千小时毫无进展的无人机录像所淹没。AI 在该领域的“增值”纯粹在于过滤。通过自动化识别“目标对象”这一枯燥任务,军方可以减少监控所需的人员,从而降低长期作战的运营成本。

这一经济驱动因素正是我们看到国防科技初创企业激增的原因。这些公司制造的不是通用 AI,而是高度专业化、加固型的算法,旨在运行于自动水下航行器 (AUV) 或小型无人机系统 (sUAS) 的低功耗处理器上。这些才是现代战争中真正的“AI”——可预测、专业化,并严格受制于其物理硬件的约束。

虽然社交媒体聊天机器人指挥导弹打击的设想确实是一个吸引人的叙事,但在技术审查下它会土崩瓦解。美军对 AI 的使用是现实,但这个现实是由专业计算机视觉、严格的数据安全以及对传感器遥测数据的工业级处理所定义的。中东地区 AI 的真实故事并非关于 Elon Musk 的最新投资,而是关于通过专业工程手段,在公众视野之外进行的安静而无情的杀伤链自动化。

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q 为什么埃隆·马斯克的 Grok AI 被认为不适合执行军事目标打击任务?
A Grok 是一种生成式大语言模型,其设计初衷是进行语言预测而非空间识别。在军事行动中,大语言模型会面临“幻觉”问题,即它们会提供看起来确凿但事实错误的信息。对于动力打击任务而言,区分平民和平叛目标所需的精确度至关重要,而基于 Transformer 模型本身所具有的概率性质,使其成为一种在关键战术决策中不可靠且危险的工具。
Q 哪些操作安全方面的担忧阻碍了军队使用商业大语言模型?
A 使用像 Grok 这样的商业模型会带来重大的操作安全风险,因为它是在来自社交媒体的公共数据上进行训练的,并且需要外部连接。国防部要求在物理隔离或高度受控的环境中运行,以防止机密监视数据泄露。目前的军事人工智能基础设施依赖于与亚马逊和微软等供应商签订的安全云服务合同,以确保情报数据保持在严格受保护的边界内。
Q “Maven 项目”(Project Maven)与像 Grok 这样的生成式人工智能产品有何不同?
A 与生成式人工智能不同,“Maven 项目”是一个传感器融合引擎,整合了信号、电子和地理空间情报。该项目与 Palantir 和 Anduril 等合作伙伴共同开发,利用专业的计算机视觉来标记符合威胁特征的模式或热信号。该系统支持“人在回路”(human-in-the-loop)的方法,为分析人员提供审查用的通用作战态势图,而不是基于语言模式生成对话响应或预测。
Q 人工智能在管理军事数据管道中发挥什么作用?
A 军事人工智能的主要作用是作为监视过程中收集的海量传感器数据的过滤器。由于军方产生的无人机影像和情报远超人类分析师的处理能力,算法被用于自动识别目标对象。这提高了效率,减少了持续监控所需的人员数量,并降低了与长期情报任务相关的总体运营成本。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!