五角大楼证实 Grok AI 在 96 小时内锁定 2,000 个目标

Grok
The Pentagon Confirms Grok AI Targeted 2,000 Sites in 96 Hours
五角大楼官员证实,埃隆·马斯克的 Grok AI 已被整合进军事行动,以支持针对伊朗的高强度打击任务。

在一次彻底改变我们对消费级人工智能与动力战争之间接口认知的披露中,五角大楼证实,xAI 的 Grok 聊天机器人曾在一场大规模军事行动中发挥了关键作用。在代号为“史诗之怒行动”(Operation Epic Fury)的 96 小时高强度作战期间,美军利用该 AI 模型在伊朗境内识别并处理了超过 2,000 个目标。这一披露出现在五角大楼首席数字与人工智能官(CDAO)Cameron Stanley 的宣誓证词中,标志着一个最初作为“无政治正确倾向”(woke-free)社交媒体助手进行营销的大语言模型(LLM),首次被证实是现代“杀伤链”的核心组成部分。

对于我们这些追踪机器人和自动化机械与工业演进的人来说,这不仅是政策上的转变,更是一个技术里程碑。在短短四天内处理 2,000 个目标的能力,代表了一种超过人类情报小组认知能力的吞吐量。这标志着向工业化规模目标的转变,即瓶颈不再是数据分析,而是弹药的物理投送。

集成至 Maven 智能系统

此次部署背后的技术架构依赖于 Grok 与五角大楼“Maven 智能系统”(Maven Smart Systems)的集成。Project Maven 是国防部的旗舰 AI 项目,旨在自动化处理海量的全动态视频和信号情报。传统上,这涉及利用计算机视觉算法在卫星图像中识别坦克或导弹发射车。然而,Grok 的加入表明,五角大楼正转向利用生成式 AI 和先进的推理模型,将非结构化数据合成为可操作的目标数据包。

据 Stanley 称,Grok 的角色并非自主扣动扳机,而是支持决策过程。在“史诗之怒行动”的背景下,这可能涉及解析截获的通信、物流报告和地理数据,以优先处理那些能最大化作战影响的目标站点。通过将高性能大语言模型集成到闭环中,军方实现了此前无法达到的数据到打击的延迟水平。这就是情报的工业化:将原始信息转化为成品(目标),且在连续四天的时间里,平均每 2.8 分钟就能产生一个目标。

硬件骨干:为何数据中心是国家安全资产

关于 Grok 军事用途的确认并非来自传统的新闻发布会,而是来自法庭。这一披露是在政府为 xAI 在密西西比州的数据中心运营进行辩护时浮出水面的。该设施此前因使用据称违反当地污染标准的燃气轮机而受到 NAACP(全国有色人种协进会)领导的诉讼,司法部律师将其描述为“对国家安全至关重要”。

从工程角度来看,这种法律辩护凸显了战时 AI 对电力需求的巨大依赖。为了保持在战区范围内进行实时瞄准所需的计算吞吐量,xAI 需要强大且冗余的电力供应。燃气轮机的使用表明,该地区现有的电网无法支撑 xAI“巨型”集群所需的激增容量。当政府主张环境法规必须为这些数据中心让路时,他们明确表示,密西西比州的冷却风扇和 H100 GPU 对现代战争机器的重要性,不亚于坦克工厂的装配线。

精度、附带损害与问责缺口

虽然五角大楼强调了 Grok 瞄准的效率,“史诗之怒行动”带来的人员伤亡代价已成为争议的焦点。有报道称,这些据称针对伊朗最高领导层和军事基础设施的打击,也命中了包括一所女子学校在内的平民地点。国际观察员援引了数千名平民伤亡的报告,这提出了一个关键问题:AI 辅助瞄准是提高了精度,还是仅仅增加了打击总量,以至于附带损害在统计学上变得不可避免?

关于“人在回路”(human-in-the-loop)系统的辩论已到了临界点。参议员 Kirsten Gillibrand 和其他立法者对缺乏明确的防护栏表示了迫切的担忧。如果一名人类军官在单个班次中面对 AI 处理的 500 个目标,那么有效“核实”每个目标的能力将荡然无存。人类变成了机器逻辑的橡皮图章。在这种情况下,算法的精度仅取决于输入的数据,模型中的任何偏见或幻觉都可能导致灾难性的现实后果。

Grok 是否是主权 AI 的新标准?

五角大楼承认 Grok 是极少数获准在机密网络上使用的 AI 系统之一,这对 Elon Musk 的 xAI 在竞争激烈的国防承包领域而言是一次重大胜利。传统上,这一领域由老牌企业或 Palantir 等专业 AI 公司主导。通过在高度敏感的冲突中证明 Grok 的效用,xAI 已将自己定位为能够以现代战场速度运作的主权 AI 提供商。

这一认证意味着 Grok 已经满足了处理“绝密”数据的严格安全标准,而这一过程通常需要数年时间。Grok 被集成和部署的速度表明,特朗普政府在利用商业 AI 突破来实现军事优势方面具有强烈的紧迫感。这也暗示了 Grok 的“未经滤”特性可能被视为军事背景下的一种优势,因为其他大语言模型中过于谨慎的“安全”过滤器可能会干扰战略分析的冷峻逻辑。

AI 驱动战争的工业影响

当我们展望机器人和自动化系统的未来时,Grok 在伊朗的打击行动代表了一个转折点。我们正在告别“智能炸弹”时代,迈向“智能战役”时代。在前者中,情报位于单枚导弹的弹头中;而在后者中,情报位于远程数据中心,同时指挥着成千上万个作战资产的移动与部署。

这种转变的机械现实是深刻的。它要求重新思考整个战争供应链。如果 AI 能在 96 小时内生成 2,000 个目标,军方就必须具备相应的后勤能力来提供 2,000 枚弹药、实施打击的架次以及确认影响的传感器。这产生了对自主投送系统——即能够匹配 AI 软件节奏的无人机和机器人平台——的巨大需求。

归根结底,在“史诗之怒行动”中使用 Grok 提醒我们,民用技术与军事硬件之间的界限实际上已经消失。用于总结 X(原 Twitter)上帖子内容的模型,现在正被用于瓦解一个主权国家的防空网络。对于构建这些系统的工程师和开发者来说,责任从未如此重大。我们不再仅仅是构建对话工具,我们正在构建 21 世纪冲突的认知基础设施。

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q 在“史诗愤怒行动”(Operation Epic Fury)中,Grok AI 是如何被使用的?
A 在为期 96 小时的“史诗愤怒行动”中,美军将 Grok 集成到“Maven 智能系统”(Maven Smart Systems)中,以识别并处理超过 2,000 个伊朗目标。该大语言模型(LLM)并非自主发射武器,而是将包括拦截通讯和物流报告在内的非结构化数据综合成可执行的打击包。这实现了前所未有的数据到打击的延迟,使军方在整个任务期间能够以大约每 2.8 分钟一个目标的频率优化打击目标。
Q 为什么位于密西西比州的 xAI 数据中心被视为国家安全问题?
A 美国司法部将位于密西西比州的 xAI 设施定性为对国家安全至关重要,因为它为实时军事打击提供了所需的计算能力。该设施部署了大规模的 H100 GPU 集群,需要燃气轮机提供高容量、冗余的电力,以维持其在主动行动期间的吞吐量。这一战略重要性已被用作法律辩护,以优先保障数据中心运营,而非遵守当地的环境法规和污染标准。
Q 在军事打击链中使用人工智能引发了哪些伦理担忧?
A 批评人士和立法者对人工智能辅助战争中“有意义的人类监督”的丧失表示担忧。当系统每班次生成数百个目标时,人类操作员可能只会沦为算法逻辑的“橡皮图章”,而无法逐一核实打击任务。这种速度增加了灾难性错误或“幻觉”的风险,近期针对伊朗基础设施的高强度打击行动中,就有关于女子学校等地点发生平民伤亡的报告。
Q 与五角大楼使用的其他 AI 模型相比,Grok 有什么独特之处?
A Grok 是极少数获准在最高机密网络中使用的通用大语言模型之一。与一些具有严格安全过滤器的消费级 AI 模型不同,Grok 被推广为一种更“无滤镜”的工具,军方领导层可能认为这在进行冷静的战略分析时更具优势。它被快速集成到“Maven 项目”中,表明美军倾向于使用能以超出人类认知能力的速度处理海量数据的高性能商业大语言模型。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!