SpaceX 转型基础设施领域,与 Anthropic 达成 450 亿美元算力协议

xAI
SpaceX Pivots to Infrastructure with $45 Billion Anthropic Compute Agreement
人工智能行业迎来重大变革:SpaceX 已签下一份为期多年、价值 450 亿美元的合同,将为 Anthropic 的 Claude AI 提供高密度计算基础设施。

随着 SpaceX 与 Anthropic 达成一项 450 亿美元里程碑式协议的消息公布,人工智能基础设施格局在一夜之间发生了转变。这项交易专注于为 Anthropic 的 Claude AI 模型提供大规模计算能力,标志着这家航天巨头战略方向的重大转变。根据合同条款,SpaceX 将利用其在电源管理、散热冷却和全球连接方面的专业知识,构建一系列专门针对大规模模型训练和推理进行优化的下一代数据中心。

对于 Anthropic 而言,此举代表了其技术栈的战略多元化。这家总部位于旧金山的人工智能公司过去一直依赖亚马逊云科技 (AWS) 和 Google Cloud 等传统云服务提供商,如今正寻求打破算力可用性的瓶颈。随着模型复杂度的增加,下一代 Claude 对硬件的要求已超出了标准企业数据中心的能力范围。通过与 SpaceX 合作,Anthropic 将赌注押在了一家以航空航天工程而非传统 IT 管理视角看待热能与能源问题的公司身上。

高密度计算工程

从机械工程的角度来看,从制造火箭到建造 AI 超级计算机的转型比表面上看起来更为合乎逻辑。这两个行业的核心都是热管理问题。现代 AI 加速器,如 NVIDIA 的 H100 和即将推出的 Blackwell 芯片,会产生巨大的热量。在传统数据中心中,散热往往是性能密度的首要制约因素。然而,SpaceX 在管理 Raptor 发动机的极端热负荷以及 Starship 所需的高性能电子设备方面拥有数十年的经验。

这笔 450 亿美元的投资预计将用于建造“计算殖民地”(Compute Colonies)——即利用类似于航空航天硬件中的闭环液冷系统的专业数据中心。这些设施旨在处理远超传统风冷甚至标准液冷服务器机架所能承受的功率密度。通过利用先进的热交换器和专有的流体动力学模型,SpaceX 旨在在比任何现有提供商更小的物理空间内集成更多的每秒浮点运算次数 (FLOPS)。

Starlink 与延迟悖论

这项交易中最引人入胜的方面之一是 Starlink 卫星星座的整合。虽然大多数 AI 训练发生在中心化场所,但推理侧(用户与 Claude 交互的地方)却能从降低的延迟和边缘分布中显著受益。SpaceX 计划利用 Starlink 的激光链路网络构建高速数据主干网,绕过传统光纤的拥堵。无论用户身处何地,这都能实现与 Claude 更灵敏的交互。

此外,在偏远地区部署具有即时、高带宽连接的计算节点具有独特的优势。传统数据中心往往受限于现有的城市电网,而这些电网正日益紧张。SpaceX 的模块化方法允许他们在未充分利用的能源(如偏远的水电或太阳能设施)附近选址计算集群,并使用 Starlink 来弥补数据缺口。这种将数据中心从城市电网中“解耦”的做法是这 450 亿美元估值的重要组成部分,为 Anthropic 提供了其他 AI 公司目前所不具备的地理灵活性。

Anthropic 为何将目光投向“三巨头”之外

从技术角度来看,当前的云模式建立在虚拟化和多租户基础之上——这些软件层增加了开销和复杂性。Anthropic 的新交易表明其正迈向“裸机”主导地位。通过剥离标准云服务的抽象化,让 Claude 直接运行在由 SpaceX 工程团队优化的硬件上,该公司可以从每瓦特中榨取更多的性能。在 AI 领域,电力是最大的经常性成本,效率提升 10% 或 15% 可能意味着模型生命周期内节省数十亿美元。

定制基础设施的经济可行性

450 亿美元的价格标签不仅是为了硬件,更是对整个计算供应链的投资。SpaceX 展示了垂直整合复杂制造流程的独特能力。如果 SpaceX 能将应用于发射成本的成本削减策略(即降低一个数量级)同样应用于数据中心建设,那么 Anthropic 的投资回报率将变得显而易见。目前训练前沿模型的成本估计在数亿美元,不久后将达到数十亿美元。掌控基础设施是保持这些成本可持续的唯一途径。

能源与物流的范式转移

除了芯片和卫星,SpaceX 与 Anthropic 的交易凸显了 AI 与能源基础设施之间日益紧密的交集。高性能计算正成为工业规模的能源消耗大户。SpaceX 已暗示将开发移动或模块化电源解决方案,或许会利用他们在电池和太阳能方面的研究,以确保即使在当地电网不稳定的情况下,数据中心也能保持运行。这种韧性对于 Anthropic 至关重要,因为其服务正越来越多地集成到全球关键业务工作流中。

运输和安装数以万计的专业服务器机架的物流挑战也是 SpaceX 的强项。利用与协调 Starbase 和肯尼迪航天中心发射相同的物流框架,预计该公司能够以传统建筑公司无法比拟的速度推出基础设施。这种快速部署能力是 Anthropic 愿意向传统科技领域之外的合作伙伴投入如此巨额资金的核心原因。

对 AI 行业的长期展望

当我们展望本十年末时,这笔 450 亿美元的交易很可能被视为 AI 基础设施成为独立工业部门的时刻。此次合作表明,下一代 AI 将不会建立在现有网络技术的基础上,而是建立在高密度、高效率的物理工程新基石之上。航天级热管理与前沿 AI 模型开发的融合,标志着技术格局进入了一个新时代。

对于更广阔的市场而言,这笔交易敲响了警钟。“轻松计算”的时代已经结束,“工业计算”的时代已经开启。无法获得长期、高效基础设施的公司将发现自己无法与那些拥有此类基础设施的公司竞争。通过锁定 SpaceX 的工程实力,Anthropic 为 Claude 争取到了延伸至 2030 年代的增长空间,为人工智能时代的领导者树立了新标杆。

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q SpaceX 与 Anthropic 之间价值 450 亿美元协议的主要目的是什么?
A 该协议确立了 SpaceX 作为 Anthropic Claude AI 模型的主要基础设施提供商的地位。SpaceX 将开发专门用于大规模模型训练和推理的高密度数据中心。通过利用航空航天工程在电源管理和散热方面的技术,SpaceX 旨在克服标准企业数据中心的物理限制,为 Anthropic 提供更高效、可扩展的下一代人工智能平台。
Q SpaceX 如何应用航空航天工程来管理 AI 硬件产生的热量?
A SpaceX 正在实施名为“计算殖民地”(Compute Colonies)的专业数据中心,利用闭环液体冷却系统和先进的热交换器,借鉴了其管理猛禽(Raptor)火箭发动机等极端热负荷的经验。这些系统旨在处理 NVIDIA Blackwell 等现代 AI 加速器产生的剧烈热量。通过使用专有的流体动力学模型,SpaceX 能够比传统风冷设施在更小的占地面积内集成更多的计算能力。
Q Starlink 卫星星座在这次基础设施交易中扮演什么角色?
A Starlink 利用激光链路技术提供高速数据骨干网,有助于降低用户与 Claude 交互时的延迟。这种连接性使 SpaceX 能够将数据中心放置在水电站或太阳能装置等偏远能源附近,从而摆脱对城市紧张电网的依赖。Starlink 为这些偏远站点弥合了数据鸿沟,确保了高带宽访问,同时允许 Anthropic 在不受限于当地光纤可用性的情况下,利用不同地理位置的闲置能源基础设施。
Q 为什么 Anthropic 在计算需求上要远离传统的云服务提供商?
A Anthropic 正寻求通过转向专门为其 AI 模型优化的裸机基础设施,以绕过多租户云环境的软件开销和性能瓶颈。这种转变提高了每瓦性能的效率,鉴于前沿模型巨大的电力成本,这一点至关重要。通过与 SpaceX 合作,Anthropic 获得了垂直整合的制造和物流支持,有望降低训练和部署日益复杂的 AI 系统的长期成本。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!