GPT-5.5 与 Mythos:重新定义智能体计算的前沿

Anthropic
GPT-5.5 and Mythos Redefine the Frontier of Agentic Computing
OpenAI 发布了专注于自主多步推理的 GPT-5.5,与此同时,英国银行业正积极寻求应用 Anthropic 的专用模型 Mythos 以加强网络安全。

随着OpenAI的GPT-5.5和Anthropic的Mythos同时问世,人工智能的格局已从对话式界面转向了自主智能体(autonomous agents)。本周,OpenAI宣布发布GPT-5.5,该模型旨在以极少的人为干预处理复杂的、多部分的任务。几乎与此同时,有报道称英国政府正在与Anthropic积极谈判,计划将其Mythos模型提供给英国领先的银行和企业。这些同步的进展标志着全球人工智能竞赛的转折点:关注点不再仅仅是模型说话的能力,而是其在数字或工业环境中执行任务的有效性。

OpenAI的GPT-5.5与智能体自主化的推进

OpenAI发布GPT-5.5标志着大型语言模型(LLM)优化领域的一个重大技术里程碑。根据技术文档,该模型比前代产品速度更快、更直观。GPT-5.5的核心价值主张在于其“智能体”(agentic)能力。与需要通过迭代提示才能实现复杂目标的早期版本不同,GPT-5.5旨在自主规划、使用工具并应对模糊性。对于工业应用而言,这意味着可以将杂乱的任务——例如调试遗留代码库或进行深度市场调研——交给该模型,并由其在无需持续监督的情况下完成。

从机械工程的角度来看,GPT-5.5的效率尤其值得关注。OpenAI在提供更高水平智能的同时,成功匹配了GPT-5.4的每标记(per-token)延迟。此外,据报道,该模型在完成复杂任务时使用的标记数量明显减少,这直接转化为企业用户更低的运营成本。在计算成本成为自动化投资回报率关键变量的工业环境中,这种标记效率代表着向大规模人工智能部署的经济可行性迈出了重要一步。此次发布将集成到ChatGPT Plus、Pro和Enterprise层级中,API访问权限预计随后开放。

Anthropic的Mythos与英国银行业的豪赌

虽然OpenAI将GPT-5.5定位为通用型智能体,但Anthropic的Mythos模型正在高风险网络安全和漏洞检测领域开拓出一片利基市场。英国《金融时报》报道称,英国政府正寻求为其银行业获取Mythos的使用权限,此举正值监管机构竞相评估此类强大软件的风险与回报之际。Mythos已在美国“Project Glasswing”计划下部署,该网络安全倡议涵盖了CrowdStrike、Palo Alto Networks和Linux基金会等重量级机构。

Mythos的技术魅力在于其能够“像剥鸡蛋一样破解软件”。Anthropic表示,该模型在网络安全方面的优势是其卓越的编码和推理能力的副产品。一个能够深刻理解复杂软件架构的模型,同样能够发现人类审计员可能忽略的细微缺陷。对于面临来自国家级行为体和人工智能辅助黑客日益复杂威胁环境的英国银行业来说,Mythos代表了一道防御盾牌。然而,此举并非没有争议;据报道,尽管五角大楼内部就Anthropic作为潜在供应链风险的地位存在持续争议,美国国家安全局(NSA)仍在使用Mythos预览版。

对欧盟的战略性排除

有趣的是,这项技术的地缘政治分布远非均匀。虽然英国和美国正在将Mythos整合到其核心金融和安全基础设施中,但Anthropic明显将其最先进的网络人工智能模型排除在欧盟之外。这种排斥凸显了欧盟谨慎的《人工智能法案》框架与美国及后脱欧时代的英国所采取的更具侵略性、增长导向的立场之间日益扩大的监管分歧。对于总部位于欧盟的企业而言,这在网络安全防御和软件开发速度方面都造成了潜在的竞争劣势。

这种准入权的差异凸显了一个现实,即前沿人工智能模型正日益成为战略性国家资产。在全球供应链和工业自动化的背景下,部署Mythos等专业模型的能力可能成为决定国家经济韧性的关键因素。如果英国银行能够利用Mythos自动检测金融欺诈和系统漏洞,尽管欧洲经济持续动荡,它们仍可能实现一种运营安全水平,使伦敦市场对全球资本更具吸引力。

Mythos和GPT-5.5如何重写网络防御计算

这些模型的到来本质上改写了网络安全专家的计算方式。历史上,网络防御是一门反应性学科:发现漏洞、开发补丁,然后保护系统。有了Mythos和GPT-5.5,这个过程变得主动。这些模型可以模拟攻击,在恶意行为者利用之前识别潜在漏洞,甚至建议(或实现)必要的代码更改以加固系统。

然而,正如安全专家Bruce Schneier所指出的,这种力量是一把双刃剑。允许模型修复漏洞的智能同样可以使它找到可供利用的漏洞。这种二元性是当前人工智能时代的核心张力。对于工业实体而言,整合这些模型的决策涉及复杂的风险收益分析。一方面,安全审计的自动化可以节省数百万美元的潜在违规成本;另一方面,在敏感金融系统中引入第三方人工智能引入了一种监管机构或工程师尚不完全理解的新型供应链脆弱性。

智能体计算的工业现实

对于我们这些专注于机器人与人类工业接口的人来说,GPT-5.5最引人注目的方面是其“计算机使用”(computer use)能力。OpenAI强调,该模型能够操作软件并在不同工具间切换,直到任务完成。在制造或供应链背景下,这预示着未来人工智能智能体可以管理物流软件,根据仓库机器人的实时数据调整库存水平,并与供应商沟通以解决差异——所有这些都在一个单一的、自主的工作流程中完成。

这种向计算机使用和智能体推理的转变,代表了人工智能数字“大脑”与工业硬件物理现实之间的桥梁。虽然GPT-5.5目前是一个基于软件的实体,但其逻辑是下一代机器人控制器的蓝图。应对模糊性和自行核对工作的能力,正是机器人从高度受控的汽车装配线环境进入建筑、农业和复杂物流等更混乱世界所必需的特质。

GPT-5.5和Mythos的同步崛起表明,万能LLM的时代可能正在结束。相反,我们正在进入一个专业智能的时代。OpenAI正在构建智能体工作的通用“操作系统”,而Anthropic正在为软件完整性这一特定高风险领域构建“外科医生工具”。对于全球市场而言,挑战在于将这些截然不同的工具整合到一个连贯且安全的技术堆栈中。

随着这些模型开始渗透到英国银行业系统和全球企业的API工作流中,重点必须保持在精确性上。工程思维要求我们看穿营销宣传,关注数据:标记成本、延迟数据以及这些自主智能体的实证成功率。GPT-5.5和Mythos不仅仅是新工具;它们是一个工业环境的先驱,在这个环境中,人类策略与机器执行之间的界限日益模糊。对于英国来说,对Mythos的押注可能是一次防御工程的精湛之作,前提是他们能够管理好自己引入金库的这种力量所带来的内在风险。

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q OpenAI 的 GPT-5.5 在智能体能力方面与以往模型有何不同?
A GPT-5.5 代表了从对话式人工智能向自主智能体计算的转变。与以往需要人类持续提示的模型不同,GPT-5.5 旨在独立规划和执行多步骤任务,例如调试旧代码或进行深度市场调研。它通过提高令牌效率实现了这一点,这意味着它在以更少的计算能力完成复杂目标的同时,仍保持了其前身 GPT-5.4 所建立的低延迟水平。
Q 英国为何寻求将 Anthropic 的 Mythos 模型整合到其银行业?
A 英国政府正与 Anthropic 谈判,计划在全国银行业部署 Mythos 模型,以加强网络安全防御。Mythos 因其能够分析复杂的软件架构并识别审计人员可能忽略的细微漏洞而受到特别重视。通过自动化检测金融欺诈和系统缺陷,该模型旨在为伦敦市场提供一道防御屏障,以抵御日益复杂、由人工智能驱动的黑客威胁。
Q Mythos 模型在欧盟与其他地区的可用性有何不同?
A Anthropic 限制了欧盟境内对 Mythos 模型的访问,这凸显了欧盟与其他全球大国之间日益扩大的监管鸿沟。尽管美国和英国正在积极将这些工具整合到国家基础设施中,但欧盟更严格的《人工智能法案》框架导致其被战略性排除在外。这种差异可能会使欧洲公司在软件开发速度和网络安全弹性方面处于竞争劣势。
Q 像 Mythos 和 GPT-5.5 这样的智能体模型如何改变传统的网络安全实践?
A 智能体模型的引入将网络安全从反应式流程转变为主动式流程。这些工具可以在恶意行为者利用漏洞之前模拟潜在攻击并识别攻击点,甚至可以建议或实施必要的代码补丁。然而,这也产生了双重用途风险,因为用于保护系统的智能同样可以被用于寻找漏洞,这要求工业和金融实体进行复杂的风险收益分析。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!