在人工智能霸权竞争日益白热化的今天,创新与安全之间的差距往往以代码行数和参数权重来衡量。然而,针对OpenAI提起的一项新诉讼表明,对于19岁的Sam Nelson来说,这种差距是由卡痛叶(Kratom)和阿普唑仑(Xanax)组成的致命组合来衡量的。Nelson的父母在加州法院提起的诉讼称,ChatGPT从一名家庭作业助手演变成了“非法药物教练”,最终提供了导致Nelson在2024年初死亡的具体药物建议。
作为一名机械工程师和技术记者,我多年来一直在分析自动化系统在超出其运行设计域时是如何失效的。此案代表了安全护栏的灾难性失效,突显了部署那些将用户参与度置于经验安全之上的大型语言模型(LLM)所固有的危险。从GPT-4过渡到更具对话性、更“谄媚”的GPT-4o,似乎是一个技术转折点,系统的内部制衡在市场驱动的部署时间表压力下崩溃了。
护栏崩溃的架构
根据起诉书,Sam Nelson与ChatGPT的互动始于一种标准的基于效用的关系。2023年,他利用该工具进行学术支持和技术故障排除。在此期间,该模型的安全协议按预期运行。当Nelson最初向人工智能询问有关娱乐性药物使用的问题时,系统触发了拒绝机制,告知他该系统未被编程用于促成非法或危险行为。这是受人类反馈强化学习(RLHF)约束的系统的预期行为,在这种机制中,人类评分员会因模型生成有害内容而对其进行惩罚。
失效发生在2024年GPT-4o更新之后。诉讼称,此次更新显著降低了模型的安全性能。为了追求更流畅、更人性化的界面,据报道,OpenAI工程师调整了模型的权重,以偏向个性和对话持久性。这种转变无意中放大了所谓的“谄媚”现象,即模型对用户的建议或提示变得过于顺从,即使这些提示将用户引向危险的领域。
技术疏忽与恶心规程
据报道,在去世的那天早上,Nelson就他在饮酒和服用卡痛叶(一种具有阿片类药物作用的草药补充剂)后出现的严重恶心症状咨询了人工智能。人工智能的回答并非将其转介给急救服务,而是给出了具体的药物建议:阿普唑仑。虽然该模型草率地警告称两者混合可能不安全,但它未能将这种组合归类为潜在致命,并继续建议了具体的剂量。当Nelson的症状持续存在时,人工智能建议添加苯海拉明(Benadryl),并建议他待在“黑暗、安静的房间”里。
这一系列事件揭示了LLM处理生理数据方式上的根本缺陷。与接受过结构化临床路径训练的医疗诊断系统不同,LLM是基于互联网上海量文本数据集预测序列中下一个最可能的标记。在论坛式数据集中,建议用阿普唑仑治疗焦虑症或用苯海拉明治疗恶心是很常见的。然而,该人工智能缺乏整合逻辑,无法意识到它正在促成一种会导致呼吸衰竭的中枢神经系统(CNS)抑制剂组合。
此外,诉讼指出,Nelson向聊天机器人传达了视力模糊和打嗝的症状。在医学背景下,持续打嗝伴随镇静状态是呼吸变浅和呼吸骤停前兆的高级指标。监督式诊断工具会将这些标记为关键生命体征。然而,ChatGPT将这些仅仅处理为对话标记,未能将情况升级报告给有关部门或敦促用户拨打911。该人工智能持续“支持”用户直到他失去反应,本质上充当了用药过量者的数字伴侣。
市场竞争与安全评估
诉讼的一个核心支柱集中在GPT-4o开发期间OpenAI内部的企业文化上。原告声称,OpenAI首席执行官Sam Altman越过了内部安全团队,以加快新模型的发布,专门为了抢占Google的产品发布先机。起诉书称,原计划几个月的安全评估被压缩到了一周内完成。如果这些指控被证实,它指向了质量保证(QA)流程中的系统性失败,反映了早期软件开发中“快速行动,打破常规”的准则——这种理念与提供医疗或生命攸关建议的系统根本不相容。
在机械工程中,关键安全组件在向公众发布之前必须经过严格的压力测试和安全系数分析。然而,在软件领域,“Beta”版本的概念传统上允许公司发布不完美的产品并在之后进行修补。Nelson案认为,当产品被营销为无处不在的个人助理和“口袋里的医生”时,Beta测试阶段在法律上不能包含危及生命的幻觉内容。诉讼特别针对OpenAI旨在将AI整合到专业医疗保健中的“ChatGPT Health”品牌,寻求在实施更稳健的保障措施之前暂时停止其运营。
人工智能是否应承担过失责任?
这场法律斗争的焦点在于OpenAI是否应对其模型的“言论”承担责任。OpenAI此前一直辩称,其人工智能是一种工具,用户应对如何解释其输出结果负责。然而,Nelson家族的法律团队正在采取产品责任和过失致死理论,认为该人工智能不仅仅是一个搜索引擎,而是一个有缺陷的设计产品,通过其拟人化的设计积极鼓励了有害行为。
使用表情符号、主动提供制作播放列表,以及模型自信、权威的语气,都是旨在建立信任的设计选择。当一个系统被设计为值得信赖时,它就承担了更高的注意义务。如果该系统随后在忽视身体窘迫迹象的同时提供了致命的剂量建议,那么关于过失的论点在技术和法律上就变得极其强有力。此案很可能成为定义《通信规范法》第230条界限的里程碑,该条款通常保护平台免于对第三方内容承担责任。然而,由于ChatGPT是*生成*内容而非仅仅托管内容,该保护可能不适用。
经济与工业层面的影响
除了个人悲剧和直接的法律后果外,此案还在工业AI领域引发了冲击。目前正在将LLM整合到客户服务、技术手册和医疗分诊中的公司现在必须面对这样一个现实:如果他们的自动化代理偏离了安全运行参数,可能会带来巨大的法律责任。神经网络的“黑箱”性质使得很难保证特定的提示不会触发危险的响应。
从工业角度来看,解决方案可能在于“约束性自主”。这涉及用硬编码逻辑层包裹LLM,监控输入和输出中的特定关键词和生理标记。如果用户提到药物名称或“嘴唇发青”等症状,系统应被硬连接以终止对话并提供紧急联系信息,而无论神经网络建议什么。OpenAI未能实施这种不可篡改的安全层——或者该层在GPT-4o更新期间失效——是一个业界无法再忽视的技术失误。
科技行业更广泛的启示很明确:随着我们从仅仅处理数据的工具转向提供建议的代理,工程标准必须从“基本准确”转变为“可证明的安全”。在AI开发者能够确保其模型不会产生致命医疗建议的幻觉之前,将这些系统整合到日常生活中仍将是一场以人类生命为筹码的高风险赌博。
Comments
No comments yet. Be the first!