文章详情

XM交易:白宫与Anthropic磋商AI模型安全评估规则

币界网报道:

美国白宫正与 AI 公司 Anthropic 讨论一套模型安全评估框架,目标是为新一代 AI 模型的安全缺陷建立统一分级方法,并据此判断政府是否需要介入。此事发生在美国此前因一项被认定为“越狱”的安全问题,对 Anthropic 最新模型实施出口限制之后。

围绕“越狱”漏洞建立统一标准

据报道,这套框架将用于评估未来类似事件的严重程度,重点包括三项内容:防护措施被绕过的程度、被暴露出来的模型能力,以及漏洞在现实中的后果。

目前,政府与企业在这类问题上的分歧仍然明显。此前,Anthropic 首席执行官 Dario Amodei 与政府官员就相关漏洞是否构成重大安全问题存在不同判断。报道指出,AI 技术进展过快,而政府现有体系还不足以对这类争议作出一致评估。

出口限制后谈判继续推进

白宫此前已对 Anthropic 实施出口限制,禁止海外用户访问其最新模型 Fable 5 和 Mythos 5。公司随后暂停了这两款模型的对外服务。

报道提到,上周五双方谈判一度接近破裂。原因是 Anthropic 拒绝按政府要求下线 Fable,认为相关漏洞影响有限,不足以被认定为严重安全缺陷。随后,白宫采取出口限制措施,迫使公司将相关模型撤出市场。

不过,周末开始,双方重新恢复沟通。美国商务部长 Howard Lutnick、国家网络总监 Sean Cairncross,以及 Anthropic 联合创始人 Tom Brown 参与了多轮长时间通话。此后,双方又在华盛顿进行了近一周的线下会谈。

白宫加快AI安全规则落地

报道显示,Anthropic 方面参与谈判的人员包括公共政策负责人 Sarah Heck 和联合创始人 Tom Brown。公司还在本周一派出高级研究人员和安全防护专家前往美国商务部,与政府官员继续磋商。

这轮讨论也反映出一个更现实的判断:没有任何 AI 模型能够完全免受黑客攻击。因此,政府希望先明确企业评估安全风险的标准,再决定何种情形下需要采取限制措施。

这一方向也与近期七国集团会议上的讨论相呼应。多家头部 AI 公司和部分国家领导人都提到,应尽快形成更清晰的模型安全衡量标准,以应对能力持续增强的 AI 系统可能带来的经济与国家安全风险。