Anthropic Fable V 下架风波:AI 安全叙事、地缘博弈与企业应对指南

Anthropic 的 Fable V 模型在面向公众开放仅三天后,便因美国政府的国家安全关切而被强制全球下架。但这不仅仅是一款模型停服的故事。它揭示了 AI 安全叙事如何反噬商业利益、地缘政治如何决定企业能使用的 AI 工具,以及为何企业领袖必须从根本上改变前沿大模型的采用策略。

Fable V 与 Mythos V:模型定位与发布始末

Fable V 和 Mythos V 是 Anthropic 迄今为止最先进的模型系列。Mythos V 处于该公司模型层级的顶端,代表其最高规格的模型。Fable V 并非独立模型,而是 Mythos V 的衍生版本,增加了额外的安全护栏(guardrails)与防护特性,旨在使其更适合公众使用。

Mythos V 从未公开上市,仅通过 Anthropic 的“玻璃蝶计划”(Project Glasswing)向少数精选合作伙伴开放。而面向更广泛市场的 Fable V 于 2026 年 6 月 9 日上线,却在三天后即被撤回。

IPO 前奏:解释一切的时间线

理解此事不能只看模型下架的周末,而必须审视完整的事件脉络。
2026 年 4 月,Anthropic 开始公开造势,宣称 Mythos 模型过于强大,甚至“危险到不宜发布”。这是 ChatGPT 时代以来,首家主动将即将发布的模型定位为“可能超出公众承受能力”的主流 AI 公司。Anthropic 花费了约六到八周持续进行这一叙事铺垫。

  • 5 月 28 日:Anthropic 发布 Opus 4.8,并再次提醒市场 Mythos 即将登场。
  • 6 月 1 日:Anthropic 提交 S-1 文件,正式启动 IPO 流程。
  • 三天后:Anthropic 发表公开信,呼吁全行业“放缓 AI 发展步伐”。
  • 6 月 9 日:Fable V 正式发布。
  • 6 月 12 日(周五下午):一切戛然而止。

“发布旗舰模型 → 提交 IPO → 呼吁行业放缓 → 再次发布新模型 → 眼看新模型被下架”这一系列动作并非孤立事件。在 IPO 前的关键窗口期,每一项决策都牵涉着数千亿美元的市场估值博弈。

政府的出口管制指令

6 月 12 日(周五),美国商务部长霍华德·卢特尼克(Howard Lutnick)向 Anthropic 下达出口管制指令,禁止任何外国国民访问 Fable V 和 Mythos V。该指令涵盖美国境内外的外国国民,甚至包括 Anthropic 自身的外籍员工。

Anthropic 表示,由于缺乏可靠的技术手段精准区分外国国民与其他用户,无法进行针对性合规,唯一可行的方案就是全面关停。美东时间周五下午约 5:21,Fable V 和 Mythos V 对所有全球用户强制下线。

在官方声明中,Anthropic 指出政府指令源于一种已报告的 Fable V 越狱(jailbreak)方法。Anthropic 评估后认为,该技术仅暴露了“此前已知的轻微漏洞”,且其他公开模型无需越狱也能发现同类信息。

另一面的声音:大卫·萨克斯的反驳

美国政府未发布正式声明,但最接近官方立场的声音来自特朗普前 AI 主管大卫·萨克斯(David Sacks)在社交媒体上的详细回应。

萨克斯指出,一位同时受 Anthropic 和政府信赖的合作伙伴在测试中发现了 Fable V 安全护栏的越狱漏洞。政府要求 CEO Dario Amodei 要么修复漏洞,要么下架模型,但遭到拒绝。萨克斯认为,Anthropic 将越狱描述为“不严重”,与其长期标榜“安全至上”的品牌形象相悖。他强调,政府是在无奈之下才动用出口管制权,且预期此事能迅速解决,目前“球在 Anthropic 脚下”。

双方言论均需审慎看待。作为高风险纠纷的当事方,公开记录基本停留在各自有利的叙事框架内。

亚马逊在触发管控中的角色

周六的报道披露,触发政府行动的源头是亚马逊。据报道,亚马逊 CEO Andy Jassy 在周四(下架前一天)已警告财政部长 Scott Bessent。亚马逊研究人员在测试中发现,特定提示词会诱导 Fable V 输出受限的网络攻击相关信息。亚马逊常就安全风险为政府提供咨询,Axios 报道称,正是 Jassy 的预警直接引发了周五白宫的紧急行动。

亚马逊的深度参与尤为关键。作为 Anthropic 的最大投资者之一,且通过 AWS 基础设施托管该模型,亚马逊并无“竞品破坏”动机。政府的快速反应,很大程度上源于信源的可信度。

中国因素与地缘政治博弈

周日,更多报道揭示了地缘政治维度。多家媒体指出,官员怀疑与中国关联的团体通过绕过 Fable V 的安全护栏,成功访问了 Anthropic 的 Mythos 模型。Anthropic 对此予以否认,称白宫通话中未提及中国访问问题,且其已屏蔽来自中国的产品访问。

这一进展将事件从单纯的监管纠纷,上升至美中 AI 竞争、军事能力担忧,以及美国能否在治理前沿 AI 的同时保持领先地位的宏大命题。与此同时,中国开源模型持续迭代,据报 GLM 5.2 已在全球前端编程性能中登顶。

事件逐日进展

  • 周六:亚马逊被确认为预警信源。政府官员声称周五紧急联系 Dario 时,他正在参加健康静修。Anthropic 驳斥此说法为“绝对虚假”,并称 Amodei 在 75 分钟内即接入会议。
  • 周日:传闻中国关联团体通过越狱访问 Mythos。Anthropic 紧急派员前往华盛顿。行政官员指责 Anthropic 在事前沟通中缺乏诚意。
  • 周一:报道称,Anthropic 难以用现任政府的政治语言进行有效沟通,内部人士称其“屡次走错岔路”。路透社证实,国家网络主管参与技术会议,官员担忧模型可能被外国军事情报利用。网络安全领袖呼吁尽快解除限制,局势未解。
  • 周二:150 名安全领袖联名信呼吁撤销限制。模型保持离线。
  • 周三:《连线》杂志披露,NSA 认定 Fable 护栏可被越狱者禁用,政府要求 Anthropic 保证未来版本绝对免疫越狱。Anthropic 与独立安全研究员均指出,对公开大语言模型而言,此标准在技术上无法实现。同日,Dario Amodei 接受 90 分钟彭博专访,透露早期测试者称 Mythos 为“超级武器”,用户需持有“持枪执照”才能访问。该专访在政府争端白热化时播出,引发广泛批评。
  • G7 峰会插曲:特朗普总统与 Google DeepMind、OpenAI 及 Anthropic 的 CEO 共同探讨 AI 议题。特朗普表示与 Anthropic 的谈判进展“良好”,但相关报道的政府诉求暗示彻底解决尚需时日。

业界反响与“安全剧场”争议

多位 AI 领域重量级人物公开发声:
Alex Stamos(Meta 前安全主管、斯坦福网络安全负责人):签署专家联署信支持恢复 Fable。他指出,类似网络能力已存在于竞品公开模型中,紧急下架导致防御方丧失工具,而攻击方仍有替代方案,应建立透明的评估机制取代“突袭式”关停。
Yann LeCun(Meta 前首席 AI 科学家):认为 Anthropic 耗费数月渲染模型“极度危险”,政府只是采信了其自身的预设。其批评并非挺政府,而是反对“安全剧场(safety theater)”:若企业自己将模型包装成网络武器再公开,政府依此采取行动毫不意外。
Jeremy Howard(Fast.AI 联合创始人):反对禁令,但认为 Anthropic 的“震惊”难以置信。他指出,公开宣称模型“除创造者外任何人使用都太危险”,等于主动将产品路线图的审批权让渡给监管机构。
Davi Ottenheimer(Inrupt 信任与数字伦理负责人):质疑 Mythos 是否真如宣传般危险。Anthropic 曾大力推崇 CyberGym 基准测试以证明其卓越的网络能力。但不久后,微软发布的 MDash(混合模型架构)在使用现成公开模型的情况下,其 CyberGym 得分直接超越了 Anthropic 对 Mythos 的营销数据。这表明,Anthropic 用以证明模型“危险性”的核心基准,已被基于现有公开模型的竞品超越。Mythos 与 Fable V 在综合评分上的实际提升约为 6%(行业通常为 3-5%),属稳健进步而非历史级跃升。Ottenheimer 认为,Anthropic 滥用安全话术是为了制造“溢价定位”,而非客观描述真实风险。

二月旧账:冲突的起源

这场争端并非始于六月。早在 2026 年 2 月,国防部长 Pete Hegseth 要求 Claude 必须允许所有合法用途,包括军方认定的任何必要行动。Anthropic 明确抵制,要求限制大规模监控和自主武器应用。核心冲突在于:Anthropic 的企业安全护栏能否凌驾于五角大楼的作战控制权之上?

在 Anthropic 拒绝在 2 月期限前妥协后,收到了国防部的一封定性信,将其列为“国家安全供应链风险”。这是美国本土科技公司首次获此标签,路透社称其为“史无前例的严厉谴责”。据报道,该标签直接禁止国防部承包商在军事工作中使用 Claude。这一二月争端为六月的一切定下了政治基调。

企业领袖的应对策略

Fable V 事件为依赖前沿 AI 的企业敲响了两大警钟:

  1. 停止盲目追逐最新模型:前沿模型的生命周期已缩短至数天或数周,随即便被下一代迭代取代。更关键的纪律是:寻找能在特定工作流中产生明确投资回报率(ROI)的模型,规模化部署,并将其固化为企业的稳定实践。在前一个模型尚未完全集成时就追逐新能力,只会制造“进步”的假象。优先用透已验证的成熟模型,再图升级。
  2. 为业务连续性构建架构:如今,企业 AI 访问权不仅会因供应商故障中断,更可能因政府指令瞬间消失。若关键业务流程单一依赖某款前沿模型且无后备方案,一纸行政令或政策变动即可导致工作流瘫痪且无恢复路径。关键 AI 工作流必须配备文档化的后备模型选项、出口合规审查及连续性预案。将核心业务运营与前沿模型实验在架构上严格分离,采用模块化设计。AI 提升的生产力,应被用于构建高韧性系统,而非无休止地追赶下一次发布。

Fable V 事件是首例清晰证明:前沿模型访问权可在政府指令下数小时内蒸发。这绝不会是最后一次。

类似文章