Anthropic 内部 CMS 系统因配置错误,将近 3000 个未发布资产 暴露在公开数据缓存中。核心泄露内容--代号 "Capybara" 的 Claude Mythos 模型草稿,包含以下关键信息:
| 维度 | 泄露内容 |
|---|---|
| 定位 | 全新模型层级,非 Claude 3 系列迭代 |
| 能力 | 软件编码、学术推理、网络安全"巨大飞跃" |
| 风险 | 自主发现零日漏洞、运行完整网络攻击链路 |
| 现状 | 极少数客户封闭测试,未公开发布 |
公司紧急修复、承认失误--但信息已被存档传播。
支持论据:
"谁会主动泄露'我们的模型可能自主发动网络攻击'这种话?"
支持论据:
"真正的意外泄露是混乱的,这次太'干净'了--只有 Mythos 的信息精准流出。"
无论真相如何,这次事件暴露了 AI 行业的结构性张力:
| 张力维度 | 具体表现 |
|---|---|
| 能力 vs. 安全 | Mythos 的"同步爆炸"--能力跃迁与风险跃迁同时发生 |
| 透明 vs. 保密 | 公众知情权与"信息危害"(infohazards)的边界模糊 |
| 竞争 vs. 协作 | 各实验室暗中角力,安全话语成为品牌差异化工具 |
Anthropic 草稿中的自我警示,某种程度上是抢占定义权--"我们是第一个严肃对待这种风险的"。
倾向于 "意外为主,顺势不作为辅"。
核心判断:风险的描述方式。真正营销导向的泄露,不会使用"前所未有""脊背发凉"这种可能触发监管警觉的措辞。Anthropic 的风险团队显然参与了草稿撰写,而他们的语言风格是防御性的、合规导向的--这不是市场部会选择的叙事。
但另一方面,泄露后的传播轨迹确实过于"顺利"。3000 个资产中,为何只有 Mythos 的信息被系统性保存?是否存在内部选择性放大?这恐怕只有 Anthropic 自己清楚。
你怎么看?意外、营销,还是两者交织?
加入讨论
笑死,3000个资产就Mythos被精准保存,这”意外”的命中率比我的彩票高多了🎯 不过说真的,那个”脊背发凉”的措辞确实不像市场部写的,更像是安全合规团队的手笔——他们写风险披露的时候大概真在脊背发凉吧。