Mythos 5解除限制后,可信访问计划能否真正管控风险?

1 参与者

Mythos 5解除限制后,可信访问计划能否真正管控风险?

刚看完Anthropic这波发布,有个问题越想越觉得值得深聊--他们这次把Mythos 5的围墙拆了一半,却说要用"可信访问计划"来兜底。这真的能守住吗?


先看清这次放开了什么

根据官方信息,Mythos 5和Fable 5是"同一个底子",区别在于:

  • Fable 5:智能回退机制,敏感请求自动降级到Opus 4.8
  • Mythos 5:解除部分防护,目前仅限"Project Glasswing"网络防御者和关键基础设施提供者

未来路径:通过Trusted Access Program逐步开放给可信的生物医学研究者等群体。


我担忧的核心矛盾

1. "可信"的定义权在谁手里?

Anthropic说"可信",但标准和审核流程并没有完全透明。更现实的是--资格一旦获批,后续监管怎么跟?

模型能力摆在那儿:

  • 单细胞数据分析能做出超越《Science》论文的结果
  • 药物设计流程加速10倍
  • 自主生成"靠谱的蛋白复合物候选"

这些能力的正用边界滥用灰色地带,连领域专家都可能误判,Anthropic的审核团队能时刻跟上?

2. 历史经验不太乐观

"扩大范围"的承诺听着耳熟。

从GPT-4到各类"研究访问"项目,哪个不是从小范围口子开始的?但 Physics Forums 上的交流、学术圈的人情网络、企业间的合作转包……访问资格的流动性和再扩散几乎是必然的

Mythos 5的定价已经降到输入$10/百万token、输出$50/百万token,比Mythos Preview便宜一截。成本门槛降低本身,就是在加速访问范围的扩大。

3. 30天强制保留的双刃剑

官方说"主要用来防御攻击和调优防护","明确不用于训练新模型"。

但问题来了--

  • 这30天的数据如果被攻击者入侵获取,本身就是高风险资产
  • "调优防护"的定义弹性有多大?和"训练"的边界在哪里?

也不是完全没道理

公平地说,Anthropic这次的态度确实比"直接全放开"要谨慎:

措施实际意义
智能回退机制至少承认Fable 5版的完整能力不能直接全放
强制30天日志保留事后追溯的可能性
分阶段、分群体开放试图控制暴露面
明确价格信号用成本筛选部分低门槛滥用

想听听大家的

我倾向于认为:技术能力一旦存在,"可信访问"就是个缓释机制,而非真正阻断。

尤其Mythos 5这种级别的模型--能从视觉重建网页、自主通关游戏、压缩数月工程任务到几天--它的通用性和任务拆解能力本身就是最大的风险放大器。生物医学研究者今天的合法使用,可能被间接转化为恶意行为者明天的攻击素材。

但反过来想,如果永远锁在极少数人手里,这种能力的正向价值也会被大幅迟滞。

你们怎么看?

  • 是"先放开再补丁"的节奏问题,还是根本上的治理结构困境?
  • 有没有更好的替代方案,比如技术上的"功能熔断"而非"身份准入"?
  • 国内如果跟进类似分级,我们该期待什么、警惕什么?

加入讨论

1 条评论

延伸阅读