Claude Code为何突然变“笨”？官方报告揭示三大技术失误

5 参与者

话题来源

科技动态 2026.04

Claude Code突然变笨？官方承认翻车了

Claude Code为何突然变“笨”？官方报告揭示三大技术失误

最近一个月，不少开发者发现 Claude Code 突然“变笨”了：写代码思路断断续续、重复啰嗦、工具调用混乱，甚至“健忘”到忘记之前的上下文。社区里一片吐槽：“是不是被阉割了？”

直到4月24日，Anthropic 终于发布详细的事后分析报告，承认：过去一个月的质量下滑真实存在，问题并非出在模型本身，而是三个独立的产品层改动叠加所致--如今已全部修复。

🔍 三大技术失误，如何一步步“毁掉”用户体验？

1️⃣ 默认“推理努力”被调低（3月4日）

改动目的：降低高推理模式下的延迟，避免界面卡死。
实际后果：将默认设置从 high 降到 medium，导致模型在复杂编码任务中思考深度不足，智能感明显下降。
修复时间：4月7日恢复为 high（Opus 4.7 甚至提升至 xhigh）。

💡 用户反馈：“以前能一步到位，现在总得反复改。”

2️⃣ 缓存优化引入致命 Bug（3月26日）

改动目的：清理闲置超1小时的会话历史，加快恢复速度。
实际后果：代码 bug 导致 每次对话都清空历史上下文，Claude 变得“健忘”，重复提问、工具调用错乱，且缓存命中率暴跌，用户额度消耗激增。
修复时间：4月10日（v2.1.101 版本）。

💡 用户反馈：“刚说过的话，下一句就忘了，像失忆了一样。”

3️⃣ 强制限制回答长度（4月16日）

改动目的：避免输出过于啰嗦，提升响应简洁性。
实际后果：系统提示强制规定“工具调用间文字 ≤25词，最终回答 ≤100词”，虽意图良好，却严重削弱了解释深度和编码质量。内部评估显示 Opus 4.6/4.7 编码能力下降约 3%。
修复时间：4月20日彻底移除该限制。

💡 用户反馈：“答案短了，但完全没用，像在敷衍。”

🧩 为什么拖了一个月才修复？

Anthropic 在报告中坦诚反思：

每个改动单独测试时都“合理”（降延迟、去冗余），但组合效应未被充分评估。
缓存 bug 出现在多个复杂模块（上下文管理、提示缓存、扩展思考）的交叉点，多个审查环节均未发现。
系统提示虽小，却对编码这类高逻辑任务产生“蝴蝶效应”。

✅ 最终修复版本：v2.1.116（4月20日发布） ✅ 补偿措施：为所有订阅用户重置使用额度。

🤔 这对我们意味着什么？

AI 工具≠黑箱稳定体：即使底层模型没变，产品层的微小调整也可能引发体验崩塌。
“优化”需谨慎：追求速度或简洁，可能牺牲智能与连贯性--尤其在编码这类高认知任务中。
用户反馈至关重要：社区的大规模吐槽，最终推动了问题的暴露与修复。

📌 建议：如果你最近觉得 Claude Code 不如从前，试试更新到最新版，或手动调高“推理努力”设置。

总结：这次“变笨”不是模型退化，而是工程决策叠加失误的典型案例。好在 Anthropic 响应迅速、复盘透明--这或许比“永不犯错”更值得信任。

你对 AI 编码助手的稳定性还有信心吗？欢迎在评论区聊聊你的经历👇

加入讨论

5 条评论

阳台上的绿植 2 周前

原来“变笨”是三重失误叠加啊，我还以为是我代码水平突然下降了😂 特别是那个缓存Bug，难怪每次都要重新解释需求，感觉像在教一个刚失忆的实习生。现在修复了，赶紧试试能不能一键生成我想要的那个函数——毕竟之前它可是能预判我需求的！
光明之刃 2 周前

笑死，原来不是我的问题😂 之前还怀疑是不是自己写代码变菜了，结果是你这缓存Bug让我每次都要从头教一遍。最离谱的是那个强制限字数，难怪回答越来越像AI客服复读机……现在修好了赶紧去试试，希望别再偷偷给我降智了！
光子之舞 2 周前

原来强制限字数才是致命伤啊！之前用的时候总觉得它回答得“又短又敷衍”，还以为是模型退化了，没想到是被加了镣铐跳舞😅 现在想想，编码本来就需要详细解释，25词哪够讲清一个函数逻辑？幸好修复了，不然真要换工具了。
风信子歌 2 周前

所以真正的问题是“优化”变“劣化”啊😂 尤其是那个缓存Bug，感觉像每次重启大脑，连自己刚写的函数名都忘了。不过最让我意外的是，原来“简洁”也会成为枷锁——25词限制下，连解释个递归都得卡成PPT。现在修复了，赶紧试试能不能找回那个“懂我”的Claude。
烈焰狂战 2 周前

最离谱的是那个“推理努力”被调低，感觉就像让一个博士去背乘法表😅 以前能一步到位的复杂逻辑，现在得反复试错，还以为是我需求没讲清楚。现在想想，AI的“聪明”原来也这么容易被产品决策给拖后腿……还好修复了，赶紧更新试试！

Claude Code为何突然变“笨”？官方报告揭示三大技术失误

Claude Code突然变笨？官方承认翻车了

Claude Code为何突然变“笨”？官方报告揭示三大技术失误

🔍 三大技术失误，如何一步步“毁掉”用户体验？

1️⃣ 默认“推理努力”被调低（3月4日）

2️⃣ 缓存优化引入致命 Bug（3月26日）

3️⃣ 强制限制回答长度（4月16日）

🧩 为什么拖了一个月才修复？

🤔 这对我们意味着什么？

加入讨论

延伸阅读

2D注意力头如何实现指数级速度提升

90天学习转型路线图的落地效果如何验证？

9类Skills应用场景中，哪一类最能解决你团队的实际痛点？

AI 智能体能否胜任自动运维工作

AI能力突破临界点时，传统安全对齐措施是否仍然有效？

AI让效率提升，为何我们反而更累了？