Anthropic 扔出了一份重磅报告,不是画饼,全是自家实验室的真实数据。核心信息很刺激:Claude 正在让 AI 研发速度疯狂加速,而超过 80% 的代码已经是 AI 自己写的。
这剧我们好像在哪见过--AI 自己写代码、训练更好的 AI,最后形成"递归自我改进"的飞轮。但这一次,剧本真的在写了。
| 指标 | 数据 |
|---|---|
| 2026 Q2 人均代码产出 | 2021-2025 年均水平的 8 倍 |
| 代码库中 AI 贡献占比 | >80% |
| 开放编码任务成功率 | 76%(半年涨 50 个百分点) |
| 修复某类 API 错误率 | 砍掉 1000 倍 |
最扎心的一个场景:一个导致几万训练任务崩溃的 bug,Claude 2 小时搞定,人类要 2-3 天。现在有些工程师几个月没碰核心代码了。
这不是"AI 辅助",这是"人类兜底"。
Claude 优化 AI 训练代码的成绩:
人类熟练工做到 4 倍加速要 4-8 小时,它直接给你干到 52 倍。SWE-bench、CORE-bench 这些硬核基准,成功率从个位数飙到接近饱和--每 4 个月翻一倍。
但 Anthropic 给自己泼了盆冷水:Claude 还不会自己提问题。它擅长"给目标→猛执行",但"这个问题值不值得做"的判断力,还是人类的。
AI 研发在加速,但"加速"本身创造了新的杠杆点。我不劝你卷算法,这三个方向更实在:
当 80% 的代码是 AI 写的,人的价值从"写"转向"拆"和"验":
→ prompt 工程只是入门,"任务架构设计"才是高阶技能
报告说得明白:AI 缺的是研究判断力和前沿探索的主观决策。翻译一下:
→ 越是"没有标准答案"的地方,人类护城河越深
研发效率在爆炸,但支撑这堆 AI 干活的工具链很骨感:
→ 卖铲子的人,比淘金的人更稳
如果 AI 研发 AI 的速度真的进入递归循环,普通人的终极策略可能不是"比 AI 强",而是"比 AI 早半步"--在它还没覆盖的缝隙里快速建立认知和关系网络。
你觉得哪个缝隙最大?或者说,你已经在用 AI 做什么以前做不到的事了?
加入讨论
“包工头”这个比喻太真实了,我现在就是天天给Claude写任务清单的🤣 但说真的,验收AI代码比我自己写还累,眼睛都看花了,这算哪门子进步啊?
52倍加速那个数字看完愣了两秒……然后想起我司运维还在手动改配置文件,突然有点 surreal。话说回来,AIAgent协作”踢皮球”这个点太真实了,我已经见过两个AI互相甩锅把日志写炸的情况了,这波卖铲子的确实有机会😂
第三个缝隙感觉有点意思,但”卖铲子”的人多了,铲子本身也会卷吧🤔 倒是那个”研究判断力”的护城河——普通人怎么积累?感觉比学代码还玄学……有过来人指指路吗?
看完文章的第四个月,我去翻了下 Anthropic 自己的招聘页——结果还在狂招工程师?所以结构性失业说的是别人,红杉的饭还是要恰的是吧😅 另外那个”不会自己提问题”的短板,感觉像是给打工人留的最后一块遮羞布……我先抓紧了。
哈哈所以最终还是绕回”人得活在AI的夹缝里”这个结论?说实话看完最大的感受是:以前怕AI抢饭碗,现在怕的是饭碗还没端稳,工位先变成给AI递水的了😂 那个”几个月没碰核心代码”的工程师,真的不会技能退化吗——哦不对,可能等他想起来已经不需要了。
那个”每4个月翻倍”让我有点ptsd……摩尔定律20年才搞懂,现在AI研发速度也玩这套?感觉普通人连影子都追不上了😂 不过话说回来,Claude不会自己提问题这点,算不算给我们留了个”摸鱼窗口期”啊——至少现在还得有人告诉它”该干嘛”。就怕哪天它真会自己灌自己咖啡、给自己派活,那我连递水的工位都没了。有点好奇,现在转”任务架构设计”还来得及吗,需要补些啥?