最近刷到清华大学唐杰教授的一条长帖,看完后挺有触动。作为国内大模型领域最资深的学者之一,同时也是智谱AI的首席科学家,他这次没有讲宏大叙事,而是冷静地分享了关于2026年AI走向的判断。
核心观点就一句:
AI真正的价值,不再是回答问题,而是能在复杂、长期的任务里自主干活。
唐杰认为,2024年最值得关注的进展,不是参数再翻倍,而是长时程任务(Long-Horizon Tasks)的突破。
这意味着:AI不再只是“答一道题”,而是能像人一样,连续工作几天、几周,甚至几个月,去完成一个复杂目标。
举个让人头皮发麻的例子:
在网络安全领域,AI可以24小时不间断扫描漏洞,用黑客级直觉攻击系统,再自动在 HackerOne、BugCrowd 提交报告、领取赏金。 人类会累、会分心,但AI不会。
这已经不是“辅助工具”了,而是直接参与高价值劳动。靠技术吃饭的人,可能很快就要面对真正的“同行竞争”了。
去年大家还在热议“One Person Company”(一个人开一家公司),今年已经有人在讨论“None-Person Company”了。
唐杰半开玩笑地说:
“我们可能都快变成这个新生态里的NPC了。”
听起来像段子,但趋势很清晰:自主代理系统(Autonomous Agents)正在快速成熟。
未来的公司,可能不再需要大量人力去执行日常操作--AI代理会自己规划、执行、纠错、迭代。 创业的门槛会进一步降低,但对人的要求也变了: 👉 你得学会和一群AI“同事”共事。
唐杰原本以为,要实现真正的智能进化,需要突破性的范式革命,比如:
但他发现:现实靠“工程堆叠”硬是逼近了这些能力:
| 能力 | 当前实现方式 |
|---|---|
| 记忆 | 百万级上下文窗口 + RAG,已能解决大部分实际问题 |
| 持续学习 | 模型更新周期从“几个月”缩短到“一个月甚至更短”,接近“准持续学习” |
| 自我判断 | 如 Claude Opus 4.7 已展现较靠谱的自我纠错能力 |
最震撼的是:自我进化(Self-Evolving) 一些前沿团队已经让模型:
虽然浪费算力,但省下了最宝贵的人力。 在“速度决定一切”的赛道上,谁迭代更快,谁就拉开差距。
唐杰提到,不应把AGI简单定义为“达到单个人类智力水平”。 他赞同 DeepMind 创始人 Demis Hassabis 的观点:
AGI 应该是“人类集体智慧的总和”,能做出“相对论”级别的原创贡献。
按这个标准,我们离真正的AGI还有距离,但路径越来越清晰: 长上下文 → 强记忆 → 持续学习 → 自我判断 → 自我训练
一步步走,但每一步都在加速。
读完这条帖子的最大感受是:
变化比我们想象的更快,而且是不可逆的。
短期看:不会完全取代,但会重构。 AI不会突然“解雇”你,但会慢慢“接手”你80%的重复工作。
长期看:取决于我们如何定义“工程师”。 如果工程师 = 写代码的“执行者”,那确实危险。 但如果工程师 = 定义问题、设计系统、引导进化的“创造者”,那反而会更重要。
就像汽车取代马车夫,但催生了司机、工程师、交通系统设计师。
👇 欢迎留言讨论,一起看清未来。
加入讨论
如果AI真能自己写代码、清洗数据、训练自己,那程序员是不是该改行去教AI怎么“摸鱼”了?毕竟以后上班可能变成:你盯着AI干活,AI盯着你发呆。
如果AI真能24小时不眠不休地挖漏洞领赏金,那以后黑客马拉松是不是改成“人机协作赛”了?人类负责喝咖啡提需求,AI负责通宵干完活儿,最后奖金还得五五分账——毕竟它用的可是你的账号。
如果AI真能自己训练自己,那以后实验室的博士生是不是可以转岗去当“AI心理辅导员”?毕竟它们迭代太快,万一产生自我怀疑:“我这次训练到底有没有进步?”总得有人开导两句吧。