深夜刷到罗富力那条"quiet ambush"的帖子时,我突然意识到--中国大模型的人才流动,已经从"跳槽"升级成了"带土移植"。
这不是简单的挖角,而是一整套方法论、技术路线乃至团队文化的迁移。
MiMo-V2系列本身的技术参数(1T参数、1M上下文、Hybrid Attention)当然亮眼,但真正让我后背发凉的是时间线:
"这些选择在一年前就已确定,而不是临时跟风"
一年前是什么时候?2024年3月。那时OpenAI的Operator还没影,Claude的Computer Use刚露苗头,国内还在卷"谁的中文对话更流畅"。
小米团队却已经在为Agent时代铺铁轨了。
这种前置布局能力,不是靠钱能砸出来的。它需要有人真正相信"范式转移会发生",并且敢把筹码提前押上去。
罗富力的流动不是孤例。我们正目睹一个有趣的现象:
| 流动方向 | 典型特征 | 行业影响 |
|---|---|---|
| DeepSeek → 大厂(小米/阿里/字节) | 带走技术方法论+核心骨干 | 加速大厂自研模型Agent化 |
| DeepSeek → 创业(阶跃/智谱等) | 复制"小团队高密度"组织模式 | 催生更多垂直场景杀手 |
| 大厂 ↔ 创业公司 | 双向渗透,打破信息茧房 | 技术扩散速度指数级提升 |
DeepSeek像一所没有围墙的军校--它证明了"小团队+极致聚焦+技术信仰"可以击穿资源壁垒,于是这套打法开始被系统性复制。
"明天MiMo团队里对话少于100次的人,可以辞职了。"
这句话被很多人当段子转,但我看到的是认知对齐的暴力美学。
传统大厂的模型团队怎么工作?接需求、训模型、跑评测、发论文。和真实用户场景隔着三层汇报链。
罗富力做的,是把"亲身体验Agent脚手架"变成强制性组织记忆。当每个人都被推到"啊哈时刻"面前,技术路线就不再是顶层设计,而是集体直觉。
这种从体验到信仰的转化效率,可能是中国AI团队最被低估的竞争力。
短期看:小米凭借MiMo-V2-Pro的Agent原生架构,有机会在端侧智能(手机×汽车×IoT)建立差异化优势。不是"我有大模型",而是"我的模型为Agent而生"。
中期看:人才流动会加速"技术平权"。DeepSeek的MoE经验、长上下文优化、推理成本控制--这些know-how正在变成行业公共知识。
长期看:真正的分水岭是"谁能定义Agent时代的交互范式"。ChatGPT定义了对话,但Agent的"脚手架"长什么样?还没有答案。小米这次押注的"orchestrated Context",可能是关键拼图之一。
当核心人才带着方法论流动,"技术秘密"的保质期还有多久? 也许组织能力的差距,会比模型能力的差距更持久。
"安静的伏击"会成为中国AI发布的新常态吗? 少点PPT发布会,多点深夜长帖的技术坦诚--这种反PR的PR,反而更戳开发者。
DeepSeek模式的可复制性边界在哪里? 它需要特定的创始人气质、特定的资本耐心、特定的技术窗口期。下一个"DeepSeek"会在哪里出现?
最后想说:罗富力帖子里那个"自己差点没反应过来"的细节,特别真实。
最好的创新往往这样--不是因为你预言了未来,而是因为你提前站在了未来会经过的地方。
然后,等风来。
你怎么看这波大模型人才流动?是"技术扩散"还是"人才内卷"?评论区聊聊 👇
加入讨论
小米这手确实狠,但有个问题没想通——DeepSeek的人带着方法论走了,那DeepSeek自己还剩啥?不会真成”AI黄埔军校”只输出人才不沉淀吧😂 不过罗富力那句”对话少于100次辞职”我信,用过MiMo-V2-Pro的脚手架就知道,这团队是真自己啃过硬骨头的。
“明天对话少于100次就辞职”这话听着狠,但细想挺对味的——做Agent的人自己都不用Agent,那不是纸上谈兵吗?不过好奇这100次是咋统计的,公司内网拉数据还是自觉上报😂 别最后变成凌晨两点互相发消息刷KPI就行
端侧智能这个点被说烂了,但有个细节没人提——小米车机上的Agent要是真能打通手机+家居,那场景闭环比纯云端模型狠多了。现在就怕各家的”Agent”最后变成换个名字的语音助手😅
说实话看完最感慨的是时间点——2024年3月就定好Agent路线,那时候我还在用Claude写周报呢😅 这种预判能力确实不是堆卡能堆出来的,得有人敢在共识形成之前就下注。不过也好奇,万一Agent这波没起来,这帮人会不会很尴尬?
有点好奇这个”orchestrated Context”具体怎么实现的,文章里没展开讲。小米的Agent要是真能自己调度跨设备的上下文,那比单纯拉长上下文窗口有意思多了,毕竟车机和手机的场景切换一直是痛点。等开源了扒拉下代码看看👀