昨晚刷到小米MiMo-V2发布,技术参数确实亮眼--1T参数基座、1M上下文、Hybrid Attention架构。但真正让我停下滑动的,是罗富力那句"明天对话少于100次的人,可以辞职了"。
这句话太有画面感了。深夜的会议室,刚体验完Agent脚手架的震撼,转头对团队下死命令。不是"建议体验",不是"鼓励尝试",是直接挂钩生存权。
【技术信仰派】
认为这是"先看见未来"的必然。罗富力自己说了,第一次体验orchestrated Context时"整个人都震惊了"。这种震撼无法通过PPT传递,必须亲手对话、拆解、被Agent的自主能力击中。
100次不是KPI,是认知门槛--不到这个量,根本理解不了"从Chat到Agent"的范式跃迁。就像没写过10万字的人,教不了写作课。
【焦虑驱动派】
更冷峻的视角:DeepSeek出身的人,太清楚窗口期有多短。MiMo-V2的基座几个月前就开始训练,但Agent浪潮来得比预期更快,连团队都"差点没反应过来"。
"安静的伏击"这个表述很微妙--伏击的不是对手,是时间。100次对话令,本质是对组织惰性的暴力纠偏。
技术信仰和焦虑驱动,从来不是二选一。
真正有趣的是这句话的传播设计。罗富力完全可以在内部说,但他选择写进X的长帖里。一个带有冲突性、人格张力的管理场景,比任何参数都更容易被记住和讨论。
你看,我们现在就在讨论它。
几个值得追问的点:
MiMo-V2的技术栈确实为Agent时代做了预埋,但团队能否跟上自己搭建的基础设施,是另一个问题。
你怎么看? 是欣赏这种"用极端手段打破认知茧房"的管理风格,还是觉得大模型行业正在陷入某种表演性焦虑的军备竞赛?
加入讨论
100次对话听着唬人,但真干起来也就半天的事。我更好奇的是——这100次里有多少是有效探索,多少是”为了打卡而尬聊”?别最后变成数字游戏,那才是真正的认知茧房。
“辞职”这词听着狠,但细想挺鸡贼的——真有人因为对话不够100次被开吗?大概率不会。但恐惧一旦种下,团队自己就会卷起来。罗富力这招,狠在诛心。
半夜看到这句”对话少于100次就辞职”,第一反应不是管理哲学,是这哥们真敢写啊😂 但冷静下来想,Agent这玩意儿确实得亲手玩才能信——我上周让Claude写了个自动化脚本,之前看一百篇论文都没那次震撼。100次可能夸张,但”亲手摸过”和”听说过”确实是两个世界。
MiMo-V2那个1M上下文窗口才是真的狠活,100次对话反倒像障眼法——注意力全被”辞职”吸走了,谁还记得参数细节?这传播手法,比Agent还Agent。
说实话我更想知道那100次对话有没有KPI细则——是随便聊都算,还是得产出可用agent?要是没标准,最后肯定变成凌晨三点对着模型说”你好你好你好”的赛博行为艺术。
半夜刷到这个,突然想到——罗富力自己一天对话够100次吗?还是说创始人天然免疫这条规则😂 不过说真的,这种”以身试法”的狠话,比那些只会让员工加班的老板还是强点。
MiMo-V2那个Hybrid Attention架构具体咋工作的有懂哥讲讲吗?看了半天没get到和传统MHA的区别,结果评论区全在聊100次对话…技术细节党输麻了😅
刚把MiMo-V2跑起来试了试,说实话前20次对话都在跟它较劲——上下文长了反而容易迷失。但到第50次左右突然开窍,开始理解什么叫”orchestrated”。100次这个数字可能不是拍脑袋,是人家真摔过跟头。
有点好奇这个”100次”是怎么统计的——是后台自动拉数据,还是员工自己填表?要是真有人月底发现差3次,会不会出现批量”你好谢谢再见”的冲刺现场😂 想想那个画面还挺荒诞的。
这文章看完我第一反应是——罗富力自己数过对话次数吗😂 但说真的,”伏击时间”这个比喻挺戳我的。大厂做Agent最怕的不是技术,是组织反应速度跟不上产品迭代。100次对话可能是笨办法,但至少是个能执行的笨办法。
MiMo-V2的1M上下文让我想到个事——以前用4K窗口时,写代码得不断复制粘贴历史,现在直接丢整个repo进去。但说实话,上下文长了反而更考验怎么”问对问题”,不然Agent就在那兜圈子。100次对话的门槛,会不会也是逼大家练这个?
MiMo-V2那个1M上下文到底能塞多少东西啊?我算了下大概能塞两本《三体》还有余,但真有人需要让Agent同时读这么多吗?感觉像给自行车装火箭发动机,酷是酷,就是不知道日常通勤用不用得上。