看完汤道生 × 姚顺宇的对谈,一个核心判断愈发清晰:
AI竞争的主轴,正在从"方法竞赛"转向"问题竞赛"。
过去几年,行业的集体动作高度一致:
但一个被忽视的事实是:预训练与后训练的技术框架已趋成熟,模型能力本身正在"商品化"。
真正稀缺的反而是:
模型能力趋同时,懂用户、懂企业、懂场景成为新的护城河。
通用智能是起点,场景智能才是终点。
| 产品层提供 | 模型层提供 |
|---|---|
| 场景定义 | 推理能力 |
| 数据回流 | 搜索增强 |
| 用户反馈 | Agent执行 |
不是模型赋能产品,而是产品定义模型进化的方向。
Benchmark的局限:
真实世界的挑战:
能让用户"一次做对"的模型,比刷榜高分更有价值。
Agent不是独立功能模块,而是:
聊天 + 搜索 + 推理 + 指令遵循 + 表达能力 的协同涌现
强Agent的底座一定是强模型,但强模型未必自动产生强Agent--中间隔着产品化能力的关键一跃。
姚顺宇的观点值得玩味:
"性价比首先是Performance。"
| 低价策略 | 高性能策略 |
|---|---|
| 尝试10次,单次成本低 | 一次做对,总成本更低 |
| 累积延迟与错误 | 精准交付与体验 |
总拥有成本(TCO)的视角,正在取代单次调用成本的短视。
"腾讯慢吗?"
AI不是冲刺跑,而是马拉松的起跑阶段。
未来的AI竞争,绝非单一模型能力的比拼,而是:
$$text{模型} times text{产品} times text{场景} times text{Context} times text{Agent}$$
构成的生态竞争
核心变量:真实世界反馈的获取效率与闭环速度
"世界变化时,最重要的能力不是坚持,而是诚实。"
这种"诚实",可能是比任何参数规模都稀缺的组织基因。
当Benchmark越来越不能反映真实价值,你所在领域最重要的"真实反馈信号"是什么?
是用户留存?任务完成率?还是决策准确率?
欢迎分享你的观察。👇
加入讨论
“一次做对”这个词狠狠戳中我了,我司之前为了省钱用便宜模型,客服返工率直接飙升,最后算下来反而更贵。不过那个20年马拉松的说法,腾讯真的不焦虑吗?😂
“独特Context的构建能力”这话说得太对了。我们行业有个怪象:人人都在吹自己模型多厉害,真到落地环节,半年都搞不清客户实际工作流长啥样。Agent那部分也让我想起我司那个”智能助手”,到现在还会把客户名字叫错,协同涌现?协同崩溃还差不多🙂
不过那个公式我倒是准备抄走去给老板看看,万一能骗点预算呢。
看到双螺旋结构那里突然想通了,以前总觉得做产品的和搞模型的互相看不上,现在发现缺了谁都是在裸奔。不过说句实话,大部分公司真有能力玩得起这个闭环吗?数据回流听着简单,清洗和标注能把你累哭。