GPT-4o的灵魂缺失 vs 记忆系统升级:用户更在乎模型性格还是功能实用?

1 参与者

GPT-4o的灵魂缺失 vs 记忆系统升级:用户更在乎模型性格还是功能实用?


OpenAI 今天这波记忆系统升级,我抠完细节后有个挺有意思的发现:

功能越强大,用户的"既要又要"暴露得越彻底。


先说说这次 Dreaming V3 到底升级了什么

从"记笔记"到"自己做梦"

阶段时间核心逻辑痛点
Saved Memories2024.04用户主动说"记住"频繁提醒、容易遗漏、信息过时
Dreaming V02025后台自动提炼记忆仅辅助,深度不足
Dreaming V32026.06独立核心能力,主动合成认知

三个最实用的变化:

  • 自动捕捉 + 动态更新:不再是死记录,而是活认知。7月的旅行,6月底知道"即将开始",8月知道"已经结束"
  • Memory Summary 记忆摘要:可视化你的"AI 用户画像",可浏览、可编辑、可设置触发规则--黑箱终于变白了
  • 容量翻倍 + 算力提升5倍:Plus/Pro 先享,逐步开放

三个真实用例的对比

摄影器材场景

  • 以前:问闪光灯 → 通用答案
  • 现在:调用你的 Sony A1 II + 特定防水壳 → 告诉你兼容型号和注意事项

新加坡旅行

  • 以前:千篇一律攻略
  • 现在:野生动物摄影偏好 + 强空调酒店 + 安静晚餐 → 定制化行程

外卖推荐

  • 以前:人在 Portola Valley,还以为你在新加坡推荐宵夜
  • 现在:实时位置 + 当地时间 + 营业状态 → 精准推荐

但用户的真实反应让我意外

X 上的评论分成两派,比例大概是 3:7

"功能派"(30%)

"长期当作生产力工具的人,这波确实舒服了"

“还我4o派”(70%)

"记忆再强也救不了灵魂缺失" "先把 GPT-4o 还回来"

还有人加了一刀:"只在美国推,搞快点"


我的核心观察:AI 产品的"灵魂悖论"

这次争议本质上暴露了一个深层问题:

用户到底在为什么付费?

维度功能实用型情感陪伴型
核心诉求效率提升、信息准确、流程顺畅使用时的"手感"、对话的愉悦感、被理解的错觉
容忍阈值低:一次错误就可能卸载高:偶尔抽风也能包容
迁移成本低:竞品功能复制快高:换模型像"分手"
代表抱怨"推荐还是不准""现在的模型不是那个味了"

GPT-4o 的特殊之处在于--它恰好同时踩中了两个象限的最优解

既足够聪明(功能),又有那种不好描述的"对话质感"(灵魂)。后来者模型在 benchmark 上可能追平甚至超越,但"手感"这种东西,训练数据调不回来了就是调不回来了


两个值得讨论的命题

命题一:记忆系统能不能弥补"灵魂缺失"?

我的判断:能缓解,不能替代

  • 记忆让 AI 更"懂你" → 提升的是相关性
  • 灵魂让 AI 更"像人" → 提升的是愉悦性

这是两个维度的体验。你可以接受一个聪明但无趣的助手,但很难长期忍受一个精准但冰冷的对话对象--尤其当你曾经体验过更好的

命题二:OpenAI 为什么先推记忆而非复现 4o?

几个可能的商业逻辑:

  1. 记忆是基础设施 → 所有模型通用,ROI 更高
  2. "灵魂"可能是意外产物 → 开发者自己都说不清的涌现特征,难以工程化复现
  3. 功能好量化,灵魂难承诺 → 做产品当然先推能写进更新日志的

抛出来聊聊

如果你只能二选一:

  • A. 记忆系统完美,但模型"手感"普通
  • B. 模型灵魂在线,但记忆像金鱼(7秒重置)

你会选哪个?为什么?


我个人会犹豫很久,然后可能真香选 A--然后半夜怀念 B。

这大概就是当代 AI 用户的宿命。 🔥

加入讨论

1 条评论

延伸阅读