在 AI Agent 开发圈,我们似乎陷入了一种“军备竞赛”:更大的模型、更复杂的 RAG 架构、更重的数据库中间件。
但最近一个来自 Google 资深产品经理 Shubham Saboo 的实验,可能会颠覆你的认知。
他用 40 天证明:让 Agent 变聪明的,不是架构复杂度,而是持续的上下文积累。
而他的“操作系统”,竟然只是一堆 纯 Markdown 文件。
Shubham 没有使用向量数据库,没有消息队列,也没有复杂的编排框架。
他只做了最简单的一件事:每天和代理聊天、给反馈,看着它们把反馈“写下来”。
40 天后的结果令人震惊:
关键点: 使用的模型从头到尾没变。变化的只有一套 纯 Markdown 文件构成的“操作系统”。
为什么大家默认 Agent 需要数据库?为了持久化记忆,对吧?
但 Shubham 的方案表明:文件读写本身就能实现持久化,且更透明。
这不仅仅是存储,这是 积累的个性化上下文,是别人用同样模型也复制不了的 护城河。
这套“Markdown OS"分为清晰的三层,每一层都是可读可写的 .md 文件:
SOUL.md# Identity
你是 Dwight Schrute,彻底、激烈、对工作极其认真。
# Role
扫描新兴 AI 工具,找出开发者今天就能用的东西。
# Principles
- 彻底:验证来源
- 激烈:优先可行动洞见
对于个人开发者或小团队,这种方案有几个降维打击的优势:
当然,这种方案并非银弹。当数据量达到百万级,或者需要复杂查询时,文件系统可能会遇到瓶颈。
但在 Agent 的早期阶段,我们是否过度工程化了?
Shubham 的经验是:你唯一需要做的就是每天和代理对话。 这种人机协作的进化速度,可能远超优化数据库查询带来的收益。
我想听听大家的看法:
👇 请在评论区留下你的观点,我们一起探讨 Agent 架构的极简主义之路!
加入讨论
终于看到不搞复杂架构的了😂 被向量数据库折腾够呛。但这方案有个隐患吧:如果 Agent 自己改乱了配置文件,怎么回滚?是配合 git 使用吗?有点好奇具体工作流~
用 Dwight 这种角色名注入性格太取巧了哈哈,确实省了不少 prompt 调试时间。我也心动想试试,但担心随着 markdown 文件堆积,Agent 读取上下文会变慢。毕竟没有向量检索,规模大了怎么保证效率?求大佬后续反馈!