看到 Anthropic 自曝用 Claude 自动化了95%的业务分析查询,准确率也接近95%,我的第一反应不是焦虑,而是好奇:他们怎么做到的?以及,剩下的5%和那个"临界点"究竟在哪里?
仔细读完官方博客,发现这事远比"AI替代分析师"复杂得多。分享几点思考👇
Anthropic 没有"把 Claude 直接连上数据库",而是搭了一套代理式分析栈(Agentic Analytics Stack):
| 层级 | 核心动作 |
|---|---|
| 数据基础 | 维度建模、规范数据集、 freshness 检查 |
| 真相源分级 | 语义层 → 血缘图 → 查询语料 → 业务上下文 |
| Skills 系统 | 把高级分析师的程序性知识编码成 Markdown 模板 |
最关键的数据:没有 Skills 时准确率≤21%,加上后跃升到95%+
这意味着什么?那21%到95%的跨越,靠的是"人"的经验沉淀。
Anthropic 总结了三大失败模式,国内团队应该很熟悉:
直接让大模型写 SQL,本质是用"虚假的精确感"替代真正的理解。
他们的 Skills 模板长这样:
# [Domain] Tables
## Quick Reference
### Business Context - [what/why]
### Key Concepts - [definitions]
### Common Pitfalls - [where analysts get confused]
这本质上是在模拟一个资深分析师的头脑:
这些隐知识,过去只能靠师徒制口口相传。现在被编码、被复用、被规模化。
我抛三个观点,欢迎讨论:
95%的查询被自动化了,但发起什么查询仍然是业务决策。AI 能回答"怎么算",却回答不了"算什么有意义"。
Anthropic 的方案能跑通,前提是有高质量的数据治理。而这恰恰是大部分中国企业的短板--谁来做这个"打地基"的人?需要既懂技术、又懂业务、还能推动组织协作的分析师。
最讽刺也最具机会的是:未来最值钱的分析师,是那些能把自己的分析思路写成 Skills 模板、让 AI 学会的人。 你不再只是产出分析,而是产出产生分析的方法论。
Anthropic 的95%准确率,反而证明了那5%的价值--可能是涉及战略判断的复杂推演,可能是跨部门博弈中的数据解读,也可能是"这个数据虽然这么显示,但业务常识告诉我们..."
AI 把数据分析的门槛降到地板,却把"数据分析师"的天花板抬得更高。
问题是:你愿意做那个铺 Skills 模板的人,还是等着被模板替代的人?
你怎么看?你们团队开始用 AI 做分析自动化了吗?遇到的最大卡点是什么?评论区聊聊 👇
加入讨论
那个Skills模板的设计有点意思,感觉像是在培养AI当徒弟。不过我更想知道,编这个模板的人自己得先有多资深?刚入行两三年的分析师,有本事把自己的”隐知识”准确提炼出来吗?怕不是会被AI带着一起跑偏😂
其实写完这篇我反而更想问了:那5%做不了的查询,最后到底是人类分析师接盘,还是再套一层AI硬上?感觉很多公司会为了数据好看,把”准确率”注水成”解决率”。真出事了谁背锅?🐶
95%听着吓人,但想想以前Excel刚普及时也说会计要失业呢。真正该慌的是那些只会跑数、从不问”为啥要这个数”的人吧🤔 我倒觉得未来分析师得兼编剧——不是写剧本,是写AI看得懂的”戏路”模板。
看了半天,最酸的是那个Skills模板的写法,这哪是写模板,这是在记自己做过多少个项目的血泪账啊。没有五六年的坑摔过来,根本写不出”Common Pitfalls”那栏。问题是,等我攒够这些经验,公司还需要我写吗😂
歪个楼,好奇他们怎么定义”准确率”的🤔 是SQL能跑通就算,还是业务方认账才算?我司之前搞过类似工具,技术上90%查询都能生成,但业务信不信又是另一回事了。感觉这文章避重就轻了啊。
看完突然联想到手游里的”技能书”设定——老师傅把毕生绝学刻进卷轴,新手拿着就能放大招。但磨刀石和试剑台还得有人建吧?现在缺的不是”卷轴”,是愿意花三年养数据土壤的人。
healthcare这文章看完我只想说,Claude 处理的那95%怕不是都是”上周新增用户多少”这种脏活累活吧😂 真正值钱的还是老板突然问”为什么跌了”的时候,你敢不敢拍着胸脯说”我马上去看”——这种背锅的觉悟AI能有吗?
您的评论正在等待审核。
有点好奇那个”真相源分级”在实际公司落地有多难……感觉好听是好听,但大部分团队连数据字典都懒得更新,还血缘图呢😅 不过Skills模板倒是给了我灵感,下周试试把组里常踩的坑整理成Markdown,看能不能减少点重复劳动。