AI Agent 为什么做不好长任务?Anthropic 给出的工程答案
aikeji
03-25
23


如果你用过各种 AI Agent(无论是写代码、做项目还是自动化工具),你大概率遇到过这些问题:

  • 跑了一会儿就“忘了自己在干嘛”
  • 写了一堆代码,但没法运行
  • 明明没完成,却说“已经完成”
  • 每次重启,都像从零开始

这些问题看起来像是“模型不够聪明”,但 Anthropic 给出了一个更现实的结论:

问题不在模型,而在你怎么让它工作。

今天要讲得内容,不是模型能力,而是一个很工程化的东西: Harness(执行框架 / 工作流外壳)


一、长任务的本质问题:AI 没有“连续性”

我们先把问题说清楚。

大模型其实是“单轮高手”,但不是“长期执行者”。

部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章

如果你只记住一句话:

让 AI 做长任务的关键,不是更强的模型,而是让它运行在一个像软件工程一样的系统里。

原创文章,更多AI科技内容,微信搜索橙市播客小程序



微信扫描下方的二维码阅读更多精彩内容

打赏
从爆红到关停,Sora App经历了什么?
上一篇
谷歌新压缩算法TurboQuant,将键值缓存内存减少至少 6 倍,速度提升高达 8 倍
下一篇
生成中...
点赞是美意,赞赏是鼓励