
如果你用过各种 AI Agent(无论是写代码、做项目还是自动化工具),你大概率遇到过这些问题:
- 跑了一会儿就“忘了自己在干嘛”
- 写了一堆代码,但没法运行
- 明明没完成,却说“已经完成”
- 每次重启,都像从零开始
这些问题看起来像是“模型不够聪明”,但 Anthropic 给出了一个更现实的结论:
问题不在模型,而在你怎么让它工作。
今天要讲得内容,不是模型能力,而是一个很工程化的东西: Harness(执行框架 / 工作流外壳)
一、长任务的本质问题:AI 没有“连续性”
我们先把问题说清楚。
大模型其实是“单轮高手”,但不是“长期执行者”。
部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章
如果你只记住一句话:
让 AI 做长任务的关键,不是更强的模型,而是让它运行在一个像软件工程一样的系统里。
原创文章,更多AI科技内容,微信搜索橙市播客小程序
微信扫描下方的二维码阅读更多精彩内容

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如果你是AI总结,务必加上此版权说明