
2025 年 9 月 16 日凌晨,OpenAI 把四个月前的 CLI 小玩具一次性升级成完整“开发舰队”——GPT-5-Codex 正式发布。它不是插件,也不是简单的代码补全,而是一台能把“需求描述 → 项目搭建 → 编码 → 测试 → 重构 → 审查 → 合并”全部闭环的 AI 代理。
一、模型:把“通才”炼成“专兵”
新模型在 GPT-5 底座上继续预训练 + 强化学习,数据全部来自真实工程仓库。结果:
• SWE-bench Verified 500 题拿下 74.5%,比 GPT-5 再提 1.7 个百分点;
• 横跨 Python/Go/OCaml 的重构 benchmark 从 33.9% 飙到 51.3%,一次 PR 改 232 文件、3 541 行代码无人工回撤;
• 内部计时显示,GPT-5-Codex 可连续自主执行 7 小时 15 分,迭代 118 次后通过所有测试——人类只需在起点给需求、终点按合并。
四、安全与定价
默认沙盒无网络,高危操作需人工确认;Business/Enterprise 可设白名单域名、审计日志全程回放。
使用额度随订阅梯度开放:Plus 用户月付 20 美元起,Pro/Enterprise 可购积分池;API 计价页已上线,按推理深度阶梯计费,简单任务比 GPT-5 便宜 90%,复杂任务翻倍但质量封顶。
结语
当 AI 把“写代码”做成端到端服务,程序员的角色被推向更高阶:定义问题、验收结果、让机器去完成中间最脏最累的活。GPT-5-Codex 不是“帮你写几行”,而是“把项目交给我,你去睡觉”。深夜的核弹,炸掉的不是饭碗,而是加班。

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如果你是AI总结,务必加上此版权说明
