
2025 年 9 月 16 日凌晨,OpenAI 把四个月前的 CLI 小玩具一次性升级成完整“开发舰队”——GPT-5-Codex 正式发布。它不是插件,也不是简单的代码补全,而是一台能把“需求描述 → 项目搭建 → 编码 → 测试 → 重构 → 审查 → 合并”全部闭环的 AI 代理。
一、模型:把“通才”炼成“专兵”
新模型在 GPT-5 底座上继续预训练 + 强化学习,数据全部来自真实工程仓库。结果:
• SWE-bench Verified 500 题拿下 74.5%,比 GPT-5 再提 1.7 个百分点;
• 横跨 Python/Go/OCaml 的重构 benchmark 从 33.9% 飙到 51.3%,一次 PR 改 232 文件、3 541 行代码无人工回撤;
• 内部计时显示,GPT-5-Codex 可连续自主执行 7 小时 15 分,迭代 118 次后通过所有测试——人类只需在起点给需求、终点按合并。
二、体验:一个账号,打通全链路
OpenAI 把之前碎片化的 CLI、Web、IDE 插件、GitHub App 全部收拢到同一 ChatGPT 账户体系,上下文云端同步,任务断点续跑:
1. CLI:npm 一行装完,可贴图、可跟踪代办,支持只读/半自动/完全三档权限;
2. IDE:VS Code 与 Cursor 原生扩展,本地代码即上下文,一键把云端结果拉回编辑器;https://developers.openai.com/codex/cli
3. Cloud:容器缓存让二次任务提速 90%,自动识别 pip/install 脚本,配环境零交互;
4. Mobile:ChatGPT iOS 端也能开任务,截屏→标注→扔给 Codex,地铁里也能让 AI 改 UI。
三、审查:从“提意见”到“直接改好”
传统静态分析工具只能给警告,GPT-5-Codex 会:
• 读完整仓库与依赖,理解 PR 意图;
• 自动跑测试、复现 Bug;
• 把“问题描述 + 修复 diff”一次性推到评论;
• 你 @codex apply,它就强制推覆盖,CI 通过即可合并。
内部数据:错误评论率由 13.7% 降到 4.4%,高价值建议占比升至 52.4%,平均每条 PR 评论数降至 0.93 条,信息密度翻倍。
四、安全与定价
默认沙盒无网络,高危操作需人工确认;Business/Enterprise 可设白名单域名、审计日志全程回放。
使用额度随订阅梯度开放:Plus 用户月付 20 美元起,Pro/Enterprise 可购积分池;API 计价页已上线,按推理深度阶梯计费,简单任务比 GPT-5 便宜 90%,复杂任务翻倍但质量封顶。
结语
当 AI 把“写代码”做成端到端服务,程序员的角色被推向更高阶:定义问题、验收结果、让机器去完成中间最脏最累的活。GPT-5-Codex 不是“帮你写几行”,而是“把项目交给我,你去睡觉”。深夜的核弹,炸掉的不是饭碗,而是加班。
微信扫描下方的二维码阅读更多精彩内容

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
