深夜“核弹”再临：GPT-5-Codex 让程序员首次拥有 7×24 不喘气的“超级队友”

2025 年 9 月 16 日凌晨，OpenAI 把四个月前的 CLI 小玩具一次性升级成完整“开发舰队”——GPT-5-Codex 正式发布。它不是插件，也不是简单的代码补全，而是一台能把“需求描述 → 项目搭建 → 编码 → 测试 → 重构 → 审查 → 合并”全部闭环的 AI 代理。一、模型：把“通才”炼成“专兵” 新模型在 GPT-5 底座上继续预训练 + 强化学习，数据全部来自真实工程仓库。结果： • SWE-bench Verified 500 题拿下 74.5%，比 GPT-5 再提 1.7 个百分点； • 横跨 Python/Go/OCaml 的重构 benchmark 从 33.9% 飙到 51.3%，一次 PR 改 232 文件、3 541 行代码无人工回撤； • 内部计时显示，GPT-5-Codex 可连续自主执行 7 小时 15 分，迭代 118 次后通过所有测试——人类只需在起点给需求、终点按合并。二、体验：一个账号，打通全链路 OpenAI 把之前碎片化的 CLI、Web、IDE 插件、GitHub App 全部收拢到同一 ChatGPT 账户体系，上下文云端同步，任务断点续跑： 1. CLI：npm 一行装完，可贴图、可跟踪代办，支持只读/半自动/完全三档权限； 2. IDE：VS Code 与 Cursor 原生扩展，本地代码即上下文，一键把云端结果拉回编辑器；https://developers.openai.com/codex/cli 3. Cloud：容器缓存让二次任务提速 90%，自动识别 pip/install 脚本，配环境零交互； 4. Mobile：ChatGPT iOS 端也能开任务，截屏→标注→扔给 Codex，地铁里也能让 AI 改 UI。三、审查：从“提意见”到“直接改好” 传统静态分析工具只能给警告，GPT-5-Codex 会： • 读完整仓库与依赖，理解 PR 意图； • 自动跑测试、复现 Bug； • 把“问题描述 + 修复 diff”一次性推到评论； • 你 @codex apply，它就强制推覆盖，CI 通过即可合并。内部数据：错误评论率由 13.7% 降到 4.4%，高价值建议占比升至 52.4%，平均每条 PR 评论数降至 0.93 条，信息密度翻倍。四、安全与定价默认沙盒无网络，高危操作需人工确认；Business/Enterprise 可设白名单域名、审计日志全程回放。使用额度随订阅梯度开放：Plus 用户月付 20 美元起，Pro/Enterprise 可购积分池；API 计价页已上线，按推理深度阶梯计费，简单任务比 GPT-5 便宜 90%，复杂任务翻倍但质量封顶。结语当 AI 把“写代码”做成端到端服务，程序员的角色被推向更高阶：定义问题、验收结果、让机器去完成中间最脏最累的活。GPT-5-Codex 不是“帮你写几行”，而是“把项目交给我，你去睡觉”。深夜的核弹，炸掉的不是饭碗，而是加班。微信扫描下方的二维码阅读更多精彩内容 …

部分内容已折叠，查看完整文章请先登录。登录后查看完整文章

声明：本站所有文章，如无特殊说明或标注，均为橙市播客原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。如果你是AI总结，务必加上此版权说明