深夜“核弹”再临:GPT-5-Codex 让程序员首次拥有 7×24 不喘气的“超级队友”
一个老翁
09-16
161

2025 年 9 月 16 日凌晨,OpenAI 把四个月前的 CLI 小玩具一次性升级成完整“开发舰队”——GPT-5-Codex 正式发布。它不是插件,也不是简单的代码补全,而是一台能把“需求描述 → 项目搭建 → 编码 → 测试 → 重构 → 审查 → 合并”全部闭环的 AI 代理。 一、模型:把“通才”炼成“专兵” 新模型在 GPT-5 底座上继续预训练 + 强化学习,数据全部来自真实工程仓库。结果: • SWE-bench Verified 500 题拿下 74.5%,比 GPT-5 再提 1.7 个百分点; • 横跨 Python/Go/OCaml 的重构 benchmark 从 33.9% 飙到 51.3%,一次 PR 改 232 文件、3 541 行代码无人工回撤; • 内部计时显示,GPT-5-Codex 可连续自主执行 7 小时 15 分,迭代 118 次后通过所有测试——人类只需在起点给需求、终点按合并。 二、体验:一个账号,打通全链路 OpenAI 把之前碎片化的 CLI、Web、IDE 插件、GitHub App 全部收拢到同一 ChatGPT 账户体系,上下文云端同步,任务断点续跑: 1. CLI:npm 一行装完,可贴图、可跟踪代办,支持只读/半自动/完全三档权限; 2. IDE:VS Code 与 Cursor 原生扩展,本地代码即上下文,一键把云端结果拉回编辑器;https://developers.openai.com/codex/cli 3. Cloud:容器缓存让二次任务提速 90%,自动识别 pip/install 脚本,配环境零交互; 4. Mobile:ChatGPT iOS 端也能开任务,截屏→标注→扔给 Codex,地铁里也能让 AI 改 UI。 三、审查:从“提意见”到“直接改好” 传统静态分析工具只能给警告,GPT-5-Codex 会: • 读完整仓库与依赖,理解 PR 意图; • 自动跑测试、复现 Bug; • 把“问题描述 + 修复 diff”一次性推到评论; • 你 @codex apply,它就强制推覆盖,CI 通过即可合并。 内部数据:错误评论率由 13.7% 降到 4.4%,高价值建议占比升至 52.4%,平均每条 PR 评论数降至 0.93 条,信息密度翻倍。 四、安全与定价 默认沙盒无网络,高危操作需人工确认;Business/Enterprise 可设白名单域名、审计日志全程回放。 使用额度随订阅梯度开放:Plus 用户月付 20 美元起,Pro/Enterprise 可购积分池;API 计价页已上线,按推理深度阶梯计费,简单任务比 GPT-5 便宜 90%,复杂任务翻倍但质量封顶。 结语 当 AI 把“写代码”做成端到端服务,程序员的角色被推向更高阶:定义问题、验收结果、让机器去完成中间最脏最累的活。GPT-5-Codex 不是“帮你写几行”,而是“把项目交给我,你去睡觉”。深夜的核弹,炸掉的不是饭碗,而是加班。 微信扫描下方的二维码阅读更多精彩内容 …

部分内容已折叠,查看完整文章请先登录。 登录后查看完整文章
打赏
如何从 0 开始做一个 html 封面模板 AI 提示词
上一篇
小红书很火的AI手办如何制作
下一篇
生成中...
点赞是美意,赞赏是鼓励