OpenAI Codex 重构与验证案例
背景
这类任务的问题不是“代码会不会写”,而是长链路改动一旦失去计划、边界和验证,就很容易变成一团难 review 的大 diff。这个案例展示的是如何先收计划,再让 Codex 推进执行。
输入约束
- 主工具固定为 OpenAI Codex 快速开始。
- 流程固定为 Spec-First Runbook。
- 必须先写清范围、模块和验收,再开始改动。
- 每个阶段都要有真实验证记录。
执行过程
- 先写一版最 小 spec,明确输入、产物、范围和验收。
- 再让 Codex 按 spec 生成计划,并限定这轮只推进一个阶段。
- 阶段完成后马上跑验证,记录失败或通过信号。
- 只有上一阶段证据完整时,才进入下一轮改动。
这让 Codex 的长任务优势落在“阶段推进”,而不是落在“一次性改完所有东西”。
结果
- 计划、执行和验证都有独立痕迹,review 更容易。
- 改动虽然跨模块,但不会失去阶段边界。
- 如果中途需要人工接管,也能快速知道现在做到哪一步。
复盘
- Codex 更适合承担执行栈和阶段推进,而不是替代所有判断。
- 没有 spec 和阶段验证时,它的执行力会把边界问题放大。
- 这条案例适合长任务重构,不适合只修一个局部 bug。
下一步
- 回到 OpenAI Codex 常见任务。
- 回到 Spec-First 示例。
- 如果你现在要做更短闭环的维护任务,切到 Bugfix / Refactor / Test Runbook。