跳到主要内容

OpenAI Codex 重构与验证案例

背景

这类任务的问题不是“代码会不会写”,而是长链路改动一旦失去计划、边界和验证,就很容易变成一团难 review 的大 diff。这个案例展示的是如何先收计划,再让 Codex 推进执行。

输入约束

执行过程

  1. 先写一版最小 spec,明确输入、产物、范围和验收。
  2. 再让 Codex 按 spec 生成计划,并限定这轮只推进一个阶段。
  3. 阶段完成后马上跑验证,记录失败或通过信号。
  4. 只有上一阶段证据完整时,才进入下一轮改动。

这让 Codex 的长任务优势落在“阶段推进”,而不是落在“一次性改完所有东西”。

结果

  • 计划、执行和验证都有独立痕迹,review 更容易。
  • 改动虽然跨模块,但不会失去阶段边界。
  • 如果中途需要人工接管,也能快速知道现在做到哪一步。

复盘

  • Codex 更适合承担执行栈和阶段推进,而不是替代所有判断。
  • 没有 spec 和阶段验证时,它的执行力会把边界问题放大。
  • 这条案例适合长任务重构,不适合只修一个局部 bug。

下一步