跳到主要内容

OpenAI Codex 排错

先判断是不是阶段管理失控

这页主要处理三类故障:

  • 阶段目标太大,执行开始失控
  • 验证证据太弱,没人知道是否该继续
  • handoff 太多,但每一轮都没有沉淀成计划

如果你的问题只是小步维护,不要先怪执行栈,优先回 Claude Code 排错

常见卡点

  • 一次给太大的目标,导致阶段边界不清。
  • 没有明确的阶段验证,只剩“看起来差不多”。
  • 中途切换太多上下文,导致 handoff 失真。

症状到原因的快速对应

  • 症状:执行越往后越偏,最后变成大 diff。 原因:阶段目标写得像总目标。
  • 症状:每轮都像从头再来。 原因:前一轮结果没有写回计划。
  • 症状:不知道该继续还是暂停。 原因:没有可 review 的阶段证据。

诊断顺序

  1. 先看计划是不是太大。
  2. 再看每个阶段有没有真实验证命令。
  3. 最后看是否保留了可 review 的执行记录。

修复动作

场景 1:阶段目标过大

把当前阶段重新拆到能回答这三个问题:

  • 这轮只做什么
  • 这轮明确不做什么
  • 这轮结束后看什么证据

如果回答不出来,说明不是“继续调提示”,而是要重写阶段定义。

场景 2:没有阶段验证

不要再用“看起来差不多”推动下一阶段。先补齐:

  • 命令验证
  • 行为验证
  • 失败时的停止条件

没有这些,就不要继续推进。

场景 3:handoff 失真

每一轮结束后都把结果写回计划:

  • 已完成什么
  • 还有什么没完成
  • 下一轮依据什么继续

如果 handoff 只存在聊天里,下一轮就必然漂移。

回退策略

下次避免再犯

  • 阶段名写具体,不写成“先做大部分实现”
  • 每轮结束都留下计划更新和验证证据
  • reviewer 看到的是阶段摘要,不是原始长日志

什么时候直接换工具

继续阅读

来源