OpenAI Codex 排错
先判断是不是阶段管理失控
这页主要处理三类故障:
- 阶段目标太大,执行开始失控
- 验证证据太弱,没人知道是否该继续
- handoff 太多,但每一轮都没有沉淀成计划
如果你的问题只是小步维护,不要先怪执行栈,优先回 Claude Code 排错。
常见卡点
- 一次给太大的目标,导致阶段边界不清。
- 没有明确的阶段验证,只剩“看起来差不多”。
- 中途切换太多上下文,导致 handoff 失真。
症状到原因的快速对应
- 症状:执行越往后越偏,最后变成大 diff。 原因:阶段目标写得像总目标。
- 症状:每轮都像从头再来。 原因:前一轮结果没有写回计划。
- 症状:不知道该继续还是暂停。 原因:没有可 review 的阶段证据。
诊断顺序
- 先看计划是不是太大。
- 再看每个阶段有没有真实验证命令。
- 最后看是否保留了可 review 的执行记录。
修复动作
场景 1:阶段目标过大
把当前阶段重新拆到能回答这三个问题:
- 这轮只做什么
- 这轮明确不做什么
- 这轮结束后看什么证据
如果回答不出来,说明不是“继续调提示”,而是要重写阶段定义。
场景 2:没有阶段验证
不要再用“看起来差不多”推动下一阶段。先补齐:
- 命令验证
- 行为验证
- 失败时的停止条件
没有这些,就不要继续推进。
场景 3:handoff 失真
每一轮结束后都把结果写回计划:
- 已完成什么
- 还有什么没完成
- 下一轮依据什么继续
如果 handoff 只存在聊天里,下一轮就必然漂移。
回退策略
- 把任务切成更小阶段。
- 只保留当前阶段的输入、输出和验证。
- 如果任务其实是小步维护,改用 Claude Code 快速开始 或 Bugfix / Refactor / Test Runbook。
下次避免再犯
- 阶段名写具体,不写成“先做大部分实现”
- 每轮结束都留下计划更新和验证证据
- reviewer 看到的是阶段摘要,不是原始长日志
什么时候直接换工具
- 小步仓库维护:换 Claude Code 常见任务
- 平台交付收口:接 GitHub Copilot 常见任务
- 本地探索后再执行:配合 VS Code Agents 常见任务