它们看起来像一类工具,其实不是
第一次看 GSD2 和 OMX,很容易误判。两边页面上都写 agent、长任务、验证、状态、多代理,像是同一套东西的两种皮。
其实差得很远。GSD2 首页写的是 “the autonomous coding agent”。OMX 首页写的是 OpenAI Codex CLI 的 multi-agent orchestration layer。前者想接手项目推进,后者想把 Codex 变成一套更厚的编排系统。名字都在 AI 编程这条线上,手伸进去的位置完全不是一回事。
这一步看错,后面基本都会用错。很多人最后不是没把工具跑起来,而是在同一个仓库里叠了两套状态、一套 plan 流、一套 team 流,谁都像总控,谁也收不住。
GSD2 在管项目,OMX 在管 Codex
GSD2 的重心在项目。它不是先问“你手上有几个 agent”,而是先问“这件事现在在哪个 milestone,下一步拆成哪个 slice,做完以后怎么验,失败以后怎么续”。它把任务推进本身当成产品。
OMX 的重心在 Codex。它先给 Codex CLI 补 team、skills、MCP、hooks、worktree、role prompts,再把这些东西接成一条 staged pipeline。官方文档里那句 “You are the conductor, not the performer” 很说明问题。它假设你愿意一直站在台前调度。
GSD2 更像在管工地,OMX 更像在扩指挥部。
如果你最想解决的是“项目自己往前走”,GSD2 的切口更深。如果你已经认定 Codex 是主工作台,只是嫌原生能力不够厚,OMX 的切口更顺手。
.gsd/ 和 .omx/ 背后是两种状态观
GSD2 架构页里最该盯的一句,是 .gsd/ is the sole source of truth。意思很硬:项目状态不要散在聊天里,也不要靠人自己记。计划、任务、总结、验证都得落盘,下一次继续时先读状态,再开新 session。
它还把 “Fresh Session Per Unit” 单独拎出来。每个工作单元尽量用新上下文跑。这样做不花哨,但很实用。会话不容易越跑越脏,中断以后也更容易接。
OMX 也有自己的状态目录和记忆层,.omx/state/、notepad、persistent memory/state 都写在文档里。但它的状态更多是为编排服务,不是把整个项目压成一个单一状态机。它在管谁负责什么、当前团队处在哪个阶段、哪些 hooks 和 skills 在生效;GSD2 在管项目本身现在走到哪一步。
所以两边都说自己支持长任务,手感却不一样。GSD2 的长任务更像“断了还能接着干”。OMX 的长任务更像“这支队伍还能继续协作”。
多代理、验证和恢复,重点也不一样
OMX 在多代理这件事上明显更重。它把 team mode、worktree isolation、mixed-provider teams 放在门面上,意思很明白:大任务就该拆角色、拆工位、拆上下文。你如果本来就喜欢 leader、worker、verifier 这一套,OMX 会很顺。
GSD2 也有 subagent,也能并行,也能隔离 worktree,但这些东西在它那里不是主角。它们更像流水线上的工位,不像控制台上的展示层。你不会先用 GSD2 来享受“我有一支 agent 团队”,你会先用它把 milestone 往前推。
验证也一样。GSD2 文档里把 contract、integration、operational 三层验证分得很开,写法很工程。OMX 也有 verify lane,也强调 evidence-based development,但它更像把验证组织进编排流程,而不是塞进同一个项目状态机里。
落到体验上,GSD2 更像在问:这件事真的闭环了吗。OMX 更像在问:这条协作链组织对了吗。
成本不在功能表,在世界观
OMX 的好处,是离 Codex 很近。你本来就在用 Codex CLI,再往上叠 prompts、skills、MCP、team mode,很顺。坏处也在这里。你会一下子背上很多控制面:角色、模式、命令、hooks、状态、tmux、worktree。对 Codex 重度用户,这叫专业化;对普通作者或开发者,这就可能太多了。
GSD2 的前期阻力更大。它不是让你多学几个命令,而是要你接受 milestone、slice、ROADMAP、verification ladder 这一整套语法。第一轮会慢,文档自己也承认这一点。
但这套东西一旦跑顺,后面反而更省脑子。很多决定不用每次重来,因为项目状态已经写下来了。对个人开发者和小团队来说,这往往比多几个 agent 花活更值钱。
到底怎么选
如果你已经把 Codex 当主工作台,而且你确实会长期用 team mode、role prompts、worktree 协作、mixed-provider 这些能力,选 OMX 没问题。它不是替代 Codex,它是在给 Codex 加厚外壳。
如果你真正缺的是一条稳定的项目推进主线,选 GSD2 更对路。它解决的是很多人今天最头疼的事:任务一长就散,会话一断就乱,验证总靠手工补,几天以后很难继续接着做。
不要把两者都当总控层。它们都想管状态、计划、验证和 agent 调度。双主控看起来豪华,实际很容易互相抢方向盘。
我的答案
如果只能选一个主流程,我先选 GSD2。
多数团队今天不缺再多一层 prompt、角色和编排,他们缺的是一条任务不会越跑越散的执行骨架。GSD2 在这件事上收得更紧,也更像主线。
OMX 也有价值。对 Codex 重度用户来说,它像一套外挂操作系统,能把多代理协作、技能和阶段流组织得更顺。但它更像增强层,不像项目内核。
围着 Codex 工作,想把 Codex 用到更深,选 OMX。围着项目交付工作,想先把执行秩序立住,先选 GSD2。
还没有评论,你可以写下第一条。