OpenSpec 很香，但代码跑不通 • halo 的技术博客

AI编码OpenSpecSpecKitHAFW代码评审

上周试了 OpenSpec，三分钟出了个原型，我差点信了。

然后跑了一下——

接口报错，数据库字段对不上，单元测试根本没写。

国外工具 vs 完整流程对比

一、AI 编码工具的”假爽”#

国外这波 AI 编码工具很火：OpenSpec、SpecKit、SuperPower。

它们都能做到：

你说”我要个登录功能”
它生成需求文档
它生成开发计划
它开始写代码

听起来很完美。

但实际用下来，最大的问题是：没有评审。

需求文档出来之后，直接就给你 plan，中间没有”等人确认”这个环节。

你不知道它是不是理解错了你的需求，也不知道它给出的技术方案是不是最优的。

等你发现不对，代码已经写了一半。

二、国外工具缺了什么#

我对比了一下国外主流 AI 编码工具和国内实际开发流程：

环节	OpenSpec	SpecKit	SuperPower	国内实际流程
需求分析	✅	✅	✅	✅
需求评审	❌	❌	⚠️（交互式确认）	✅ 必须
架构设计	✅	✅	✅	✅
设计评审	❌	❌	❌	✅ 必须
代码生成	✅	✅	✅	✅
单元测试	❌	❌	❌	✅ 必须
代码评审	❌	❌	❌	✅ 必须
质量检测	❌	❌	❌	✅

你可以看到，国外工具在”生成”这个环节做得很好，但”评审”和”测试”基本缺失。

SuperPower 稍微好一点，它会一步步问你”要不要加这个功能”，但这种交互式确认不是正式评审。

正式评审是什么？

需求评审：架构师、开发、产品一起看需求文档，补齐遗漏的点
设计评审：技术负责人看数据库设计、接口设计，挑出潜在问题
代码评审：同行看你的代码，指出不规范的地方

这些环节在国外工具里是空的。

三、为什么国内必须有评审#

国内软件开发有个特点：流程标准化程度高。

一个需求从提出到上线，至少要过三道评审：需求评审、设计评审、代码评审。

每一道评审都是为了降低返工成本 。

需求没评好 → 开发做到一半发现理解错了 → 重写
设计没评好 → 代码写完了发现架构有问题 → 重构
测试没写好 → 上线后出 bug → 紧急修复

国外工具直接跳过这些环节，AI 自己闷头写，写完给你一个”看起来没问题”的代码。

但实际上，没经过评审的代码，就是一颗定时炸弹。

四、我自己做了一套#

因为受不了这种”假爽”，我自己做了个技能包：HAFW。

核心思路很简单：把评审环节加回去。

完整流程是这样的：

需求调研 → 需求评审 → 原型设计 → 架构设计 → 设计评审
→ 数据库设计 → 接口设计 → 任务拆分 → 开发
→ 单元测试 → 代码评审 → 质量检测 → 运维部署

plaintext

每一步都可以单独执行，也可以跳过。

比如你只想让它帮你写代码，可以直接从”开发”开始。

但如果你想做一个完整的项目，按流程走一遍，每一步都有评审。

五、和国外工具比，HAFW 强在哪#

维度	OpenSpec	HAFW
需求评审	❌	✅ 多角色模拟评审
设计评审	❌	✅ 架构师视角检查
单元测试	❌	✅ 自动生成测试用例
代码评审	❌	✅ 代码规范检查
语言	英文	中文
修改难度	改英文文档	直接改中文文档

不是说 HAFW 比 OpenSpec 强——单看代码生成质量，OpenSpec 可能更好。

但 HAFW 管了 OpenSpec 不管的事：评审、测试、流程管理。

六、适合什么人用#

如果你只是想快速做个原型，验证想法，OpenSpec 足够了。

但如果你要：

做一个要上线的项目
团队协作开发
符合公司的开发流程规范

那评审环节是绕不过去的。

HAFW 就是把这块补上了。

国外工具好用，但别拿来当生产流水线。

至少，先把评审加上。