AI编码OpenSpecSpecKitHAFW代码评审
上周试了 OpenSpec,三分钟出了个原型,我差点信了。
然后跑了一下——
接口报错,数据库字段对不上,单元测试根本没写。

一、AI 编码工具的”假爽”#
国外这波 AI 编码工具很火:OpenSpec、SpecKit、SuperPower。
它们都能做到:
- 你说”我要个登录功能”
- 它生成需求文档
- 它生成开发计划
- 它开始写代码
听起来很完美。
但实际用下来,最大的问题是:没有评审。
需求文档出来之后,直接就给你 plan,中间没有”等人确认”这个环节。
你不知道它是不是理解错了你的需求,也不知道它给出的技术方案是不是最优的。
等你发现不对,代码已经写了一半。
二、国外工具缺了什么#
我对比了一下国外主流 AI 编码工具和国内实际开发流程:
| 环节 | OpenSpec | SpecKit | SuperPower | 国内实际流程 |
|---|---|---|---|---|
| 需求分析 | ✅ | ✅ | ✅ | ✅ |
| 需求评审 | ❌ | ❌ | ⚠️(交互式确认) | ✅ 必须 |
| 架构设计 | ✅ | ✅ | ✅ | ✅ |
| 设计评审 | ❌ | ❌ | ❌ | ✅ 必须 |
| 代码生成 | ✅ | ✅ | ✅ | ✅ |
| 单元测试 | ❌ | ❌ | ❌ | ✅ 必须 |
| 代码评审 | ❌ | ❌ | ❌ | ✅ 必须 |
| 质量检测 | ❌ | ❌ | ❌ | ✅ |
你可以看到,国外工具在”生成”这个环节做得很好,但”评审”和”测试”基本缺失。
SuperPower 稍微好一点,它会一步步问你”要不要加这个功能”,但这种交互式确认不是正式评审。
正式评审是什么?
- 需求评审:架构师、开发、产品一起看需求文档,补齐遗漏的点
- 设计评审:技术负责人看数据库设计、接口设计,挑出潜在问题
- 代码评审:同行看你的代码,指出不规范的地方
这些环节在国外工具里是空的。
三、为什么国内必须有评审#
国内软件开发有个特点:流程标准化程度高。
一个需求从提出到上线,至少要过三道评审:需求评审、设计评审、代码评审。
每一道评审都是为了降低返工成本 。
- 需求没评好 → 开发做到一半发现理解错了 → 重写
- 设计没评好 → 代码写完了发现架构有问题 → 重构
- 测试没写好 → 上线后出 bug → 紧急修复
国外工具直接跳过这些环节,AI 自己闷头写,写完给你一个”看起来没问题”的代码。
但实际上,没经过评审的代码,就是一颗定时炸弹。
四、我自己做了一套#
因为受不了这种”假爽”,我自己做了个技能包:HAFW。
核心思路很简单:把评审环节加回去。
完整流程是这样的:
需求调研 → 需求评审 → 原型设计 → 架构设计 → 设计评审
→ 数据库设计 → 接口设计 → 任务拆分 → 开发
→ 单元测试 → 代码评审 → 质量检测 → 运维部署plaintext每一步都可以单独执行,也可以跳过。
比如你只想让它帮你写代码,可以直接从”开发”开始。
但如果你想做一个完整的项目,按流程走一遍,每一步都有评审。
五、和国外工具比,HAFW 强在哪#
| 维度 | OpenSpec | HAFW |
|---|---|---|
| 需求评审 | ❌ | ✅ 多角色模拟评审 |
| 设计评审 | ❌ | ✅ 架构师视角检查 |
| 单元测试 | ❌ | ✅ 自动生成测试用例 |
| 代码评审 | ❌ | ✅ 代码规范检查 |
| 语言 | 英文 | 中文 |
| 修改难度 | 改英文文档 | 直接改中文文档 |
不是说 HAFW 比 OpenSpec 强——单看代码生成质量,OpenSpec 可能更好。
但 HAFW 管了 OpenSpec 不管的事:评审、测试、流程管理。
六、适合什么人用#
如果你只是想快速做个原型,验证想法,OpenSpec 足够了。
但如果你要:
- 做一个要上线的项目
- 团队协作开发
- 符合公司的开发流程规范
那评审环节是绕不过去的。
HAFW 就是把这块补上了。
国外工具好用,但别拿来当生产流水线。
至少,先把评审加上。