halo 的技术博客

返回

AI编码OpenSpecSpecKitHAFW代码评审

上周试了 OpenSpec,三分钟出了个原型,我差点信了。

然后跑了一下——

接口报错,数据库字段对不上,单元测试根本没写。


国外工具 vs 完整流程对比

一、AI 编码工具的”假爽”#

国外这波 AI 编码工具很火:OpenSpec、SpecKit、SuperPower。

它们都能做到:

  • 你说”我要个登录功能”
  • 它生成需求文档
  • 它生成开发计划
  • 它开始写代码

听起来很完美。

但实际用下来,最大的问题是:没有评审。

需求文档出来之后,直接就给你 plan,中间没有”等人确认”这个环节。

你不知道它是不是理解错了你的需求,也不知道它给出的技术方案是不是最优的。

等你发现不对,代码已经写了一半。

二、国外工具缺了什么#

我对比了一下国外主流 AI 编码工具和国内实际开发流程:

环节OpenSpecSpecKitSuperPower国内实际流程
需求分析
需求评审⚠️(交互式确认)✅ 必须
架构设计
设计评审✅ 必须
代码生成
单元测试✅ 必须
代码评审✅ 必须
质量检测

你可以看到,国外工具在”生成”这个环节做得很好,但”评审”和”测试”基本缺失。

SuperPower 稍微好一点,它会一步步问你”要不要加这个功能”,但这种交互式确认不是正式评审。

正式评审是什么?

  • 需求评审:架构师、开发、产品一起看需求文档,补齐遗漏的点
  • 设计评审:技术负责人看数据库设计、接口设计,挑出潜在问题
  • 代码评审:同行看你的代码,指出不规范的地方

这些环节在国外工具里是空的。

三、为什么国内必须有评审#

国内软件开发有个特点:流程标准化程度高。

一个需求从提出到上线,至少要过三道评审:需求评审、设计评审、代码评审。

每一道评审都是为了降低返工成本

  • 需求没评好 → 开发做到一半发现理解错了 → 重写
  • 设计没评好 → 代码写完了发现架构有问题 → 重构
  • 测试没写好 → 上线后出 bug → 紧急修复

国外工具直接跳过这些环节,AI 自己闷头写,写完给你一个”看起来没问题”的代码。

但实际上,没经过评审的代码,就是一颗定时炸弹。

四、我自己做了一套#

因为受不了这种”假爽”,我自己做了个技能包:HAFW。

核心思路很简单:把评审环节加回去。

完整流程是这样的:

需求调研 → 需求评审 → 原型设计 → 架构设计 → 设计评审
→ 数据库设计 → 接口设计 → 任务拆分 → 开发
→ 单元测试 → 代码评审 → 质量检测 → 运维部署
plaintext

每一步都可以单独执行,也可以跳过。

比如你只想让它帮你写代码,可以直接从”开发”开始。

但如果你想做一个完整的项目,按流程走一遍,每一步都有评审。

五、和国外工具比,HAFW 强在哪#

维度OpenSpecHAFW
需求评审✅ 多角色模拟评审
设计评审✅ 架构师视角检查
单元测试✅ 自动生成测试用例
代码评审✅ 代码规范检查
语言英文中文
修改难度改英文文档直接改中文文档

不是说 HAFW 比 OpenSpec 强——单看代码生成质量,OpenSpec 可能更好。

但 HAFW 管了 OpenSpec 不管的事:评审、测试、流程管理。

六、适合什么人用#

如果你只是想快速做个原型,验证想法,OpenSpec 足够了。

但如果你要:

  • 做一个要上线的项目
  • 团队协作开发
  • 符合公司的开发流程规范

那评审环节是绕不过去的。

HAFW 就是把这块补上了。


国外工具好用,但别拿来当生产流水线。

至少,先把评审加上。

OpenSpec 很香,但代码跑不通
https://blog.halo26812.eu.org/blog/ai-coding-tools-missing-review
Author halo
Published at 2026年4月26日
版权声明 CC BY-NC-SA 4.0
Comment seems to stuck. Try to refresh?✨