halo 的技术博客

返回

先说结论#

上周跟同事聊 Claude Code,我问他用得怎么样,他回了我一句:“别提了,一个需求做下来,钱包瘦了三圈。”

我以为是夸张,结果他把后台用量截图发给我看——单次会话,token 消耗量直接破亿。这不是开玩笑,这是真金白银往外烧。

为什么 Claude Code 的 token 消耗这么离谱?#

1. Agent 循环:每一步都在烧钱#

Claude Code 不是一次问答就结束的工具。它是一个”代理”,你给一个需求,它会自己规划步骤、自己执行、自己检查结果、自己修正——循环往复,直到完成任务。

问题就出在这个”循环”上。每一次循环,就是一次完整的 API 调用。你让 Claude Code 改一个 bug,它可能:

  • 先读一遍代码文件(输入 token)
  • 分析问题(thinking token,可能比你的代码还长)
  • 生成修改方案(输出 token)
  • 写代码(输出 token)
  • 验证结果(输入 token)
  • 发现不对,修正(又是一轮)

一个看似简单的需求,实际触发了十几轮甚至几十轮循环。每轮循环少则几千 token,多则几万 token。积少成多,一个需求下来轻松破千万。

2. 上下文窗口的”甜蜜陷阱”#

Claude Code 的核心能力之一是”理解你整个项目”。它会读取大量代码文件来建立上下文,确保生成的代码和你的项目风格一致、不会破坏已有功能。

听起来很美好,但代价是:你的项目代码越多,每次读取的 token 就越多。一个中型项目,代码量几十 MB 扔进去,每次循环都要重新塞进上下文窗口。Claude 可不会只读相关文件——它倾向于读更多,以确保”安全”。

3. 思考 token:模型在自言自语#

Claude 的 Sonnet 和 Opus 模型有”扩展思考”能力(Extended Thinking),会在正式回答之前先进行大量推理思考。这个思考过程本身也消耗 token,而且往往比你的实际输入还长。

比如你让它写一个接口,它先花 2000 token 思考架构,再花 1500 token 思考边界情况,最后才输出 300 token 代码。思考 token 的单价和普通输出 token 一样贵,没有折扣。

4. Web Search:每次搜索都是钱#

Claude Code 可以联网搜索来获取信息。每次搜索加读取结果页面,都会产生 token 消耗。如果你的需求涉及查文档、找最佳实践、对接第三方 API,搜索次数一多,消耗非常可观。

5. 对话历史:越聊越重#

Claude Code 支持多轮对话。但问题是,每个新消息都会携带之前所有对话历史。你聊得越久,历史越长,每次请求携带的 token 就越多。

一个需求断断续续做了两天,对话历史积累了几百轮,这时候每次发送消息,光历史 token 就可能上万。

算一笔账:Claude Code 到底贵在哪?#

官方订阅 vs API 按量付费#

方式一:官方订阅(Claude Code Pro)

  • 订阅费用:约 299 元/月(国内合租价),599 元/月(Max 版),999 元/月(Ultra 版)
  • 包含一定额度的 Claude Sonnet 4.5 / Opus 4.6 用量
  • 超出部分用订阅内额度抵扣

方式二:API 按量付费
直接调 Anthropic API,用多少付多少。价格透明,但如果没有用量意识,容易失控。

各大模型 API 价格对比#

以输入 100 万 token、输出 100 万 token 为例:

模型输入/百万token输出/百万token100万+100万编码能力
Claude Sonnet 4.5$3$15约$18(¥130)⭐⭐⭐⭐⭐
Claude Opus 4.6$15$75约$90(¥660)⭐⭐⭐⭐⭐
DeepSeek Coder V3¥1¥2约¥3⭐⭐⭐⭐
Qwen-Coder-Plus¥8¥16约¥24⭐⭐⭐⭐
Kimi Coder¥10¥20约¥30⭐⭐⭐⭐

注:DeepSeek/Qwen/Kimi 价格参考阿里云百炼、硅基流动等平台公开定价(2026年4月);Anthropic 价格参考官方 API 定价页,1 USD ≈ 7.3 CNY。

实际消耗估算#

需求类型Claude Code 消耗API 费用DeepSeek 费用
简单 CRUD(~10轮)~500万 token~¥80~¥2
中等复杂度页面(~30轮)~2000万 token~¥300~¥10
高复杂度重构(~100轮)~8000万 token~¥1200~¥40

这就是为什么同事说”几千万 token 没有了”——不是夸张,是真实消耗。

编码用哪个模型?我说实话#

预算优先:DeepSeek Coder V3#

DeepSeek Coder V3 的价格大概是 Claude Sonnet 的 1/50 ,这是真实差距。

优势:价格极低、中文支持好、部署灵活(可本地可云端)
劣势:复杂架构设计能力弱、复杂 bug 定位容易出错、长对话上下文保持不如 Claude

适合:简单脚本、辅助学习、中小项目(前提是你能接受反复修正的时间成本)

质量和效率优先:Claude Sonnet 4.5#

如果你是认真做产品开发,Claude Sonnet 4.5 是目前编码场景综合最强的模型。能力强、上下文保持好、生成代码质量高、复杂需求能一次做对。

用 DeepSeek 省的是钱,亏的是时间。用 Claude Sonnet 买的是效率。

建议策略:DeepSeek 做探索性任务(省钱),Claude Sonnet 做核心模块(保质量)

不差钱直接上:Claude Opus 4.6#

代码架构设计、复杂系统重构、多模块联调这种高难度任务,Opus 4.6 明显强于 Sonnet。但价格也是 Sonnet 的 5 倍。非重度开发者不用考虑。

怎么控制 Claude Code 的 token 消耗?#

说几个我试下来有用的方法:

1. 减少循环次数 :给需求时尽量一次性说清楚,不要让 Claude 反复确认。Prompt 写得好不好,直接决定循环轮数。

2. 控制上下文范围 :明确告诉 Claude”只看哪些文件”,不要让它自己扫描整个项目。一个大项目全量扫描一次,可能就烧掉几十万 token。

3. 分段交付 :不要把一个大需求一口气扔进去,拆成多个小需求分段完成。每个小需求上下文干净,总消耗反而更低。

4. 设置 token 上限 :Claude Code 支持设置每次请求的 token 限制,防止意外超支。

5. 简单任务换工具 :写个简单脚本、调个 API 接口这种小事,用 DeepSeek Coder 或者 Kimi Coder 就够了,没必要开 Claude Code。


Claude Code 是个好工具,贵有贵的道理。但如果你不知道它为什么贵,以及怎么控制消耗,那钱包瘦三圈真不是开玩笑。

你用 Claude Code 烧过最多的一次,用了多少? 评论区说说,我看看谁比我同事更狠。

Claude Code Token 烧钱实录:一个需求下来,几千万 token 是怎么没的?
https://blog.halo26812.eu.org/blog/claude-code-token-cost-analysis
Author halo
Published at 2026年4月15日
版权声明 CC BY-NC-SA 4.0
Comment seems to stuck. Try to refresh?✨