先说结论#
上周跟同事聊 Claude Code,我问他用得怎么样,他回了我一句:“别提了,一个需求做下来,钱包瘦了三圈。”
我以为是夸张,结果他把后台用量截图发给我看——单次会话,token 消耗量直接破亿。这不是开玩笑,这是真金白银往外烧。
为什么 Claude Code 的 token 消耗这么离谱?#
1. Agent 循环:每一步都在烧钱#
Claude Code 不是一次问答就结束的工具。它是一个”代理”,你给一个需求,它会自己规划步骤、自己执行、自己检查结果、自己修正——循环往复,直到完成任务。
问题就出在这个”循环”上。每一次循环,就是一次完整的 API 调用。你让 Claude Code 改一个 bug,它可能:
- 先读一遍代码文件(输入 token)
- 分析问题(thinking token,可能比你的代码还长)
- 生成修改方案(输出 token)
- 写代码(输出 token)
- 验证结果(输入 token)
- 发现不对,修正(又是一轮)
一个看似简单的需求,实际触发了十几轮甚至几十轮循环。每轮循环少则几千 token,多则几万 token。积少成多,一个需求下来轻松破千万。
2. 上下文窗口的”甜蜜陷阱”#
Claude Code 的核心能力之一是”理解你整个项目”。它会读取大量代码文件来建立上下文,确保生成的代码和你的项目风格一致、不会破坏已有功能。
听起来很美好,但代价是:你的项目代码越多,每次读取的 token 就越多。一个中型项目,代码量几十 MB 扔进去,每次循环都要重新塞进上下文窗口。Claude 可不会只读相关文件——它倾向于读更多,以确保”安全”。
3. 思考 token:模型在自言自语#
Claude 的 Sonnet 和 Opus 模型有”扩展思考”能力(Extended Thinking),会在正式回答之前先进行大量推理思考。这个思考过程本身也消耗 token,而且往往比你的实际输入还长。
比如你让它写一个接口,它先花 2000 token 思考架构,再花 1500 token 思考边界情况,最后才输出 300 token 代码。思考 token 的单价和普通输出 token 一样贵,没有折扣。
4. Web Search:每次搜索都是钱#
Claude Code 可以联网搜索来获取信息。每次搜索加读取结果页面,都会产生 token 消耗。如果你的需求涉及查文档、找最佳实践、对接第三方 API,搜索次数一多,消耗非常可观。
5. 对话历史:越聊越重#
Claude Code 支持多轮对话。但问题是,每个新消息都会携带之前所有对话历史。你聊得越久,历史越长,每次请求携带的 token 就越多。
一个需求断断续续做了两天,对话历史积累了几百轮,这时候每次发送消息,光历史 token 就可能上万。
算一笔账:Claude Code 到底贵在哪?#
官方订阅 vs API 按量付费#
方式一:官方订阅(Claude Code Pro)
- 订阅费用:约 299 元/月(国内合租价),599 元/月(Max 版),999 元/月(Ultra 版)
- 包含一定额度的 Claude Sonnet 4.5 / Opus 4.6 用量
- 超出部分用订阅内额度抵扣
方式二:API 按量付费
直接调 Anthropic API,用多少付多少。价格透明,但如果没有用量意识,容易失控。
各大模型 API 价格对比#
以输入 100 万 token、输出 100 万 token 为例:
| 模型 | 输入/百万token | 输出/百万token | 100万+100万 | 编码能力 |
|---|---|---|---|---|
| Claude Sonnet 4.5 | $3 | $15 | 约$18(¥130) | ⭐⭐⭐⭐⭐ |
| Claude Opus 4.6 | $15 | $75 | 约$90(¥660) | ⭐⭐⭐⭐⭐ |
| DeepSeek Coder V3 | ¥1 | ¥2 | 约¥3 | ⭐⭐⭐⭐ |
| Qwen-Coder-Plus | ¥8 | ¥16 | 约¥24 | ⭐⭐⭐⭐ |
| Kimi Coder | ¥10 | ¥20 | 约¥30 | ⭐⭐⭐⭐ |
注:DeepSeek/Qwen/Kimi 价格参考阿里云百炼、硅基流动等平台公开定价(2026年4月);Anthropic 价格参考官方 API 定价页,1 USD ≈ 7.3 CNY。
实际消耗估算#
| 需求类型 | Claude Code 消耗 | API 费用 | DeepSeek 费用 |
|---|---|---|---|
| 简单 CRUD(~10轮) | ~500万 token | ~¥80 | ~¥2 |
| 中等复杂度页面(~30轮) | ~2000万 token | ~¥300 | ~¥10 |
| 高复杂度重构(~100轮) | ~8000万 token | ~¥1200 | ~¥40 |
这就是为什么同事说”几千万 token 没有了”——不是夸张,是真实消耗。
编码用哪个模型?我说实话#
预算优先:DeepSeek Coder V3#
DeepSeek Coder V3 的价格大概是 Claude Sonnet 的 1/50 ,这是真实差距。
优势:价格极低、中文支持好、部署灵活(可本地可云端)
劣势:复杂架构设计能力弱、复杂 bug 定位容易出错、长对话上下文保持不如 Claude
适合:简单脚本、辅助学习、中小项目(前提是你能接受反复修正的时间成本)
质量和效率优先:Claude Sonnet 4.5#
如果你是认真做产品开发,Claude Sonnet 4.5 是目前编码场景综合最强的模型。能力强、上下文保持好、生成代码质量高、复杂需求能一次做对。
用 DeepSeek 省的是钱,亏的是时间。用 Claude Sonnet 买的是效率。
建议策略:DeepSeek 做探索性任务(省钱),Claude Sonnet 做核心模块(保质量) 。
不差钱直接上:Claude Opus 4.6#
代码架构设计、复杂系统重构、多模块联调这种高难度任务,Opus 4.6 明显强于 Sonnet。但价格也是 Sonnet 的 5 倍。非重度开发者不用考虑。
怎么控制 Claude Code 的 token 消耗?#
说几个我试下来有用的方法:
1. 减少循环次数 :给需求时尽量一次性说清楚,不要让 Claude 反复确认。Prompt 写得好不好,直接决定循环轮数。
2. 控制上下文范围 :明确告诉 Claude”只看哪些文件”,不要让它自己扫描整个项目。一个大项目全量扫描一次,可能就烧掉几十万 token。
3. 分段交付 :不要把一个大需求一口气扔进去,拆成多个小需求分段完成。每个小需求上下文干净,总消耗反而更低。
4. 设置 token 上限 :Claude Code 支持设置每次请求的 token 限制,防止意外超支。
5. 简单任务换工具 :写个简单脚本、调个 API 接口这种小事,用 DeepSeek Coder 或者 Kimi Coder 就够了,没必要开 Claude Code。
Claude Code 是个好工具,贵有贵的道理。但如果你不知道它为什么贵,以及怎么控制消耗,那钱包瘦三圈真不是开玩笑。
你用 Claude Code 烧过最多的一次,用了多少? 评论区说说,我看看谁比我同事更狠。