halo 的技术博客

返回

显卡圈有个老梗:“买显卡跑AI,看了三天评测还是不知道选哪张。”

参数表一堆TOPS、GB/s、W,一到实战就发现——显存不够直接OOM,跑两步就过热降频,二手价格还一天一个样。

我用过3090跑7B模型,也用4090跑过13B,说点实在的。

先说结论(省时间)#

显卡显存能跑什么适合谁
RTX 306012GB3B-7B(INT4/Q4)玩玩试试,新手
RTX 308010GB3B-7B(勉强)显存太小,不推荐
RTX 3080 Ti12GB7B(INT4勉强)不上不下,尴尬
RTX 309024GB7B-13B(Q4/Q8)性价比高,二手
RTX 3090 Ti24GB7B-13B(更稳)比3090强但贵
RTX 409024GB7B-30B(Q4/Q8)单卡最强
RTX 8000 Ada48GB7B-70B+(Q4/Q8)专业用户

一句话:7B以下随便玩,13B以上看显存,没有万能答案。

核心参数对比#

说几个关键指标:

显存容量 — 这是最最重要的。

RTX 3080 只有10GB,3080 Ti 加到12GB,看着够用了?实际跑起来,13B模型用Q4量化加载需要14-16GB显存,3080直接报OOM。3090的24GB才真正够用。

RTX 4090 虽然是24GB,但带宽比3090高约8%(1,008 vs 936 GB/s),加上Ada架构第四代Tensor Core效率更高,跑相同模型速度快一大截。

RTX 8000 Ada 48GB 是个分水岭——70B Q4模型理论上可以跑起来,3090/4090都做不到。

Tensor TOPS — 参考,别迷信。

NVIDIA官方给的INT8算力:

  • RTX 3090: ~1,013 TOPS
  • RTX 3090 Ti: ~1,140 TOPS
  • RTX 4090: ~1,321 TOPS
  • RTX 8000 Ada: ~1,800 TOPS

但TOPS只是理论峰值。实测跑LLM推理时,显存带宽才是瓶颈 ,不是算力。

这也是为什么4090比3090快那么多——不是因为算力高30%,而是因为Ada架构第四代Tensor Core效率更高,带宽也高约8%,模型加载和KV缓存都更顺畅。

功耗 — 容易被忽略。

3090 Ti和4090都是450W,需要配好电源。3090是350W,门槛低一些。3060只要170W,普通电源就能带。

电费也是成本。跑一个7B模型推理8小时,3060电费几毛钱,4090要三四块——差距不大,但如果跑24小时长期推理就有感觉了。

选卡建议#

预算有限,想试试 — RTX 3060 12GB#

够玩,门槛最低。3B-7B模型用INT4量化能跑,感受一下够用。别指望跑13B,那不是它该干的事。

性价比之选 — RTX 3090 二手#

24GB显存是刚需,3090的性价比在二手市场。2026年了,一台成色好的3090大概三四千块,比3080 Ti强太多,比4090便宜一半。

但注意避坑: 矿卡。2021-2022年ETH挖矿高峰期的卡,显存和核心都有暗伤。买之前看清楚保修,最好找个人闲置。

单卡最强 — RTX 4090#

不差钱就4090。性能比3090 Ti强,功耗相近,24GB够跑大多数模型。

缺点:价格还是贵,新卡一万出头,二手也要七八千。RTX 5090出了之后会降价,但还不知道等多久。

专业用户 — RTX 8000 Ada#

这个卡不是给普通玩家准备的。48GB ECC显存,专业级Tensor Core,支持FP8精度,300W功耗——买它的要么是企业,要么是不缺钱的专业用户。

普通玩家,4090够用,没必要上8000 Ada。

几个常见误区#

“TOPS越高跑AI越快” — 错了。显存容量和带宽才是瓶颈。大模型推理不像打游戏,显存不够直接跑不了,TOPS再高也没用。

“3090 Ti比4090强因为显存一样” — 错了。4090的Ada架构比3090 Ti的Ampere新两代,Tensor Core效率更高,带宽也高约8%,实际跑模型快一大截。

“3080 Ti性价比比3090高” — 错了。显存少12GB,TOPS低,但功耗相近。同样的钱,不如买3090。

我的判断#

如果你现在要买:

  • 3000以内 :找成色好的二手3090,别买3080 Ti
  • 6000-10000 :4090,一分钱一分货
  • 15000+ :8000 Ada,或者干脆租GPU云

纯玩7B模型,3060够;想跑13B,至少3090;30B以上,单卡不够,得多卡或者上云。

参数来源:NVIDIA官方规格、MLCommons benchmark实测

RTX 3060 到 RTX 8000 Ada,AI 推理到底差多少?
https://blog.halo26812.eu.org/blog/rtx-ai-gpu-comparison
Author halo
Published at 2026年4月11日
版权声明 CC BY-NC-SA 4.0
Comment seems to stuck. Try to refresh?✨