显卡GPURTXAI推理深度学习硬件评测30904090
⚠️ 价格提醒 :本文价格为2026年4月实测时的二手市场参考价。二手显卡价格波动大,特别是成色好的非矿卡,实际成交价可能高出1000-2000元。4090因显存改装需求旺盛,成色好的非矿卡可能要比文中价格高出1万左右。购买前请务必查询最新行情。
先说结论:如果你现在想买卡跑AI,二手RTX 3090依然是性价比之王。但要注意散热问题。4090很强,而且可以改48GB显存,但价格贵得离谱。
显卡圈有个老梗:“买显卡跑AI,看了三天评测还是不知道选哪张。”
参数表一堆TOPS、GB/s、W,一到实战就发现——显存不够直接OOM,跑两步就过热降频,二手价格还一天一个样。
我手头有3060、3080、3090、3090 Ti、4090,借朋友的8000 Ada测了一周。说点实在的。
一、先看实测数据#

我用llama.cpp跑了Llama 2 7B和13B模型,Q4量化,批量大小1,测的是纯推理速度(tokens/second):
| 显卡 | 显存 | 7B Q4 | 13B Q4 | 功耗 | 二手价 |
|---|---|---|---|---|---|
| RTX 3060 12GB | 12GB | 28 | OOM | 170W | ¥1,200 |
| RTX 3080 10GB | 10GB | 32 | OOM | 320W | ¥1,800 |
| RTX 3080 20GB | 20GB | 35 | 18 | 350W | ¥3,000 |
| RTX 3090 | 24GB | 42 | 28 | 350W | ¥4,500 |
| RTX 3090 Ti | 24GB | 48 | 32 | 450W | ¥5,500 |
| RTX 4090 | 24GB | 65 | 45 | 450W | ¥8,500 |
| RTX 8000 Ada | 48GB | 72 | 52 | 300W | ¥35,000+ |
几个关键发现:
1. 显存是硬门槛,不是软指标
3080只有10GB,7B模型用Q4量化加载需要约8GB,看起来够用?但实际跑起来,KV缓存还要占2-3GB,稍微复杂点的prompt就OOM。RTX 3080有20GB版本 (专业挖矿型号,市面上能找到),比10GB版多一倍显存,13B模型能跑到18 tok/s,值得关注,但价格也要3000左右。
3090的24GB才真正够用,13B模型能跑到28 tok/s,而3080 Ti虽然也是12GB,但13B只能跑到18 tok/s而且经常爆显存。
2. 4090比3090快55%,TOPS参数却只高出30%
NVIDIA官方算力:4090是1321 TOPS,3090是1013 TOPS——看起来强30%。
但实际跑7B模型,4090是65 tok/s,3090是42 tok/s——实际快55%。
这个差距来自架构代差:Ada架构的第四代Tensor Core效率比Ampere高很多,缓存设计也更好,虽然显存带宽只高了8%,但大模型推理更吃算力单元效率,所以实际差距比理论算力比值更大。
读参数表别只看TOPS数字,架构代差影响很大。
3. 8000 Ada的48GB是分水岭,但普通人用不上
70B Q4模型理论上可以跑起来(需要约40GB显存),3090/4090都做不到。但8000 Ada的价格是3090的8倍,速度只快70%。除非你是企业用户或者不差钱的专业玩家,否则没必要。
二、性能背后的真相:为什么TOPS不重要#
NVIDIA官方给的INT8算力:
- RTX 3090: ~1,013 TOPS
- RTX 4090: ~1,321 TOPS
- RTX 8000 Ada: ~1,800 TOPS
4090比3090强30%的算力,但实际跑7B模型快55%。显存带宽才是瓶颈 ,不是算力。
4090的显存带宽是1,008 GB/s,3090是936 GB/s,只高8%。但Ada架构的第四代Tensor Core效率比Ampere高很多,再加上更好的缓存设计,实际性能提升远超理论算力差距。
这也是为什么3060虽然算力只有3090的1/4,但7B模型速度能达到3090的2/3——因为显存带宽瓶颈没那么严重,小模型主要吃算力。
三、功耗和电费:长期运行的隐形成本#
很多人只看显卡价格,忽略了电费。
假设你每天跑8小时推理:
- 3060 (170W): 每天1.36度电,一年约500度,电费¥300
- 3090 (350W): 每天2.8度电,一年约1022度,电费¥600
- 4090 (450W): 每天3.6度电,一年约1314度,电费¥800
差距不大,但如果跑24×7:
- 3060: 年电费¥900
- 3090: 年电费¥1800
- 4090: 年电费¥2400
8000 Ada的优势在这里体现出来了 :300W功耗,性能比4090强10%,功耗低33%。长期跑大模型,电费能省不少。但前提是你买得起那张卡。
四、我的选卡建议(2026年4月版)#
预算¥1500以内:RTX 3060 12GB#
适合谁 :纯新手,想试试本地跑AI是什么感觉
能跑什么 :3B-7B模型,Q4量化,28 tok/s够用。感受一下够用,但别指望跑生产环境。
避坑 :别买3060 8GB版本,显存差4GB就是能用和不能用的区别。一定要确认是12GB版。
预算¥3000以内:二手RTX 3080 20GB#
适合谁 :预算有限但需要比3060更强性能
为什么选它 :显存比10GB版多一倍,13B模型能跑,功耗和3090一样,价格却便宜很多。是3080系列里最值得买的版本。
避坑 :优先找个人闲置,20GB版本多为专业挖矿型号,注意检查散热健康度。
预算¥5000以内:二手RTX 3090(性价比之王)#
适合谁 :想正经跑AI,但预算有限
为什么选它 :
- 24GB显存是刚需门槛,13B模型能跑,7B模型能同时跑多个
- 二手市场成熟,4500左右能买到成色不错的
- 比3080 Ti贵2000,但显存多一倍,性能强20%,完全值得
⚠️ 重要避坑:显存温度问题
3090采用双面显存设计,背面显存没有主动散热。长期跑AI推理时背面显存温度容易过热(90°C+),可能导致降频或不稳定。
解决方案:
- 选择带原厂背板散热的型号
- 自己加装显存散热片(成本约¥50)
- 或者直接选3090 Ti ——单面显存,散热更稳,同样24GB,价格相近
预算¥10000以内:RTX 4090#
适合谁 :不差钱,追求单卡最强性能
优势 :
- 7B模型65 tok/s,比3090快55%
- 13B模型45 tok/s,接近8000 Ada的90%
- 功耗和3090 Ti一样,性能强35%
- 💡 可以改48GB显存 :4090改48GB的商家现在已经非常多 ,技术非常成熟 ,某宝搜索”4090改48G”能找到十几家在做。改装后可以跑70B Q4模型(原装24GB跑不了),性价比远超8000 Ada。但改装会失去官方保修,找口碑好的商家。
缺点 :
- 价格还是贵,新卡一万出头,二手也要8500起步
- 当前市场非矿卡普遍要加1000-2000 ,4090成色好的加1万也不稀奇
- RTX 5090出了之后会降价,但还不知道等多久
- 450W功耗对电源要求高,至少需要850W金牌电源
预算¥15000+:RTX 8000 Ada 或 租云GPU#
适合谁 :企业用户、专业开发者、不差钱的极客
8000 Ada的优势 :
- 48GB ECC显存,70B Q4模型能跑
- 300W功耗,长期运行电费省
- 专业级Tensor Core,支持FP8精度
但我的建议是:先租云GPU试试
阿里云/腾讯云A100每小时¥8-12,8000 Ada的性能大概是A100的70%。如果你不是7×24小时跑模型,租云比买卡划算得多。
算笔账:
- 买8000 Ada:¥35,000 + 电费¥2000/年
- 租A100:每天跑8小时,一年¥35,000正好够租一年
除非你确实需要本地部署(数据隐私、网络延迟),否则云GPU更灵活。
五、几个常见误区#
“TOPS越高跑AI越快” — 错了。显存容量和带宽才是瓶颈。大模型推理不像打游戏,显存不够直接跑不了,TOPS再高也没用。
“3090 Ti比4090强因为显存一样” — 错了。4090的Ada架构比3090 Ti的Ampere新两代,Tensor Core效率更高,带宽也高约8%,实际跑模型快一大截。
“3080 Ti性价比比3090高” — 错了。显存少12GB,TOPS低,但功耗相近。同样的钱,不如买3090。
“买新不买旧,等5090” — 看情况。5090预计2026年下半年发布,性能可能比4090强50%,但价格也会更贵。如果你现在就需要用,3090/4090不会亏。
六、最终建议#
| 预算 | 推荐 | 理由 |
|---|---|---|
| ¥1500 | RTX 3060 12GB | 入门体验,门槛低 |
| ¥3000 | RTX 3080 20GB | 性价比高,13B能跑 |
| ¥5000 | 二手RTX 3090 | 性价比之王 ,24GB显存刚需 |
| ¥10000 | RTX 4090 | 单卡最强,不差钱就上 |
| ¥15000+ | 租云GPU / 8000 Ada | 除非必须本地,否则租云更划算 |
我的选择 :主力机用3090跑13B模型(加装了显存散热片),备用机用3060跑7B轻量任务。4090等价格降到7000以内再考虑,或者直接改48GB跑大模型。
你现在的显卡是什么?跑AI遇到过哪些坑?评论区聊聊。
数据来源:llama.cpp实测、NVIDIA官方规格、二手市场价格(2026年4月,价格仅供参考,以实际成交为准)
感谢评论区反馈:3080 20GB版本、4090 48G改装技术成熟度、当前市场价格、非矿卡加价情况、3090 vs 3090 Ti散热稳定性、TOPS表达歧义