随笔
上篇文章发了之后,有评论说”为什么不拿 Mac Studio M5 Max 来比”——这个问题很好,顺势逼我把这几代 Mac Studio 在 128GB 以上统一内存的配置全部捋一遍。
因为这个话题本质上是:Apple 统一内存这条路线,到底哪一代才真正适合跑大模型?
先说清楚哪些 Mac Studio 在讨论范围内#
Mac Studio 不是每一代都有 128GB 以上的版本。Max 系列上限低,Ultra 系列上限高,分清楚:
| 代数 | 芯片 | 128GB+ 配置? | 最大统一内存 |
|---|---|---|---|
| M1 | Max | ❌ | 64GB |
| M1 | Ultra | ✅ | 128GB |
| M2 | Max | ❌ | 96GB |
| M2 | Ultra | ✅ | 128GB / 192GB |
| M3 | Max | ✅ | 128GB |
| M3 | Ultra | ✅ | 256GB / 512GB |
| M4 | Max | ✅ | 128GB |
| M5 | Max | ✅ | 128GB(MacBook Pro) |
所以真正有资格上桌的,只有这几款:M1 Ultra 128GB、M2 Ultra 128GB / 192GB、M3 Max 128GB、M3 Ultra 256GB / 512GB、M4 Max 128GB、M5 Max 128GB 。
参数横向对比(128GB 以上配置)#
| 芯片 | 最大内存 | 内存带宽 | Neural Engine | GPU | 适合跑多大模型 |
|---|---|---|---|---|---|
| M1 Ultra 128GB | 128GB | ~410 GB/s | 32核 | 64核 | 65B Q4 |
| M2 Ultra 128GB | 128GB | ~800 GB/s | 32核 | 60核 | 65B Q4 |
| M2 Ultra 192GB | 192GB | ~800 GB/s | 32核 | 76核 | 103B Q4 |
| M3 Max 128GB | 128GB | ~546 GB/s | 16核 | 40核 | 70B Q4 |
| M3 Ultra 256GB | 256GB | 819 GB/s | 32核 | 80核 | 180B Q4 |
| M3 Ultra 512GB | 512GB | 819 GB/s | 32核 | 80核 | 671B 满血 R1 |
| M4 Max 128GB | 128GB | 546 GB/s | 16核 | 40核 | 70B Q4 |
| M5 Max 128GB(32核GPU) | 128GB | 460 GB/s | 16核 | 32核 | 70B Q4 |
| M5 Max 128GB(40核GPU) | 128GB | 614 GB/s | 16核 | 40核 | 70B Q4 |
几个关键说明:
- M3 Ultra 的带宽 819 GB/s 是 8 通道 LPDDR5X 带来的,无论 256GB 还是 512GB 都是这个数,不缩水。
- M5 Max 128GB 有两个版本:32核 GPU(460 GB/s)和 40核 GPU(614 GB/s),带宽差异明显,选购时要注意。32核 GPU 理论上可以配 128GB,但目前苹果官网 32核版本暂不开放 128GB 选配,只在 40核 GPU 版本可选。
- Neural Engine 核数:Ultra 是 32 核,Max 是 16 核,这个差距在大模型推理时比数字看起来更大。
- M2 Ultra 的带宽数据参考了当时业界估算,如有更精确的官方数据欢迎指正。
M5 Max 两个 GPU 版本怎么选?#
M5 Max 有两个 GPU 版本,选哪个差别不小:
| 版本 | GPU | 内存上限 | 带宽 | 128GB 可选? |
|---|---|---|---|---|
| M5 Max 32核 | 32核 | 64GB(官网) | 460 GB/s | 理论上可配,官网暂不开放 |
| M5 Max 40核 | 40核 | 128GB | 614 GB/s | ✅ 官网可选 |
所以如果你要的是 128GB 统一内存的 M5 Max,目前只有 40核 GPU 版本这一个官方可选的选项 。
40核版本比 32核版本带宽高出 154 GB/s(+34%),GPU 核心多 8 核(+25%),性价比明显更好。32核版本更适合不需要那么大内存、预算有限的场景。
对比其他代:
- M4 Max 128GB:546 GB/s
- M5 Max 128GB(40核):614 GB/s → 比 M4 Max 快了约 12%
- M5 Max 128GB(32核):460 GB/s → 比 M4 Max 慢了约 16%
各代实际能跑多大模型?#
拿几个主流开源模型实测数据做参考(Q4 量化,非官方,综合多个来源):
| 芯片 | 7B Q4 | 13B Q4 | 33B Q4 | 70B Q4 | 180B Q4 | 671B |
|---|---|---|---|---|---|---|
| M1 Ultra 128GB | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| M2 Ultra 128GB | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| M2 Ultra 192GB | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ |
| M3 Max 128GB | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ |
| M3 Ultra 256GB | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ |
| M3 Ultra 512GB | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| M4 Max 128GB | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ |
| M5 Max 128GB(32核) | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ |
| M5 Max 128GB(40核) | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ |
粗略估算:128GB 能跑 70B Q4,192GB 能跑 103B Q4,256GB 能跑 180B Q4,512GB 才能上 671B 满血 R1。
内存容量是硬限制,带宽决定速度,两者缺一不可。
M3 Ultra 512GB 为什么值得专门说?#
因为它是目前 Apple 统一内存路线上,唯一一个能跑 671B 满血模型的消费级桌面设备 。
隔壁的 M5 Max 128GB 带宽更高(40核版本 614 GB/s)、芯片更新,但内存只有 128GB——671B 塞都塞不进去。
Apple 在 M3 Ultra 上用 UltraFusion 把两颗 M3 Max 拼起来,8 通道 819 GB/s,直接把统一内存容量推到了 512GB。这个策略 M5 Ultra 会不会继续?现在还不好说。
选哪一代?需求说了算#
预算优先,只跑 70B 以内: M4 Max 128GB,2026 年买最划算,新芯片性能最强,Ollama、LM Studio 生态完善。
性价比最高: M3 Ultra 256GB,内存够大(180B),带宽够高(819 GB/s),价格比 M3 Ultra 512GB 便宜一大截,671B 跑不了但够用了。
追求天花板: M3 Ultra 512GB,671B 满血 R1,这是 Apple 桌面统一内存的天花板,M5 系列还没追上这个配置。
预算有限,尝鲜为主: M2 Ultra 128GB,二手市场价格已经下来了,128GB 跑 65B Q4,够研究用。
M5 Max: 暂时只有 MacBook Pro 版本,Mac Studio 还没上。如果你不着急,等 M5 Mac Studio 更新后再买是合理的——如果选了 M5 Max,目前官方可选 128GB 的只有 40核 GPU 版本,带宽 614 GB/s,32核版本暂不开放 128GB 选配。
一句话总结#
Apple 统一内存这条路线,M1 Ultra 打开了 128GB 的门,M2 Ultra 翻倍到 192GB,M3 Ultra 直接推到 512GB——每一代的提升都是实打实的内存容量,不是跑分。
对于大模型本地部署:买你能买得起的最大内存 ,带宽差一点在日常推理里感知不强,但内存不够是真的跑不动。