32 GB 内存最好的本地大模型是哪个？

Qwen 3.5 35B-A3B 是能在 32 GB 内存下流畅运行的最强全能模型 — 推荐的 4 位量化下载体积为 21.2 GB。编程方面首选 Qwen 3.5 35B-A3B。

32 GB 内存的电脑能跑多少个大模型？

我们目录中的 73 个开源权重模型里，有 62 个能在 32 GB 总内存下以 4 位量化流畅运行，还能给操作系统和 KV 缓存留出余量。

能把更大的模型塞进 32 GB 吗？

有时可以 — 2–3 位量化能装下更大的模型，但低于 Q3 后质量会急剧下降。Q4_K_M 的小模型通常胜过被硬压到 Q2 的大模型。

有 GPU 的话这些数字会变吗？

能不能跑取决于内存而非算力。在 PC 上，模型必须装进显存才能完全在 GPU 上运行；否则会从系统内存用 CPU 运行，只是更慢。在 Apple Silicon 上，内存和显存是同一个统一内存池。

你们怎么知道 32 GB 能装下什么？

我们根据参数量估算 4 位下载体积（参数 × 4.85 ÷ 8），加上 25% 的运行时开销和操作系统的 1.5 GB，再向上取整到标准内存规格。完整公式见我们的方法说明页。

← 全部模型按内存浏览

32 GB 内存最佳本地大模型

在 32 GB 总内存下，我们目录中的 73 个模型里有 62 个能以推荐的 4 位量化流畅运行。首选：Qwen 3.5 35B-A3B（下载体积 21.2 GB）。

正在读取您的硬件信号…

32 GB 能跑的全部模型

62 / 73 个模型

模型	参数量	下载体积（Q4）	最低内存	擅长领域
Qwen 3.5 35B-A3BAlibaba	35B (A3B)	21.2 GB	32 GB	聊天, 推理, 编程, 视觉
Qwen 3.6 35B-A3BAlibaba	35B (A3B)	21.2 GB	32 GB	聊天, 推理, 编程, 视觉
Command R 35BCohere	35B	21.2 GB	32 GB	聊天
Qwen3-VL 32BAlibaba	33B	20.0 GB	32 GB	视觉, 聊天, 推理
EXAONE 4.5 33BLG AI Research	33B	20.0 GB	32 GB	视觉, 推理, 聊天
Qwen 3 32BAlibaba	32.8B	19.9 GB	32 GB	聊天, 推理
Qwen 2.5 Coder 32BAlibaba	32.8B	19.9 GB	32 GB	编程
QwQ 32BAlibaba	32.8B	19.9 GB	32 GB	推理
DeepSeek R1 32BDeepSeek	32.8B	19.9 GB	32 GB	推理
Granite 4.0 H SmallIBM	32B (A9B)	19.4 GB	32 GB	聊天, 编程
Nemotron 3 Nano 30B-A3BNVIDIA	31.6B (A3.6B)	19.2 GB	32 GB	聊天, 推理, 编程
Gemma 4 31BGoogle	30.7B	18.6 GB	32 GB	聊天, 编程, 推理, 视觉
Qwen 3 30B-A3BAlibaba	30.5B (A3.3B)	18.5 GB	32 GB	聊天, 推理
Qwen3-VL 30B-A3BAlibaba	30B (A3B)	18.2 GB	32 GB	视觉, 聊天, 推理
Gemma 3 27BGoogle	27.4B	16.6 GB	24 GB	聊天, 视觉
Qwen 3.5 27BAlibaba	27B	16.4 GB	24 GB	聊天, 推理, 编程, 视觉
Qwen 3.6 27BAlibaba	27B	16.4 GB	24 GB	聊天, 推理, 编程, 视觉
Gemma 4 26B A4BGoogle	25.2B (A3.8B)	15.3 GB	24 GB	聊天, 编程, 推理, 视觉
Mistral Small 3.1 24BMistral AI	24B	14.6 GB	24 GB	聊天, 视觉
Devstral 24BMistral AI	24B	14.6 GB	24 GB	编程
Magistral Small 1.2Mistral AI	24B	14.6 GB	24 GB	推理, 聊天, 视觉
Devstral Small 2 24BMistral AI	24B	14.6 GB	24 GB	编程, 聊天, 视觉
Codestral 22BMistral AI	22.2B	13.5 GB	24 GB	编程
GPT-OSS 20BOpenAI	20.9B (A3.6B)	12.7 GB	24 GB	聊天, 推理
Phi-4 Reasoning Vision 15BMicrosoft	15B	9.1 GB	16 GB	视觉, 推理
Qwen 3 14BAlibaba	14.8B	9.0 GB	16 GB	聊天, 推理
DeepSeek R1 14BDeepSeek	14.8B	9.0 GB	16 GB	推理
Phi-4 14BMicrosoft	14.7B	8.9 GB	16 GB	聊天, 推理
Ministral 3 14BMistral AI	14B	8.5 GB	16 GB	聊天, 视觉
OLMo 2 13BAi2	13.7B	8.3 GB	12 GB	聊天
Gemma 3 12BGoogle	12.2B	7.4 GB	12 GB	聊天, 视觉
Mistral Nemo 12BMistral AI	12.2B	7.4 GB	12 GB	聊天
Gemma 4 12BGoogle	12B	7.3 GB	12 GB	聊天, 编程, 推理, 视觉
Mellum 2 12B-A2.5BJetBrains	12B (A2.5B)	7.3 GB	12 GB	编程
Qwen 3.5 9BAlibaba	9B	5.5 GB	12 GB	聊天, 推理, 视觉
GLM-4.6V-FlashZ.ai	9B	5.5 GB	12 GB	视觉, 聊天
Qwen 2.5 VL 7BAlibaba	8.3B	5.0 GB	8 GB	视觉, 聊天
Qwen 3 8BAlibaba	8.2B	5.0 GB	8 GB	聊天, 推理
Granite 3.3 8BIBM	8.2B	5.0 GB	8 GB	聊天
Llama 3.1 8BMeta	8B	4.9 GB	8 GB	聊天
DeepSeek R1 8BDeepSeek	8B	4.9 GB	8 GB	推理
Gemma 4 E4BGoogle	8B (A4.5B)	4.9 GB	8 GB	聊天, 视觉
Qwen3-VL 8BAlibaba	8B	4.9 GB	8 GB	视觉, 聊天
Ministral 3 8BMistral AI	8B	4.9 GB	8 GB	聊天, 视觉
Gemma 3n E4BGoogle	7.8B (A4B)	4.7 GB	8 GB	聊天, 视觉
Qwen 2.5 Coder 7BAlibaba	7.6B	4.6 GB	8 GB	编程
DeepSeek R1 7BDeepSeek	7.6B	4.6 GB	8 GB	推理
Mistral 7BMistral AI	7.2B	4.4 GB	8 GB	聊天
Gemma 4 E2BGoogle	5.1B (A2.3B)	3.1 GB	6 GB	聊天, 视觉
Gemma 3 4BGoogle	4.3B	2.6 GB	6 GB	聊天, 视觉
Qwen 3 4BAlibaba	4B	2.4 GB	6 GB	聊天, 推理
Qwen 3.5 4BAlibaba	4B	2.4 GB	6 GB	聊天, 视觉
Phi-4 Mini 3.8BMicrosoft	3.8B	2.3 GB	6 GB	聊天
Llama 3.2 3BMeta	3.2B	1.9 GB	4 GB	聊天
DeepSeek-OCRDeepSeek	3B (A0.57B)	1.8 GB	4 GB	视觉
Ministral 3 3BMistral AI	3B	1.8 GB	4 GB	聊天, 视觉
DeepSeek R1 1.5BDeepSeek	1.8B	1.1 GB	3 GB	推理
Qwen 3 1.7BAlibaba	1.7B	1.0 GB	3 GB	聊天
SmolLM2 1.7BHugging Face	1.7B	1.0 GB	3 GB	聊天
Llama 3.2 1BMeta	1.2B	0.7 GB	3 GB	聊天
Gemma 3 1BGoogle	1B	0.6 GB	3 GB	聊天
Qwen 3 0.6BAlibaba	0.6B	0.4 GB	2 GB	聊天

体积按 4 位（Q4_K_M）GGUF 版本计算 — 本地运行模型的标准格式。 · 数据更新于: 2026-06-11 · 这些数字是怎么算出来的 →

差一点就够 — 需要 64 GB

这些模型在 32 GB 下装不太下，但在上一档内存中可以运行。

Llama 3.1 70B · 64 GB Llama 3.3 70B · 64 GB DeepSeek R1 70B · 64 GB Qwen3-Next 80B-A3B · 64 GB Qwen3 Coder Next 80B-A3B · 64 GB

查看 64 GB 档位 →

常见问题

按内存浏览

8 GB 内存最佳大模型

26 个模型可流畅运行

查看配置要求 →

16 GB 内存最佳大模型

38 个模型可流畅运行

查看配置要求 →

64 GB 内存最佳大模型

67 个模型可流畅运行

查看配置要求 →