← 全部模型按内存浏览

32 GB 内存最佳本地大模型

在 32 GB 总内存下,我们目录中的 73 个模型里有 62 个能以推荐的 4 位量化流畅运行。首选:Qwen 3.5 35B-A3B(下载体积 21.2 GB)。

正在读取您的硬件信号…

32 GB 能跑的全部模型

62 / 73 个模型
模型参数量下载体积(Q4)最低内存擅长领域
Qwen 3.5 35B-A3B35B (A3B)21.2 GB32 GB聊天, 推理, 编程, 视觉
Qwen 3.6 35B-A3B35B (A3B)21.2 GB32 GB聊天, 推理, 编程, 视觉
Command R 35B35B21.2 GB32 GB聊天
Qwen3-VL 32B33B20.0 GB32 GB视觉, 聊天, 推理
EXAONE 4.5 33B33B20.0 GB32 GB视觉, 推理, 聊天
Qwen 3 32B32.8B19.9 GB32 GB聊天, 推理
Qwen 2.5 Coder 32B32.8B19.9 GB32 GB编程
QwQ 32B32.8B19.9 GB32 GB推理
DeepSeek R1 32B32.8B19.9 GB32 GB推理
Granite 4.0 H Small32B (A9B)19.4 GB32 GB聊天, 编程
Nemotron 3 Nano 30B-A3B31.6B (A3.6B)19.2 GB32 GB聊天, 推理, 编程
Gemma 4 31B30.7B18.6 GB32 GB聊天, 编程, 推理, 视觉
Qwen 3 30B-A3B30.5B (A3.3B)18.5 GB32 GB聊天, 推理
Qwen3-VL 30B-A3B30B (A3B)18.2 GB32 GB视觉, 聊天, 推理
Gemma 3 27B27.4B16.6 GB24 GB聊天, 视觉
Qwen 3.5 27B27B16.4 GB24 GB聊天, 推理, 编程, 视觉
Qwen 3.6 27B27B16.4 GB24 GB聊天, 推理, 编程, 视觉
Gemma 4 26B A4B25.2B (A3.8B)15.3 GB24 GB聊天, 编程, 推理, 视觉
Mistral Small 3.1 24B24B14.6 GB24 GB聊天, 视觉
Devstral 24B24B14.6 GB24 GB编程
Magistral Small 1.224B14.6 GB24 GB推理, 聊天, 视觉
Devstral Small 2 24B24B14.6 GB24 GB编程, 聊天, 视觉
Codestral 22B22.2B13.5 GB24 GB编程
GPT-OSS 20B20.9B (A3.6B)12.7 GB24 GB聊天, 推理
Phi-4 Reasoning Vision 15B15B9.1 GB16 GB视觉, 推理
Qwen 3 14B14.8B9.0 GB16 GB聊天, 推理
DeepSeek R1 14B14.8B9.0 GB16 GB推理
Phi-4 14B14.7B8.9 GB16 GB聊天, 推理
Ministral 3 14B14B8.5 GB16 GB聊天, 视觉
OLMo 2 13B13.7B8.3 GB12 GB聊天
Gemma 3 12B12.2B7.4 GB12 GB聊天, 视觉
Mistral Nemo 12B12.2B7.4 GB12 GB聊天
Gemma 4 12B12B7.3 GB12 GB聊天, 编程, 推理, 视觉
Mellum 2 12B-A2.5B12B (A2.5B)7.3 GB12 GB编程
Qwen 3.5 9B9B5.5 GB12 GB聊天, 推理, 视觉
GLM-4.6V-Flash9B5.5 GB12 GB视觉, 聊天
Qwen 2.5 VL 7B8.3B5.0 GB8 GB视觉, 聊天
Qwen 3 8B8.2B5.0 GB8 GB聊天, 推理
Granite 3.3 8B8.2B5.0 GB8 GB聊天
Llama 3.1 8B8B4.9 GB8 GB聊天
DeepSeek R1 8B8B4.9 GB8 GB推理
Gemma 4 E4B8B (A4.5B)4.9 GB8 GB聊天, 视觉
Qwen3-VL 8B8B4.9 GB8 GB视觉, 聊天
Ministral 3 8B8B4.9 GB8 GB聊天, 视觉
Gemma 3n E4B7.8B (A4B)4.7 GB8 GB聊天, 视觉
Qwen 2.5 Coder 7B7.6B4.6 GB8 GB编程
DeepSeek R1 7B7.6B4.6 GB8 GB推理
Mistral 7B7.2B4.4 GB8 GB聊天
Gemma 4 E2B5.1B (A2.3B)3.1 GB6 GB聊天, 视觉
Gemma 3 4B4.3B2.6 GB6 GB聊天, 视觉
Qwen 3 4B4B2.4 GB6 GB聊天, 推理
Qwen 3.5 4B4B2.4 GB6 GB聊天, 视觉
Phi-4 Mini 3.8B3.8B2.3 GB6 GB聊天
Llama 3.2 3B3.2B1.9 GB4 GB聊天
DeepSeek-OCR3B (A0.57B)1.8 GB4 GB视觉
Ministral 3 3B3B1.8 GB4 GB聊天, 视觉
DeepSeek R1 1.5B1.8B1.1 GB3 GB推理
Qwen 3 1.7B1.7B1.0 GB3 GB聊天
SmolLM2 1.7B1.7B1.0 GB3 GB聊天
Llama 3.2 1B1.2B0.7 GB3 GB聊天
Gemma 3 1B1B0.6 GB3 GB聊天
Qwen 3 0.6B0.6B0.4 GB2 GB聊天

体积按 4 位(Q4_K_M)GGUF 版本计算 — 本地运行模型的标准格式。 · 数据更新于: 2026-06-11 · 这些数字是怎么算出来的 →

差一点就够 — 需要 64 GB

这些模型在 32 GB 下装不太下,但在上一档内存中可以运行。

查看 64 GB 档位 →

常见问题

32 GB 内存最佳本地大模型(2026)— 浏览器在线实测