← Todos os modelosNAVEGAR POR RAM

Melhores LLMs locais para 32 GB de RAM

Com 32 GB de memória total, 62 dos 73 modelos do nosso catálogo rodam com folga na quantização recomendada de 4 bits. Melhor escolha: Qwen 3.5 35B-A3B (download de 21.2 GB).

Lendo os sinais do seu hardware…

Todos os modelos que rodam com 32 GB

62 / 73 modelos
ModeloParâmetrosDownload (Q4)RAM mínimaIdeal para
Qwen 3.5 35B-A3B35B (A3B)21.2 GB32 GBChat, Raciocínio, Programação, Visão
Qwen 3.6 35B-A3B35B (A3B)21.2 GB32 GBChat, Raciocínio, Programação, Visão
Command R 35B35B21.2 GB32 GBChat
Qwen3-VL 32B33B20.0 GB32 GBVisão, Chat, Raciocínio
EXAONE 4.5 33B33B20.0 GB32 GBVisão, Raciocínio, Chat
Qwen 3 32B32.8B19.9 GB32 GBChat, Raciocínio
Qwen 2.5 Coder 32B32.8B19.9 GB32 GBProgramação
QwQ 32B32.8B19.9 GB32 GBRaciocínio
DeepSeek R1 32B32.8B19.9 GB32 GBRaciocínio
Granite 4.0 H Small32B (A9B)19.4 GB32 GBChat, Programação
Nemotron 3 Nano 30B-A3B31.6B (A3.6B)19.2 GB32 GBChat, Raciocínio, Programação
Gemma 4 31B30.7B18.6 GB32 GBChat, Programação, Raciocínio, Visão
Qwen 3 30B-A3B30.5B (A3.3B)18.5 GB32 GBChat, Raciocínio
Qwen3-VL 30B-A3B30B (A3B)18.2 GB32 GBVisão, Chat, Raciocínio
Gemma 3 27B27.4B16.6 GB24 GBChat, Visão
Qwen 3.5 27B27B16.4 GB24 GBChat, Raciocínio, Programação, Visão
Qwen 3.6 27B27B16.4 GB24 GBChat, Raciocínio, Programação, Visão
Gemma 4 26B A4B25.2B (A3.8B)15.3 GB24 GBChat, Programação, Raciocínio, Visão
Mistral Small 3.1 24B24B14.6 GB24 GBChat, Visão
Devstral 24B24B14.6 GB24 GBProgramação
Magistral Small 1.224B14.6 GB24 GBRaciocínio, Chat, Visão
Devstral Small 2 24B24B14.6 GB24 GBProgramação, Chat, Visão
Codestral 22B22.2B13.5 GB24 GBProgramação
GPT-OSS 20B20.9B (A3.6B)12.7 GB24 GBChat, Raciocínio
Phi-4 Reasoning Vision 15B15B9.1 GB16 GBVisão, Raciocínio
Qwen 3 14B14.8B9.0 GB16 GBChat, Raciocínio
DeepSeek R1 14B14.8B9.0 GB16 GBRaciocínio
Phi-4 14B14.7B8.9 GB16 GBChat, Raciocínio
Ministral 3 14B14B8.5 GB16 GBChat, Visão
OLMo 2 13B13.7B8.3 GB12 GBChat
Gemma 3 12B12.2B7.4 GB12 GBChat, Visão
Mistral Nemo 12B12.2B7.4 GB12 GBChat
Gemma 4 12B12B7.3 GB12 GBChat, Programação, Raciocínio, Visão
Mellum 2 12B-A2.5B12B (A2.5B)7.3 GB12 GBProgramação
Qwen 3.5 9B9B5.5 GB12 GBChat, Raciocínio, Visão
GLM-4.6V-Flash9B5.5 GB12 GBVisão, Chat
Qwen 2.5 VL 7B8.3B5.0 GB8 GBVisão, Chat
Qwen 3 8B8.2B5.0 GB8 GBChat, Raciocínio
Granite 3.3 8B8.2B5.0 GB8 GBChat
Llama 3.1 8B8B4.9 GB8 GBChat
DeepSeek R1 8B8B4.9 GB8 GBRaciocínio
Gemma 4 E4B8B (A4.5B)4.9 GB8 GBChat, Visão
Qwen3-VL 8B8B4.9 GB8 GBVisão, Chat
Ministral 3 8B8B4.9 GB8 GBChat, Visão
Gemma 3n E4B7.8B (A4B)4.7 GB8 GBChat, Visão
Qwen 2.5 Coder 7B7.6B4.6 GB8 GBProgramação
DeepSeek R1 7B7.6B4.6 GB8 GBRaciocínio
Mistral 7B7.2B4.4 GB8 GBChat
Gemma 4 E2B5.1B (A2.3B)3.1 GB6 GBChat, Visão
Gemma 3 4B4.3B2.6 GB6 GBChat, Visão
Qwen 3 4B4B2.4 GB6 GBChat, Raciocínio
Qwen 3.5 4B4B2.4 GB6 GBChat, Visão
Phi-4 Mini 3.8B3.8B2.3 GB6 GBChat
Llama 3.2 3B3.2B1.9 GB4 GBChat
DeepSeek-OCR3B (A0.57B)1.8 GB4 GBVisão
Ministral 3 3B3B1.8 GB4 GBChat, Visão
DeepSeek R1 1.5B1.8B1.1 GB3 GBRaciocínio
Qwen 3 1.7B1.7B1.0 GB3 GBChat
SmolLM2 1.7B1.7B1.0 GB3 GBChat
Llama 3.2 1B1.2B0.7 GB3 GBChat
Gemma 3 1B1B0.6 GB3 GBChat
Qwen 3 0.6B0.6B0.4 GB2 GBChat

Os tamanhos são de builds GGUF em 4 bits (Q4_K_M) — o padrão para rodar modelos localmente. · Dados atualizados: 2026-06-11 · Como calculamos esses números →

Quase lá — precisa de 64 GB

Estes modelos não cabem com folga em 32 GB, mas rodam na faixa logo acima.

Ver a faixa de 64 GB →

Perguntas frequentes

Melhores LLMs locais para 32 GB de RAM (2026) — Teste ao vivo no navegador