← Todos os modelosNAVEGAR POR RAM
Melhores LLMs locais para 16 GB de RAM
Com 16 GB de memória total, 38 dos 73 modelos do nosso catálogo rodam com folga na quantização recomendada de 4 bits. Melhor escolha: Phi-4 Reasoning Vision 15B (download de 9.1 GB).
Lendo os sinais do seu hardware…
Melhores escolhas
Todos os modelos que rodam com 16 GB
38 / 73 modelos| Modelo | Parâmetros | Download (Q4) | RAM mínima | Ideal para |
|---|---|---|---|---|
| Phi-4 Reasoning Vision 15B | 15B | 9.1 GB | 16 GB | Visão, Raciocínio |
| Qwen 3 14B | 14.8B | 9.0 GB | 16 GB | Chat, Raciocínio |
| DeepSeek R1 14B | 14.8B | 9.0 GB | 16 GB | Raciocínio |
| Phi-4 14B | 14.7B | 8.9 GB | 16 GB | Chat, Raciocínio |
| Ministral 3 14B | 14B | 8.5 GB | 16 GB | Chat, Visão |
| OLMo 2 13B | 13.7B | 8.3 GB | 12 GB | Chat |
| Gemma 3 12B | 12.2B | 7.4 GB | 12 GB | Chat, Visão |
| Mistral Nemo 12B | 12.2B | 7.4 GB | 12 GB | Chat |
| Gemma 4 12B | 12B | 7.3 GB | 12 GB | Chat, Programação, Raciocínio, Visão |
| Mellum 2 12B-A2.5B | 12B (A2.5B) | 7.3 GB | 12 GB | Programação |
| Qwen 3.5 9B | 9B | 5.5 GB | 12 GB | Chat, Raciocínio, Visão |
| GLM-4.6V-Flash | 9B | 5.5 GB | 12 GB | Visão, Chat |
| Qwen 2.5 VL 7B | 8.3B | 5.0 GB | 8 GB | Visão, Chat |
| Qwen 3 8B | 8.2B | 5.0 GB | 8 GB | Chat, Raciocínio |
| Granite 3.3 8B | 8.2B | 5.0 GB | 8 GB | Chat |
| Llama 3.1 8B | 8B | 4.9 GB | 8 GB | Chat |
| DeepSeek R1 8B | 8B | 4.9 GB | 8 GB | Raciocínio |
| Gemma 4 E4B | 8B (A4.5B) | 4.9 GB | 8 GB | Chat, Visão |
| Qwen3-VL 8B | 8B | 4.9 GB | 8 GB | Visão, Chat |
| Ministral 3 8B | 8B | 4.9 GB | 8 GB | Chat, Visão |
| Gemma 3n E4B | 7.8B (A4B) | 4.7 GB | 8 GB | Chat, Visão |
| Qwen 2.5 Coder 7B | 7.6B | 4.6 GB | 8 GB | Programação |
| DeepSeek R1 7B | 7.6B | 4.6 GB | 8 GB | Raciocínio |
| Mistral 7B | 7.2B | 4.4 GB | 8 GB | Chat |
| Gemma 4 E2B | 5.1B (A2.3B) | 3.1 GB | 6 GB | Chat, Visão |
| Gemma 3 4B | 4.3B | 2.6 GB | 6 GB | Chat, Visão |
| Qwen 3 4B | 4B | 2.4 GB | 6 GB | Chat, Raciocínio |
| Qwen 3.5 4B | 4B | 2.4 GB | 6 GB | Chat, Visão |
| Phi-4 Mini 3.8B | 3.8B | 2.3 GB | 6 GB | Chat |
| Llama 3.2 3B | 3.2B | 1.9 GB | 4 GB | Chat |
| DeepSeek-OCR | 3B (A0.57B) | 1.8 GB | 4 GB | Visão |
| Ministral 3 3B | 3B | 1.8 GB | 4 GB | Chat, Visão |
| DeepSeek R1 1.5B | 1.8B | 1.1 GB | 3 GB | Raciocínio |
| Qwen 3 1.7B | 1.7B | 1.0 GB | 3 GB | Chat |
| SmolLM2 1.7B | 1.7B | 1.0 GB | 3 GB | Chat |
| Llama 3.2 1B | 1.2B | 0.7 GB | 3 GB | Chat |
| Gemma 3 1B | 1B | 0.6 GB | 3 GB | Chat |
| Qwen 3 0.6B | 0.6B | 0.4 GB | 2 GB | Chat |
Os tamanhos são de builds GGUF em 4 bits (Q4_K_M) — o padrão para rodar modelos localmente. · Dados atualizados: 2026-06-11 · Como calculamos esses números →
Quase lá — precisa de 32 GB
Estes modelos não cabem com folga em 16 GB, mas rodam na faixa logo acima.
GPT-OSS 20B · 24 GBCodestral 22B · 24 GBMistral Small 3.1 24B · 24 GBDevstral 24B · 24 GBMagistral Small 1.2 · 24 GBDevstral Small 2 24B · 24 GBGemma 4 26B A4B · 24 GBQwen 3.5 27B · 24 GBQwen 3.6 27B · 24 GBGemma 3 27B · 24 GBQwen3-VL 30B-A3B · 32 GBQwen 3 30B-A3B · 32 GBGemma 4 31B · 32 GBNemotron 3 Nano 30B-A3B · 32 GBGranite 4.0 H Small · 32 GBQwen 3 32B · 32 GBQwen 2.5 Coder 32B · 32 GBQwQ 32B · 32 GBDeepSeek R1 32B · 32 GBQwen3-VL 32B · 32 GBEXAONE 4.5 33B · 32 GBQwen 3.5 35B-A3B · 32 GBQwen 3.6 35B-A3B · 32 GBCommand R 35B · 32 GB
Ver a faixa de 32 GB →