← Todos los modelosEXPLORAR POR RAM
Mejores LLM locales para 16 GB de RAM
Con 16 GB de memoria total, 38 de los 73 modelos de nuestro catálogo funcionan con holgura con la cuantización recomendada de 4 bits. Primera opción: Phi-4 Reasoning Vision 15B (descarga de 9.1 GB).
Leyendo las señales de tu hardware…
Nuestras recomendaciones
Todos los modelos que funcionan con 16 GB
38 / 73 modelos| Modelo | Parámetros | Descarga (Q4) | RAM mínima | Ideal para |
|---|---|---|---|---|
| Phi-4 Reasoning Vision 15B | 15B | 9.1 GB | 16 GB | Visión, Razonamiento |
| Qwen 3 14B | 14.8B | 9.0 GB | 16 GB | Chat, Razonamiento |
| DeepSeek R1 14B | 14.8B | 9.0 GB | 16 GB | Razonamiento |
| Phi-4 14B | 14.7B | 8.9 GB | 16 GB | Chat, Razonamiento |
| Ministral 3 14B | 14B | 8.5 GB | 16 GB | Chat, Visión |
| OLMo 2 13B | 13.7B | 8.3 GB | 12 GB | Chat |
| Gemma 3 12B | 12.2B | 7.4 GB | 12 GB | Chat, Visión |
| Mistral Nemo 12B | 12.2B | 7.4 GB | 12 GB | Chat |
| Gemma 4 12B | 12B | 7.3 GB | 12 GB | Chat, Programación, Razonamiento, Visión |
| Mellum 2 12B-A2.5B | 12B (A2.5B) | 7.3 GB | 12 GB | Programación |
| Qwen 3.5 9B | 9B | 5.5 GB | 12 GB | Chat, Razonamiento, Visión |
| GLM-4.6V-Flash | 9B | 5.5 GB | 12 GB | Visión, Chat |
| Qwen 2.5 VL 7B | 8.3B | 5.0 GB | 8 GB | Visión, Chat |
| Qwen 3 8B | 8.2B | 5.0 GB | 8 GB | Chat, Razonamiento |
| Granite 3.3 8B | 8.2B | 5.0 GB | 8 GB | Chat |
| Llama 3.1 8B | 8B | 4.9 GB | 8 GB | Chat |
| DeepSeek R1 8B | 8B | 4.9 GB | 8 GB | Razonamiento |
| Gemma 4 E4B | 8B (A4.5B) | 4.9 GB | 8 GB | Chat, Visión |
| Qwen3-VL 8B | 8B | 4.9 GB | 8 GB | Visión, Chat |
| Ministral 3 8B | 8B | 4.9 GB | 8 GB | Chat, Visión |
| Gemma 3n E4B | 7.8B (A4B) | 4.7 GB | 8 GB | Chat, Visión |
| Qwen 2.5 Coder 7B | 7.6B | 4.6 GB | 8 GB | Programación |
| DeepSeek R1 7B | 7.6B | 4.6 GB | 8 GB | Razonamiento |
| Mistral 7B | 7.2B | 4.4 GB | 8 GB | Chat |
| Gemma 4 E2B | 5.1B (A2.3B) | 3.1 GB | 6 GB | Chat, Visión |
| Gemma 3 4B | 4.3B | 2.6 GB | 6 GB | Chat, Visión |
| Qwen 3 4B | 4B | 2.4 GB | 6 GB | Chat, Razonamiento |
| Qwen 3.5 4B | 4B | 2.4 GB | 6 GB | Chat, Visión |
| Phi-4 Mini 3.8B | 3.8B | 2.3 GB | 6 GB | Chat |
| Llama 3.2 3B | 3.2B | 1.9 GB | 4 GB | Chat |
| DeepSeek-OCR | 3B (A0.57B) | 1.8 GB | 4 GB | Visión |
| Ministral 3 3B | 3B | 1.8 GB | 4 GB | Chat, Visión |
| DeepSeek R1 1.5B | 1.8B | 1.1 GB | 3 GB | Razonamiento |
| Qwen 3 1.7B | 1.7B | 1.0 GB | 3 GB | Chat |
| SmolLM2 1.7B | 1.7B | 1.0 GB | 3 GB | Chat |
| Llama 3.2 1B | 1.2B | 0.7 GB | 3 GB | Chat |
| Gemma 3 1B | 1B | 0.6 GB | 3 GB | Chat |
| Qwen 3 0.6B | 0.6B | 0.4 GB | 2 GB | Chat |
Los tamaños corresponden a builds GGUF de 4 bits (Q4_K_M), el estándar para ejecutar modelos en local. · Datos actualizados: 2026-06-11 · Cómo calculamos estos números →
Por muy poco — necesitan 32 GB
Estos modelos no caben con holgura en 16 GB, pero funcionan en el nivel siguiente.
GPT-OSS 20B · 24 GBCodestral 22B · 24 GBMistral Small 3.1 24B · 24 GBDevstral 24B · 24 GBMagistral Small 1.2 · 24 GBDevstral Small 2 24B · 24 GBGemma 4 26B A4B · 24 GBQwen 3.5 27B · 24 GBQwen 3.6 27B · 24 GBGemma 3 27B · 24 GBQwen3-VL 30B-A3B · 32 GBQwen 3 30B-A3B · 32 GBGemma 4 31B · 32 GBNemotron 3 Nano 30B-A3B · 32 GBGranite 4.0 H Small · 32 GBQwen 3 32B · 32 GBQwen 2.5 Coder 32B · 32 GBQwQ 32B · 32 GBDeepSeek R1 32B · 32 GBQwen3-VL 32B · 32 GBEXAONE 4.5 33B · 32 GBQwen 3.5 35B-A3B · 32 GBQwen 3.6 35B-A3B · 32 GBCommand R 35B · 32 GB
Ver el nivel de 32 GB →