← Todos los modelosEXPLORAR POR RAM

Mejores LLM locales para 8 GB de RAM

Con 8 GB de memoria total, 26 de los 73 modelos de nuestro catálogo funcionan con holgura con la cuantización recomendada de 4 bits. Primera opción: Qwen 2.5 VL 7B (descarga de 5.0 GB).

Leyendo las señales de tu hardware…

Todos los modelos que funcionan con 8 GB

26 / 73 modelos
ModeloParámetrosDescarga (Q4)RAM mínimaIdeal para
Qwen 2.5 VL 7B8.3B5.0 GB8 GBVisión, Chat
Qwen 3 8B8.2B5.0 GB8 GBChat, Razonamiento
Granite 3.3 8B8.2B5.0 GB8 GBChat
Llama 3.1 8B8B4.9 GB8 GBChat
DeepSeek R1 8B8B4.9 GB8 GBRazonamiento
Gemma 4 E4B8B (A4.5B)4.9 GB8 GBChat, Visión
Qwen3-VL 8B8B4.9 GB8 GBVisión, Chat
Ministral 3 8B8B4.9 GB8 GBChat, Visión
Gemma 3n E4B7.8B (A4B)4.7 GB8 GBChat, Visión
Qwen 2.5 Coder 7B7.6B4.6 GB8 GBProgramación
DeepSeek R1 7B7.6B4.6 GB8 GBRazonamiento
Mistral 7B7.2B4.4 GB8 GBChat
Gemma 4 E2B5.1B (A2.3B)3.1 GB6 GBChat, Visión
Gemma 3 4B4.3B2.6 GB6 GBChat, Visión
Qwen 3 4B4B2.4 GB6 GBChat, Razonamiento
Qwen 3.5 4B4B2.4 GB6 GBChat, Visión
Phi-4 Mini 3.8B3.8B2.3 GB6 GBChat
Llama 3.2 3B3.2B1.9 GB4 GBChat
DeepSeek-OCR3B (A0.57B)1.8 GB4 GBVisión
Ministral 3 3B3B1.8 GB4 GBChat, Visión
DeepSeek R1 1.5B1.8B1.1 GB3 GBRazonamiento
Qwen 3 1.7B1.7B1.0 GB3 GBChat
SmolLM2 1.7B1.7B1.0 GB3 GBChat
Llama 3.2 1B1.2B0.7 GB3 GBChat
Gemma 3 1B1B0.6 GB3 GBChat
Qwen 3 0.6B0.6B0.4 GB2 GBChat

Los tamaños corresponden a builds GGUF de 4 bits (Q4_K_M), el estándar para ejecutar modelos en local. · Datos actualizados: 2026-06-11 · Cómo calculamos estos números →

Preguntas frecuentes