Question 1

¿Cuál es el mejor LLM local para 8 GB de RAM?

Accepted Answer

Qwen 2.5 VL 7B es el modelo todoterreno más potente que funciona con holgura en 8 GB — una descarga de 5.0 GB con la cuantización recomendada de 4 bits. Para programación, la mejor opción es Qwen 2.5 Coder 7B.

Question 2

¿Cuántos LLM puede ejecutar un equipo de 8 GB?

Accepted Answer

26 de los 73 modelos de pesos abiertos de nuestro catálogo funcionan con holgura en 8 GB de memoria total con cuantización de 4 bits, dejando margen para el sistema operativo y la caché KV.

Question 3

¿Puedo meter un modelo más grande en 8 GB?

Accepted Answer

A veces — una cuantización de 2–3 bits puede hacer que quepa un modelo mayor, pero por debajo de Q3 la calidad cae en picado. Un modelo más pequeño en Q4_K_M suele superar a uno más grande comprimido a Q2.

Question 4

¿Cambian estos números si tengo una GPU?

Accepted Answer

Que un modelo quepa lo decide la memoria, no la potencia de cálculo. En un PC, el modelo debe caber en la VRAM para ejecutarse por completo en la GPU; si no, se ejecuta desde la RAM del sistema en la CPU, solo que más lento. En Apple Silicon, la RAM y la VRAM son el mismo grupo de memoria unificada.

Question 5

¿Cómo sabéis qué cabe en 8 GB?

Accepted Answer

Estimamos el tamaño de descarga a 4 bits a partir del número de parámetros (parámetros × 4,85 ÷ 8), añadimos un 25% de sobrecarga de ejecución más 1,5 GB para el sistema operativo, y redondeamos hacia arriba a un tamaño de memoria estándar. Las fórmulas completas están en nuestra página de metodología.

Modelo	Parámetros	Descarga (Q4)	RAM mínima	Ideal para
Qwen 2.5 VL 7BAlibaba	8.3B	5.0 GB	8 GB	Visión, Chat
Qwen 3 8BAlibaba	8.2B	5.0 GB	8 GB	Chat, Razonamiento
Granite 3.3 8BIBM	8.2B	5.0 GB	8 GB	Chat
Llama 3.1 8BMeta	8B	4.9 GB	8 GB	Chat
DeepSeek R1 8BDeepSeek	8B	4.9 GB	8 GB	Razonamiento
Gemma 4 E4BGoogle	8B (A4.5B)	4.9 GB	8 GB	Chat, Visión
Qwen3-VL 8BAlibaba	8B	4.9 GB	8 GB	Visión, Chat
Ministral 3 8BMistral AI	8B	4.9 GB	8 GB	Chat, Visión
Gemma 3n E4BGoogle	7.8B (A4B)	4.7 GB	8 GB	Chat, Visión
Qwen 2.5 Coder 7BAlibaba	7.6B	4.6 GB	8 GB	Programación
DeepSeek R1 7BDeepSeek	7.6B	4.6 GB	8 GB	Razonamiento
Mistral 7BMistral AI	7.2B	4.4 GB	8 GB	Chat
Gemma 4 E2BGoogle	5.1B (A2.3B)	3.1 GB	6 GB	Chat, Visión
Gemma 3 4BGoogle	4.3B	2.6 GB	6 GB	Chat, Visión
Qwen 3 4BAlibaba	4B	2.4 GB	6 GB	Chat, Razonamiento
Qwen 3.5 4BAlibaba	4B	2.4 GB	6 GB	Chat, Visión
Phi-4 Mini 3.8BMicrosoft	3.8B	2.3 GB	6 GB	Chat
Llama 3.2 3BMeta	3.2B	1.9 GB	4 GB	Chat
DeepSeek-OCRDeepSeek	3B (A0.57B)	1.8 GB	4 GB	Visión
Ministral 3 3BMistral AI	3B	1.8 GB	4 GB	Chat, Visión
DeepSeek R1 1.5BDeepSeek	1.8B	1.1 GB	3 GB	Razonamiento
Qwen 3 1.7BAlibaba	1.7B	1.0 GB	3 GB	Chat
SmolLM2 1.7BHugging Face	1.7B	1.0 GB	3 GB	Chat
Llama 3.2 1BMeta	1.2B	0.7 GB	3 GB	Chat
Gemma 3 1BGoogle	1B	0.6 GB	3 GB	Chat
Qwen 3 0.6BAlibaba	0.6B	0.4 GB	2 GB	Chat

Mejores LLM locales para 8 GB de RAM

Preguntas frecuentes