Question 1

¿Cuánta RAM necesito para ejecutar EXAONE 4.5 33B?

Accepted Answer

Unos 32 GB de memoria total del sistema para la build recomendada de 4 bits (Q4_K_M), que es una descarga de 20.0 GB. Con más RAM puedes usar cuantizaciones de mayor calidad o un contexto más largo.

Question 2

¿Puede EXAONE 4.5 33B funcionar sin una GPU dedicada?

Accepted Answer

Sí — herramientas como Ollama y llama.cpp lo ejecutan en la CPU siempre que quepa en la RAM. Una GPU o un Apple Silicon acelera la generación varias veces, pero es opcional.

Question 3

¿Qué cuantización de EXAONE 4.5 33B debo descargar?

Accepted Answer

Q4_K_M es el punto óptimo para casi todo el mundo — aproximadamente 4 veces más pequeño que el original con una pérdida de calidad mínima. Elige Q5 o Q8 si te sobra RAM, o Q2 solo cuando no quepa nada más.

Question 4

¿Puedo hacer fine-tuning de EXAONE 4.5 33B en mi propio equipo?

Accepted Answer

El fine-tuning necesita mucha más memoria que la inferencia. El fine-tuning completo de EXAONE 4.5 33B requiere unos 396 GB de memoria de GPU, mientras que QLoRA lo baja a unos 50 GB. Para la mayoría, QLoRA en una GPU alquilada es el camino práctico.

Question 5

¿Es mejor un modelo más grande en Q2/Q3 que uno más pequeño en Q4/Q5?

Accepted Answer

Normalmente no. Por debajo de Q3 la calidad se degrada mucho — un modelo más pequeño en Q4_K_M suele superar a uno más grande comprimido a Q2. Baja de Q4 solo cuando no quepa nada más en tu memoria.

Cuantización	Bits/peso	Descarga	RAM mínima	Calidad
Q2_K	3.35	13.8 GB	24 GB	Pérdida notable
Q4_K_MRecomendada	4.85	20.0 GB	32 GB	Recomendada
Q5_K_M	5.65	23.3 GB	32 GB	Alta
Q8_0	8.5	35.1 GB	48 GB	Casi original
F16	16	66.0 GB	96 GB	Original

Contexto	Caché KV (est.)	Memoria total (Q4)
4K tokens	~1.0 GB	~21.0 GB
8K tokens	~2.0 GB	~22.0 GB
32K tokens	~7.9 GB	~27.9 GB
128K tokens	~31.7 GB	~51.7 GB

Hardware	Ancho de banda	~Velocidad
NVIDIA RTX 3060 12GB	360 GB/s	No cabe en la VRAM
NVIDIA RTX 4090 24GB	1008 GB/s	~43 tok/s
Apple M-series (base)	100 GB/s	~4 tok/s
Apple M-series Pro	270 GB/s	~11 tok/s
Apple M-series Max	410 GB/s	~17 tok/s
CPU only (dual-channel DDR5)	60 GB/s	~3 tok/s

¿Puedo ejecutar EXAONE 4.5 33B?

Preguntas frecuentes