¿Puede una Apple M2 ejecutar Llama 3.1 8B?

Sí — la build de 4 bits es una descarga de 4.9 GB y cabe en 8–24 GB de memoria unificada. Espera aproximadamente ~18 tok/s.

¿Cuál es el LLM más grande que puede ejecutar una Apple M2?

Gemma 3 27B es el modelo más grande de nuestro catálogo que cabe (16.6 GB a 4 bits). Espera unos ~5 tok/s.

¿Qué tan rápida es la Apple M2 para LLM locales?

La generación de tokens está limitada por el ancho de banda de memoria. A aproximadamente 100 GB/s, la Apple M2 genera unos ~18 tok/s con un modelo de clase 8B a 4 bits — la velocidad escala de forma inversa al tamaño del modelo.

¿Es buena la memoria unificada de Apple para LLM locales?

Sí — la GPU puede usar casi todo el grupo de memoria, así que un Mac de 32 GB puede con modelos que requerirían una GPU dedicada carísima. El límite de velocidad suele ser el ancho de banda, no la capacidad.

← Todos los modelosCOMPROBACIÓN DE DISPOSITIVO

¿Qué LLM puede ejecutar una Apple M2?

La Apple M2 tiene 8–24 GB de memoria unificada y aproximadamente 100 GB/s de ancho de banda de memoria. Abajo tienes todos los modelos de nuestro catálogo que caben, con la velocidad de generación estimada. El más grande que cabe: Gemma 3 27B a ~5 tok/s.

Especificaciones

Memoria8–24 GB de memoria unificada

Ancho de banda~100 GB/s

Tipo de memoriaMemoria unificada

Lanzamiento2022-06

Modelos en la Apple M2

48 / 73 modelos

Modelo	Descarga (Q4)	8 GB	16 GB	24 GB	~Velocidad
Gemma 3 27BGoogle	16.6 GB	No cabe	No cabe	Funciona	~5 tok/s
Qwen 3.5 27BAlibaba	16.4 GB	No cabe	No cabe	Funciona	~5 tok/s
Qwen 3.6 27BAlibaba	16.4 GB	No cabe	No cabe	Funciona	~5 tok/s
Gemma 4 26B A4BGoogle	15.3 GB	No cabe	No cabe	Funciona	~37 tok/s
Mistral Small 3.1 24BMistral AI	14.6 GB	No cabe	No cabe	Funciona	~6 tok/s
Devstral 24BMistral AI	14.6 GB	No cabe	No cabe	Funciona	~6 tok/s
Magistral Small 1.2Mistral AI	14.6 GB	No cabe	No cabe	Funciona	~6 tok/s
Devstral Small 2 24BMistral AI	14.6 GB	No cabe	No cabe	Funciona	~6 tok/s
Codestral 22BMistral AI	13.5 GB	No cabe	No cabe	Funciona	~6 tok/s
GPT-OSS 20BOpenAI	12.7 GB	No cabe	No cabe	Funciona	~39 tok/s
Phi-4 Reasoning Vision 15BMicrosoft	9.1 GB	No cabe	Funciona	Funciona	~9 tok/s
Qwen 3 14BAlibaba	9.0 GB	No cabe	Funciona	Funciona	~9 tok/s
DeepSeek R1 14BDeepSeek	9.0 GB	No cabe	Funciona	Funciona	~9 tok/s
Phi-4 14BMicrosoft	8.9 GB	No cabe	Funciona	Funciona	~10 tok/s
Ministral 3 14BMistral AI	8.5 GB	No cabe	Funciona	Funciona	~10 tok/s
OLMo 2 13BAi2	8.3 GB	No cabe	Funciona	Funciona	~10 tok/s
Gemma 3 12BGoogle	7.4 GB	No cabe	Funciona	Funciona	~11 tok/s
Mistral Nemo 12BMistral AI	7.4 GB	No cabe	Funciona	Funciona	~11 tok/s
Gemma 4 12BGoogle	7.3 GB	No cabe	Funciona	Funciona	~12 tok/s
Mellum 2 12B-A2.5BJetBrains	7.3 GB	No cabe	Funciona	Funciona	~56 tok/s
Qwen 3.5 9BAlibaba	5.5 GB	No cabe	Funciona	Funciona	~16 tok/s
GLM-4.6V-FlashZ.ai	5.5 GB	No cabe	Funciona	Funciona	~16 tok/s
Qwen 2.5 VL 7BAlibaba	5.0 GB	Funciona	Funciona	Funciona	~17 tok/s
Qwen 3 8BAlibaba	5.0 GB	Funciona	Funciona	Funciona	~17 tok/s
Granite 3.3 8BIBM	5.0 GB	Funciona	Funciona	Funciona	~17 tok/s
Llama 3.1 8BMeta	4.9 GB	Funciona	Funciona	Funciona	~18 tok/s
DeepSeek R1 8BDeepSeek	4.9 GB	Funciona	Funciona	Funciona	~18 tok/s
Gemma 4 E4BGoogle	4.9 GB	Funciona	Funciona	Funciona	~31 tok/s
Qwen3-VL 8BAlibaba	4.9 GB	Funciona	Funciona	Funciona	~18 tok/s
Ministral 3 8BMistral AI	4.9 GB	Funciona	Funciona	Funciona	~18 tok/s
Gemma 3n E4BGoogle	4.7 GB	Funciona	Funciona	Funciona	~35 tok/s
Qwen 2.5 Coder 7BAlibaba	4.6 GB	Funciona	Funciona	Funciona	~18 tok/s
DeepSeek R1 7BDeepSeek	4.6 GB	Funciona	Funciona	Funciona	~18 tok/s
Mistral 7BMistral AI	4.4 GB	Funciona	Funciona	Funciona	~19 tok/s
Gemma 4 E2BGoogle	3.1 GB	Funciona	Funciona	Funciona	~61 tok/s
Gemma 3 4BGoogle	2.6 GB	Funciona	Funciona	Funciona	~33 tok/s
Qwen 3 4BAlibaba	2.4 GB	Funciona	Funciona	Funciona	~35 tok/s
Qwen 3.5 4BAlibaba	2.4 GB	Funciona	Funciona	Funciona	~35 tok/s
Phi-4 Mini 3.8BMicrosoft	2.3 GB	Funciona	Funciona	Funciona	~37 tok/s
Llama 3.2 3BMeta	1.9 GB	Funciona	Funciona	Funciona	~44 tok/s
DeepSeek-OCRDeepSeek	1.8 GB	Funciona	Funciona	Funciona	~246 tok/s
Ministral 3 3BMistral AI	1.8 GB	Funciona	Funciona	Funciona	~47 tok/s
DeepSeek R1 1.5BDeepSeek	1.1 GB	Funciona	Funciona	Funciona	~78 tok/s
Qwen 3 1.7BAlibaba	1.0 GB	Funciona	Funciona	Funciona	~82 tok/s
SmolLM2 1.7BHugging Face	1.0 GB	Funciona	Funciona	Funciona	~82 tok/s
Llama 3.2 1BMeta	0.7 GB	Funciona	Funciona	Funciona	~117 tok/s
Gemma 3 1BGoogle	0.6 GB	Funciona	Funciona	Funciona	~140 tok/s
Qwen 3 0.6BAlibaba	0.4 GB	Funciona	Funciona	Funciona	~234 tok/s

Apple Silicon comparte un único grupo de memoria entre CPU y GPU, así que casi toda la memoria unificada está disponible para el modelo (menos la sobrecarga del sistema operativo). · Datos actualizados: 2026-06-11 · Cómo calculamos estos números →