كم أحتاج من RAM لتشغيل Devstral Small 2 24B؟

نحو 24 GB من ذاكرة النظام الإجمالية للنسخة الموصى بها بدقة 4 بت (Q4_K_M)، وهي تنزيل بحجم 14.6 GB. كلما زادت RAM أمكنك استخدام تكميم أعلى جودة أو سياق أطول.

هل يعمل Devstral Small 2 24B دون GPU مخصص؟

نعم — أدوات مثل Ollama وllama.cpp تشغّله على CPU ما دام يتسع في RAM. وجود GPU أو Apple Silicon يجعل التوليد أسرع بعدة مرات، لكنه اختياري.

أي تكميم من Devstral Small 2 24B ينبغي أن أنزّله؟

Q4_K_M هو الخيار الأمثل لمعظم المستخدمين — أصغر بنحو 4 أضعاف من الأصل مع خسارة طفيفة في الجودة. اختر Q5 أو Q8 إن كانت لديك RAM وافرة، وQ2 فقط عندما لا يتسع غيره.

هل يمكنني إجراء الضبط الدقيق (fine-tuning) لـ Devstral Small 2 24B على جهازي؟

يتطلب الضبط الدقيق ذاكرة أكبر بكثير من الاستدلال. يحتاج الضبط الدقيق الكامل لـ Devstral Small 2 24B إلى نحو 288 GB من ذاكرة GPU، بينما تخفّضه QLoRA إلى نحو 36 GB. لمعظم المستخدمين، يبقى QLoRA على GPU مستأجر هو الخيار العملي.

هل نموذج أكبر بدقة Q2/Q3 أفضل من نموذج أصغر بدقة Q4/Q5؟

غالباً لا. فدون Q3 تتدهور الجودة بشكل حاد — والنموذج الأصغر بدقة Q4_K_M يتفوق عادةً على نموذج أكبر مضغوط إلى Q2. لا تنزل دون Q4 إلا عندما لا يتسع أي خيار آخر في ذاكرتك.

← جميع النماذجفحص النموذج

هل يمكنني تشغيل Devstral Small 2 24B؟

يحتاج Devstral Small 2 24B من Mistral AI إلى نحو 24 GB من RAM عند التكميم الموصى به بدقة 4 بت (تنزيل بحجم 14.6 GB). نفحص عتاد جهازك أدناه — فوراً، ولا شيء يغادر متصفحك. توقّع نحو ~24 tok/s على Apple M-series Max.

نقرأ مؤشرات عتاد جهازك…

ملاحظات من الواقع

Devstral Small 2 هو نموذج البرمجة من Mistral بحجم 24B، والاسم لا يوحي بحجم العتاد الذي يحتاجه فعليًا. عند تكميم 4-bit تبلغ الأوزان نحو 14.6 GB، لذا فإن بطاقات 12 GB التي يملكها معظم الناس غير كافية: على RTX 3060 لن يتسع النموذج ببساطة. من الناحية الواقعية تحتاج إلى 24 GB من الذاكرة لتشغيله بأريحية، ما يعني عمليًا بطاقة رسومية بسعة 24 GB مثل 4090 أو جهاز Mac بمعالج Apple Silicon يوفّر 24 GB على الأقل من الذاكرة الموحّدة. إذا نزلت إلى تكميم 2-bit يتقلّص إلى نحو 10.1 GB، لكنها مقايضة قاسية في الجودة لنموذج هدفه الأساسي توليد كود دقيق.

على بطاقة 4090 يمكنك توقّع نحو 59 tok/s عند 4-bit، وهو معدّل ممتع فعلًا لحلقة برمجة وكيلية يقرأ فيها الملفات ويخطّط ويعدّل. على شريحة M-series Max يستقر أقرب إلى 24 tok/s، وهو لا يزال صالحًا للعمل التفاعلي لكنك تشعر به في التوليدات الطويلة. سياق 256K المعلن حقيقي ومفيد لتغذية مستودعات كاملة، لكن كن صريحًا بشأن التكلفة: حتى عند 128K تضع ورقة الحقائق إجمالي الذاكرة قرب 42.1 GB، أي أبعد بكثير من بطاقة واحدة بسعة 24 GB. تعامل مع السياق الكبير كأداة تلجأ إليها عن قصد، لا كإعداد افتراضي تتركه مفتوحًا.

مقارنةً بأشقائه، يُعدّ Devstral الخيار الجاد للعمل الحقيقي: فـ Mistral 7B و Mistral Nemo 12B أخفّ وأسهل في الاستضافة لكنهما أضعف عمومًا في مهام البرمجة متعددة الخطوات، بينما يُعدّ Gemma 4 26B A4B أقرب منافس في البرمجة والاستدلال ويستحق مقارنة جنبًا إلى جنب إذا توفّرت لديك الذاكرة. ما يميّز Devstral أنه بُني للتحرير البرمجي الوكيلي القائم على استخدام الأدوات بدلًا من الدردشة بضربة واحدة، وهذا التركيز يظهر في طريقة اتّباعه لخطة عبر عدة ملفات. الترخيص هو Apache 2.0، لذا يمكنك استخدامه تجاريًا وفي الإنتاج دون قيود، وهو أمر نادر لنموذج بهذه القدرة.

المواصفات

المعاملات24B

نافذة السياق256K رمز

المطوِّرMistral AI

الرخصةApache 2.0

تاريخ الإصدار2025-12

الأفضل فيبرمجة, محادثة, رؤية

الحجم حسب التكميم

التكميم	بت/وزن	حجم التنزيل	الحد الأدنى من RAM	الجودة
Q2_K	3.35	10.1 GB	16 GB	فقدان ملحوظ
Q4_K_Mموصى به	4.85	14.6 GB	24 GB	موصى به
Q5_K_M	5.65	17.0 GB	24 GB	عالية
Q8_0	8.5	25.5 GB	48 GB	شبه أصلية
F16	16	48.0 GB	64 GB	أصلية

الأحجام تقديرات محسوبة من عدد المعاملات × عدد البتات لكل وزن؛ وتختلف نسخ GGUF الفعلية قليلاً. · آخر تحديث للبيانات: 2026-06-11 · كيف نحسب هذه الأرقام →

الذاكرة المطلوبة حسب طول السياق

السياق	ذاكرة KV cache (تقديرياً)	إجمالي الذاكرة (Q4)
4K رمز	~0.9 GB	~15.5 GB
8K رمز	~1.7 GB	~16.3 GB
32K رمز	~6.9 GB	~21.5 GB
128K رمز	~27.5 GB	~42.1 GB

تنمو ذاكرة KV cache مع طول السياق — فالنموذج الذي يتسع عند 4K قد تنفد ذاكرته عند 32K. التقديرات تفترض ذاكرة تخزين بدقة FP16 مع grouped-query attention؛ ويختلف الاستهلاك الفعلي حسب بيئة التشغيل.

السرعة التقديرية حسب العتاد

العتاد	عرض النطاق	السرعة التقريبية
NVIDIA RTX 3060 12GB	360 GB/s	لا يتسع في VRAM
NVIDIA RTX 4090 24GB	1008 GB/s	~59 tok/s
Apple M-series (base)	100 GB/s	~6 tok/s
Apple M-series Pro	270 GB/s	~16 tok/s
Apple M-series Max	410 GB/s	~24 tok/s
CPU only (dual-channel DDR5)	60 GB/s	~4 tok/s