كم أحتاج من RAM لتشغيل Devstral 2 123B؟

نحو 96 GB من ذاكرة النظام الإجمالية للنسخة الموصى بها بدقة 4 بت (Q4_K_M)، وهي تنزيل بحجم 74.6 GB. كلما زادت RAM أمكنك استخدام تكميم أعلى جودة أو سياق أطول.

هل يعمل Devstral 2 123B دون GPU مخصص؟

نعم — أدوات مثل Ollama وllama.cpp تشغّله على CPU ما دام يتسع في RAM. وجود GPU أو Apple Silicon يجعل التوليد أسرع بعدة مرات، لكنه اختياري.

أي تكميم من Devstral 2 123B ينبغي أن أنزّله؟

Q4_K_M هو الخيار الأمثل لمعظم المستخدمين — أصغر بنحو 4 أضعاف من الأصل مع خسارة طفيفة في الجودة. اختر Q5 أو Q8 إن كانت لديك RAM وافرة، وQ2 فقط عندما لا يتسع غيره.

هل يمكنني إجراء الضبط الدقيق (fine-tuning) لـ Devstral 2 123B على جهازي؟

يتطلب الضبط الدقيق ذاكرة أكبر بكثير من الاستدلال. يحتاج الضبط الدقيق الكامل لـ Devstral 2 123B إلى نحو 1476 GB من ذاكرة GPU، بينما تخفّضه QLoRA إلى نحو 185 GB. لمعظم المستخدمين، يبقى QLoRA على GPU مستأجر هو الخيار العملي.

هل نموذج أكبر بدقة Q2/Q3 أفضل من نموذج أصغر بدقة Q4/Q5؟

غالباً لا. فدون Q3 تتدهور الجودة بشكل حاد — والنموذج الأصغر بدقة Q4_K_M يتفوق عادةً على نموذج أكبر مضغوط إلى Q2. لا تنزل دون Q4 إلا عندما لا يتسع أي خيار آخر في ذاكرتك.

← جميع النماذجفحص النموذج

هل يمكنني تشغيل Devstral 2 123B؟

يحتاج Devstral 2 123B من Mistral AI إلى نحو 96 GB من RAM عند التكميم الموصى به بدقة 4 بت (تنزيل بحجم 74.6 GB). نفحص عتاد جهازك أدناه — فوراً، ولا شيء يغادر متصفحك. توقّع نحو ~5 tok/s على Apple M-series Max.

نقرأ مؤشرات عتاد جهازك…

ملاحظات من الواقع

نموذج Devstral 2 123B هو نموذج الترميز الكثيف الكبير من Mistral، وهو موجّه تحديداً لمن يبنون أنظمة ترميز محلية جادة، لا لأصحاب الحواسيب المحمولة. بدقة 4-bit يبلغ حجمه نحو 74.6 GB، وهذا وحده يكشف القصة: فهو لا يتسع على بطاقة RTX 3060 بسعة 12 GB ولا على RTX 4090 بسعة 24 GB، نقطة انتهى. تحتاج إلى نحو 96 GB من الذاكرة لتحميله براحة، أي عملياً جهاز Apple Silicon عالي الذاكرة أو محطة عمل بذاكرة RAM ضخمة. هذا نموذج تخطط عتادك حوله، لا نموذج تجرّبه بشكل عابر.

في الاستخدام اليومي، التحفّظ الصادق هو السرعة. على معالج Apple M Max ستحصل على نحو 5 tok/s، أما صندوق يعتمد على المعالج وحده بذاكرة DDR5 فينخفض إلى نحو 1 tok/s، وهو أقرب إلى مهام الدفعات منه إلى الدردشة التفاعلية. يقرأ الشيفرة ويكتبها جيداً، لكنك ستشعر بكل رد يتدفق ببطء. نافذة السياق سخية وتبلغ 256K على الورق، غير أن الذاكرة هي القيد الحقيقي: الدفع إلى سياق 128K يتطلب وحده نحو 132 GB إجمالاً، لذا على جهاز بسعة 96 GB تُبقي سياق العمل متواضعاً وتعتمد على مطالبات أقصر ومركّزة.

مقارنةً بنموذج MoE وهو Qwen 3.5 122B-A10B المذكور في related_models، تكون المقايضة واضحة: ذلك النموذج يفعّل شريحة فقط من أوزانه لكل رمز ويبدو عموماً أسرع عند عدد معاملات مماثل، بينما يشغّل Devstral 2 كل معاملاته البالغة 123B على كل رمز. ميزة Devstral البارزة هي كونه متخصص ترميز كثيفاً ومركّزاً من Mistral بسياق طويل، إذا توفرت لديك الذاكرة لتغذيته. ملاحظة عملية حول الترخيص: يُطرح تحت ترخيص Modified MIT، لذا اقرأ الشروط المحددة قبل أي نشر تجاري بدلاً من افتراض حرية MIT الصرفة.

المواصفات

المعاملات123B

نافذة السياق256K رمز

المطوِّرMistral AI

الرخصةModified MIT

تاريخ الإصدار2025-12

الأفضل فيبرمجة

الحجم حسب التكميم

التكميم	بت/وزن	حجم التنزيل	الحد الأدنى من RAM	الجودة
Q2_K	3.35	51.5 GB	96 GB	فقدان ملحوظ
Q4_K_Mموصى به	4.85	74.6 GB	96 GB	موصى به
Q5_K_M	5.65	86.9 GB	128 GB	عالية
Q8_0	8.5	130.7 GB	192 GB	شبه أصلية
F16	16	246.0 GB	256 GB	أصلية

الأحجام تقديرات محسوبة من عدد المعاملات × عدد البتات لكل وزن؛ وتختلف نسخ GGUF الفعلية قليلاً. · آخر تحديث للبيانات: 2026-06-11 · كيف نحسب هذه الأرقام →

الذاكرة المطلوبة حسب طول السياق

السياق	ذاكرة KV cache (تقديرياً)	إجمالي الذاكرة (Q4)
4K رمز	~1.8 GB	~76.4 GB
8K رمز	~3.6 GB	~78.2 GB
32K رمز	~14.3 GB	~88.9 GB
128K رمز	~57.4 GB	~132.0 GB

تنمو ذاكرة KV cache مع طول السياق — فالنموذج الذي يتسع عند 4K قد تنفد ذاكرته عند 32K. التقديرات تفترض ذاكرة تخزين بدقة FP16 مع grouped-query attention؛ ويختلف الاستهلاك الفعلي حسب بيئة التشغيل.

السرعة التقديرية حسب العتاد

العتاد	عرض النطاق	السرعة التقريبية
NVIDIA RTX 3060 12GB	360 GB/s	لا يتسع في VRAM
NVIDIA RTX 4090 24GB	1008 GB/s	لا يتسع في VRAM
Apple M-series (base)	100 GB/s	~1 tok/s
Apple M-series Pro	270 GB/s	~3 tok/s
Apple M-series Max	410 GB/s	~5 tok/s
CPU only (dual-channel DDR5)	60 GB/s	~1 tok/s