كم أحتاج من RAM لتشغيل Ministral 3 14B؟

نحو 16 GB من ذاكرة النظام الإجمالية للنسخة الموصى بها بدقة 4 بت (Q4_K_M)، وهي تنزيل بحجم 8.5 GB. كلما زادت RAM أمكنك استخدام تكميم أعلى جودة أو سياق أطول.

هل يعمل Ministral 3 14B دون GPU مخصص؟

نعم — أدوات مثل Ollama وllama.cpp تشغّله على CPU ما دام يتسع في RAM. وجود GPU أو Apple Silicon يجعل التوليد أسرع بعدة مرات، لكنه اختياري.

أي تكميم من Ministral 3 14B ينبغي أن أنزّله؟

Q4_K_M هو الخيار الأمثل لمعظم المستخدمين — أصغر بنحو 4 أضعاف من الأصل مع خسارة طفيفة في الجودة. اختر Q5 أو Q8 إن كانت لديك RAM وافرة، وQ2 فقط عندما لا يتسع غيره.

هل يمكنني إجراء الضبط الدقيق (fine-tuning) لـ Ministral 3 14B على جهازي؟

يتطلب الضبط الدقيق ذاكرة أكبر بكثير من الاستدلال. يحتاج الضبط الدقيق الكامل لـ Ministral 3 14B إلى نحو 168 GB من ذاكرة GPU، بينما تخفّضه QLoRA إلى نحو 21 GB. لمعظم المستخدمين، يبقى QLoRA على GPU مستأجر هو الخيار العملي.

هل نموذج أكبر بدقة Q2/Q3 أفضل من نموذج أصغر بدقة Q4/Q5؟

غالباً لا. فدون Q3 تتدهور الجودة بشكل حاد — والنموذج الأصغر بدقة Q4_K_M يتفوق عادةً على نموذج أكبر مضغوط إلى Q2. لا تنزل دون Q4 إلا عندما لا يتسع أي خيار آخر في ذاكرتك.

← جميع النماذجفحص النموذج

هل يمكنني تشغيل Ministral 3 14B؟

يحتاج Ministral 3 14B من Mistral AI إلى نحو 16 GB من RAM عند التكميم الموصى به بدقة 4 بت (تنزيل بحجم 8.5 GB). نفحص عتاد جهازك أدناه — فوراً، ولا شيء يغادر متصفحك. توقّع نحو ~36 tok/s على NVIDIA RTX 3060 12GB.

نقرأ مؤشرات عتاد جهازك…

ملاحظات من الواقع

Ministral 3 14B هو نموذج Mistral متوسط الحجم الصادر في ديسمبر 2025، وهو شبكة كثيفة بـ 14B من المعاملات تتعامل أيضًا مع الرؤية، ما يجعله الخيار الأمثل حين تريد نموذجًا محليًا واحدًا يحاور ويقرأ الصور دون الحاجة إلى التوفيق بين نقطتي تحقّق (checkpoints) منفصلتين. عند تكميم 4-bit يستقر حجمه عند نحو 8.5 GB، أي أكبر بقليل مما تستوعبه بطاقة بسعة 8 GB بأريحية، لكنه يعمل بسلاسة على بطاقة RTX 3060 بسعة 12 GB أو أي جهاز Mac بمعالج Apple Silicon يملك 16 GB من الذاكرة الموحّدة أو أكثر. وإن كنت مضغوطًا في المساحة، فبإمكانك النزول إلى بناء 2-bit ليتقلّص إلى نحو 5.9 GB؛ أما بناء q8 فهو أقرب إلى ~15 GB.

في الاستخدام اليومي يبدو سريعًا قياسًا إلى حجمه. على بطاقة RTX 3060 بسعة 12 GB ستحصل على نحو 36 tok/s عند 4-bit، وهي سرعة تفوق سرعة القراءة بأريحية، بينما ترفعها RTX 4090 إلى ما يقارب ~101 tok/s. ويستقر معالج M-series Max قرب ~41 tok/s. نافذة السياق بسعة 256K هي الرقم اللافت، لكن تعامل معها بوصفها سقفًا لا قيمة افتراضية: فحتى عند 128K ترتفع الذاكرة الإجمالية إلى نحو ~30 GB بمجرد امتلاء الـ KV cache، وهو ما يتجاوز بكثير جهازًا واحدًا بسعة 12 GB أو 16 GB. أبقِ سياق العمل عند بضعة آلاف من الرموز ما لم تكن لديك بطاقة فائضة بسعة 24 GB أو أكثر.

في مقارنته بنظرائه، يتفوّق Ministral 3 14B عمومًا على إخوته الأقدم مثل Mistral 7B وMistral Nemo 12B في المطالبات الأصعب متعددة الخطوات، وذلك ببساطة لكونه أكبر وأحدث، في حين يبقى OLMo 2 13B هو البديل المفتوح البيانات بالكامل إن كانت قابلية إعادة الإنتاج أهم لديك من القدرة الخام. أما ميزته البارزة فعلًا فهي قدرة الرؤية المدمجة عند هذا الحجم مع ملمح سرعة قابل للاستخدام حقًا. والرخصة هي الجزء السهل: Apache 2.0، فيمكنك استخدامه تجاريًا وفي الإنتاج دون أي قيود خاصة بمزوّد بعينه.

المواصفات

المعاملات14B

نافذة السياق256K رمز

المطوِّرMistral AI

الرخصةApache 2.0

تاريخ الإصدار2025-12

الأفضل فيمحادثة, رؤية

الحجم حسب التكميم

التكميم	بت/وزن	حجم التنزيل	الحد الأدنى من RAM	الجودة
Q2_K	3.35	5.9 GB	12 GB	فقدان ملحوظ
Q4_K_Mموصى به	4.85	8.5 GB	16 GB	موصى به
Q5_K_M	5.65	9.9 GB	16 GB	عالية
Q8_0	8.5	14.9 GB	24 GB	شبه أصلية
F16	16	28.0 GB	48 GB	أصلية

الأحجام تقديرات محسوبة من عدد المعاملات × عدد البتات لكل وزن؛ وتختلف نسخ GGUF الفعلية قليلاً. · آخر تحديث للبيانات: 2026-06-11 · كيف نحسب هذه الأرقام →

الذاكرة المطلوبة حسب طول السياق

السياق	ذاكرة KV cache (تقديرياً)	إجمالي الذاكرة (Q4)
4K رمز	~0.7 GB	~9.2 GB
8K رمز	~1.3 GB	~9.8 GB
32K رمز	~5.4 GB	~13.9 GB
128K رمز	~21.6 GB	~30.1 GB

تنمو ذاكرة KV cache مع طول السياق — فالنموذج الذي يتسع عند 4K قد تنفد ذاكرته عند 32K. التقديرات تفترض ذاكرة تخزين بدقة FP16 مع grouped-query attention؛ ويختلف الاستهلاك الفعلي حسب بيئة التشغيل.

السرعة التقديرية حسب العتاد

العتاد	عرض النطاق	السرعة التقريبية
NVIDIA RTX 3060 12GB	360 GB/s	~36 tok/s
NVIDIA RTX 4090 24GB	1008 GB/s	~101 tok/s
Apple M-series (base)	100 GB/s	~10 tok/s
Apple M-series Pro	270 GB/s	~27 tok/s
Apple M-series Max	410 GB/s	~41 tok/s
CPU only (dual-channel DDR5)	60 GB/s	~6 tok/s