كم أحتاج من RAM لتشغيل Qwen3 Coder Next 80B-A3B؟

نحو 64 GB من ذاكرة النظام الإجمالية للنسخة الموصى بها بدقة 4 بت (Q4_K_M)، وهي تنزيل بحجم 48.5 GB. كلما زادت RAM أمكنك استخدام تكميم أعلى جودة أو سياق أطول.

هل يعمل Qwen3 Coder Next 80B-A3B دون GPU مخصص؟

نعم — أدوات مثل Ollama وllama.cpp تشغّله على CPU ما دام يتسع في RAM. وجود GPU أو Apple Silicon يجعل التوليد أسرع بعدة مرات، لكنه اختياري.

أي تكميم من Qwen3 Coder Next 80B-A3B ينبغي أن أنزّله؟

Q4_K_M هو الخيار الأمثل لمعظم المستخدمين — أصغر بنحو 4 أضعاف من الأصل مع خسارة طفيفة في الجودة. اختر Q5 أو Q8 إن كانت لديك RAM وافرة، وQ2 فقط عندما لا يتسع غيره.

هل يمكنني إجراء الضبط الدقيق (fine-tuning) لـ Qwen3 Coder Next 80B-A3B على جهازي؟

يتطلب الضبط الدقيق ذاكرة أكبر بكثير من الاستدلال. يحتاج الضبط الدقيق الكامل لـ Qwen3 Coder Next 80B-A3B إلى نحو 960 GB من ذاكرة GPU، بينما تخفّضه QLoRA إلى نحو 120 GB. لمعظم المستخدمين، يبقى QLoRA على GPU مستأجر هو الخيار العملي.

هل نموذج أكبر بدقة Q2/Q3 أفضل من نموذج أصغر بدقة Q4/Q5؟

غالباً لا. فدون Q3 تتدهور الجودة بشكل حاد — والنموذج الأصغر بدقة Q4_K_M يتفوق عادةً على نموذج أكبر مضغوط إلى Q2. لا تنزل دون Q4 إلا عندما لا يتسع أي خيار آخر في ذاكرتك.

← جميع النماذجفحص النموذج

هل يمكنني تشغيل Qwen3 Coder Next 80B-A3B؟

يحتاج Qwen3 Coder Next 80B-A3B من Alibaba إلى نحو 64 GB من RAM عند التكميم الموصى به بدقة 4 بت (تنزيل بحجم 48.5 GB). نفحص عتاد جهازك أدناه — فوراً، ولا شيء يغادر متصفحك. توقّع نحو ~192 tok/s على Apple M-series Max.

نقرأ مؤشرات عتاد جهازك…

ملاحظات من الواقع

Qwen3 Coder Next 80B-A3B نموذج متخصص في البرمجة مبني بأسلوب Mixture-of-Experts، وهذه البنية هي جوهر الموضوع بالكامل. يضم 80B معاملًا إجماليًا لكنه يُفعّل 3B فقط لكل رمز، لذا يعمل أسرع بكثير مما يوحي به حجمه، مع أنه لا يزال يحتاج إلى ذاكرة تكفي للنموذج الكامل. عند دقة 4-bit يصل حجمه إلى نحو 48.5 GB، وهو ما يستبعد كل بطاقات الرسوميات الاستهلاكية: فهو لا يناسب RTX 4090 بسعة 24 GB، ناهيك عن 3060 بسعة 12 GB. المكان الواقعي له هو جهاز Apple Silicon Mac بذاكرة موحّدة وفيرة، أو محطة عمل بذاكرة نظام 64 GB أو أكثر. خطّط على أساس الحد الأدنى 64 GB، لا على أساس 3B النشطة.

في الاستخدام اليومي يؤتي تصميم MoE ثماره. على Apple M Max يتدفّق بنحو 192 tok/s، وهو ما يبدو فوريًا لإكمال الشيفرة وإعادة الهيكلة، وحتى الاستدلال على المعالج وحده باستخدام ذاكرة DDR5 يحقق نحو 28 tok/s، وهو بطيء لكنه قابل للاستخدام فعليًا لنموذج بهذا الحجم. نافذة السياق 256K هي الميزة الأبرز للعمل عبر مستودعات كاملة، لكن الذاكرة هي العقبة: عند سياق 128K يرتفع الحجم الإجمالي إلى نحو 95.8 GB. ضع ذلك في الحسبان قبل تحميل قاعدة شيفرة ضخمة، لأن ذاكرة KV cache، لا الأوزان، هي ما سيدفعك إلى تجاوز الحد على جهاز بذاكرة 64 GB.

مقارنةً بالبدائل الكثيفة في فئته الوزنية، مثل Llama 3.1 70B، يضحّي هذا النموذج عمومًا بالاتساع الخام مقابل التركيز على البرمجة والسرعة: توجيه MoE يعني أنه يجيب أسرع من نموذج كثيف بحجم 70B بينما يتخصص في الشيفرة بدلًا من المحادثة العامة، حيث تكون نسخ Qwen 3 chat الأصغر خيارًا أنسب. سمته البارزة هي نسبة السرعة إلى الحجم هذه، إذ يحقق توليدًا شبه فوري من نموذج بفئة 80B. والمكافأة العملية هي الرخصة: Apache 2.0، فيمكنك استخدامه بحرية في العمل التجاري والإنتاجي دون قيود خاصة بمزوّد معين تحتاج إلى قراءتها أولًا.

المواصفات

المعاملات80B (3B نشطة)

نافذة السياق256K رمز

المطوِّرAlibaba

الرخصةApache 2.0

تاريخ الإصدار2026-02

الأفضل فيبرمجة

الحجم حسب التكميم

التكميم	بت/وزن	حجم التنزيل	الحد الأدنى من RAM	الجودة
Q2_K	3.35	33.5 GB	48 GB	فقدان ملحوظ
Q4_K_Mموصى به	4.85	48.5 GB	64 GB	موصى به
Q5_K_M	5.65	56.5 GB	96 GB	عالية
Q8_0	8.5	85.0 GB	128 GB	شبه أصلية
F16	16	160.0 GB	256 GB	أصلية

الأحجام تقديرات محسوبة من عدد المعاملات × عدد البتات لكل وزن؛ وتختلف نسخ GGUF الفعلية قليلاً. · آخر تحديث للبيانات: 2026-06-11 · كيف نحسب هذه الأرقام →

الذاكرة المطلوبة حسب طول السياق

السياق	ذاكرة KV cache (تقديرياً)	إجمالي الذاكرة (Q4)
4K رمز	~1.5 GB	~50.0 GB
8K رمز	~3.0 GB	~51.5 GB
32K رمز	~11.8 GB	~60.3 GB
128K رمز	~47.3 GB	~95.8 GB

تنمو ذاكرة KV cache مع طول السياق — فالنموذج الذي يتسع عند 4K قد تنفد ذاكرته عند 32K. التقديرات تفترض ذاكرة تخزين بدقة FP16 مع grouped-query attention؛ ويختلف الاستهلاك الفعلي حسب بيئة التشغيل.

السرعة التقديرية حسب العتاد

العتاد	عرض النطاق	السرعة التقريبية
NVIDIA RTX 3060 12GB	360 GB/s	لا يتسع في VRAM
NVIDIA RTX 4090 24GB	1008 GB/s	لا يتسع في VRAM
Apple M-series (base)	100 GB/s	~47 tok/s
Apple M-series Pro	270 GB/s	~126 tok/s
Apple M-series Max	410 GB/s	~192 tok/s
CPU only (dual-channel DDR5)	60 GB/s	~28 tok/s