هل يمكنني تشغيل Qwen3 Coder Next 80B-A3B؟
يحتاج Qwen3 Coder Next 80B-A3B من Alibaba إلى نحو 64 GB من RAM عند التكميم الموصى به بدقة 4 بت (تنزيل بحجم 48.5 GB). نفحص عتاد جهازك أدناه — فوراً، ولا شيء يغادر متصفحك. توقّع نحو ~192 tok/s على Apple M-series Max.
نقرأ مؤشرات عتاد جهازك…
المواصفات
الحجم حسب التكميم
| التكميم | بت/وزن | حجم التنزيل | الحد الأدنى من RAM | الجودة |
|---|---|---|---|---|
| Q2_K | 3.35 | 33.5 GB | 48 GB | فقدان ملحوظ |
| Q4_K_Mموصى به | 4.85 | 48.5 GB | 64 GB | موصى به |
| Q5_K_M | 5.65 | 56.5 GB | 96 GB | عالية |
| Q8_0 | 8.5 | 85.0 GB | 128 GB | شبه أصلية |
| F16 | 16 | 160.0 GB | 256 GB | أصلية |
الأحجام تقديرات محسوبة من عدد المعاملات × عدد البتات لكل وزن؛ وتختلف نسخ GGUF الفعلية قليلاً. · آخر تحديث للبيانات: 2026-06-11 · كيف نحسب هذه الأرقام →
الذاكرة المطلوبة حسب طول السياق
| السياق | ذاكرة KV cache (تقديرياً) | إجمالي الذاكرة (Q4) |
|---|---|---|
| 4K رمز | ~1.5 GB | ~50.0 GB |
| 8K رمز | ~3.0 GB | ~51.5 GB |
| 32K رمز | ~11.8 GB | ~60.3 GB |
| 128K رمز | ~47.3 GB | ~95.8 GB |
تنمو ذاكرة KV cache مع طول السياق — فالنموذج الذي يتسع عند 4K قد تنفد ذاكرته عند 32K. التقديرات تفترض ذاكرة تخزين بدقة FP16 مع grouped-query attention؛ ويختلف الاستهلاك الفعلي حسب بيئة التشغيل.
السرعة التقديرية حسب العتاد
| العتاد | عرض النطاق | السرعة التقريبية |
|---|---|---|
| NVIDIA RTX 3060 12GB | 360 GB/s | لا يتسع في VRAM |
| NVIDIA RTX 4090 24GB | 1008 GB/s | لا يتسع في VRAM |
| Apple M-series (base) | 100 GB/s | ~47 tok/s |
| Apple M-series Pro | 270 GB/s | ~126 tok/s |
| Apple M-series Max | 410 GB/s | ~192 tok/s |
| CPU only (dual-channel DDR5) | 60 GB/s | ~28 tok/s |
توليد الرموز محكوم بعرض نطاق الذاكرة: tok/s ≈ عرض النطاق × 0.85 ÷ حجم النموذج عند Q4. وتختلف الأرقام الفعلية حسب بيئة التشغيل وطول السياق.
شغّله محلياً
أسهل طريق هو Ollama — أمر واحد وتبدأ المحادثة:
ollama run qwen3-coder-next