كم أحتاج من RAM لتشغيل Qwen 3.5 4B؟

نحو 6 GB من ذاكرة النظام الإجمالية للنسخة الموصى بها بدقة 4 بت (Q4_K_M)، وهي تنزيل بحجم 2.4 GB. كلما زادت RAM أمكنك استخدام تكميم أعلى جودة أو سياق أطول.

هل يعمل Qwen 3.5 4B دون GPU مخصص؟

نعم — أدوات مثل Ollama وllama.cpp تشغّله على CPU ما دام يتسع في RAM. وجود GPU أو Apple Silicon يجعل التوليد أسرع بعدة مرات، لكنه اختياري.

أي تكميم من Qwen 3.5 4B ينبغي أن أنزّله؟

Q4_K_M هو الخيار الأمثل لمعظم المستخدمين — أصغر بنحو 4 أضعاف من الأصل مع خسارة طفيفة في الجودة. اختر Q5 أو Q8 إن كانت لديك RAM وافرة، وQ2 فقط عندما لا يتسع غيره.

هل يمكنني إجراء الضبط الدقيق (fine-tuning) لـ Qwen 3.5 4B على جهازي؟

يتطلب الضبط الدقيق ذاكرة أكبر بكثير من الاستدلال. يحتاج الضبط الدقيق الكامل لـ Qwen 3.5 4B إلى نحو 48 GB من ذاكرة GPU، بينما تخفّضه QLoRA إلى نحو 6 GB. لمعظم المستخدمين، يبقى QLoRA على GPU مستأجر هو الخيار العملي.

هل نموذج أكبر بدقة Q2/Q3 أفضل من نموذج أصغر بدقة Q4/Q5؟

غالباً لا. فدون Q3 تتدهور الجودة بشكل حاد — والنموذج الأصغر بدقة Q4_K_M يتفوق عادةً على نموذج أكبر مضغوط إلى Q2. لا تنزل دون Q4 إلا عندما لا يتسع أي خيار آخر في ذاكرتك.

← جميع النماذجفحص النموذج

هل يمكنني تشغيل Qwen 3.5 4B؟

يحتاج Qwen 3.5 4B من Alibaba إلى نحو 6 GB من RAM عند التكميم الموصى به بدقة 4 بت (تنزيل بحجم 2.4 GB). نفحص عتاد جهازك أدناه — فوراً، ولا شيء يغادر متصفحك. توقّع نحو ~126 tok/s على NVIDIA RTX 3060 12GB.

نقرأ مؤشرات عتاد جهازك…

ملاحظات من الواقع

Qwen 3.5 4B نموذج كثيف صغير مصمَّم لمن يريد مساعداً محلياً قادراً لا يكاد يُثقل على عتاده. بكمّنة 4-bit يبلغ حجمه نحو 2.4 GB، فيتسع في أي بطاقة GPU حديثة تقريباً مع هامش مريح، ويعمل بسلاسة ضمن الذاكرة الموحَّدة على أجهزة Mac بمعالج Apple Silicon، والحد الأدنى من الذاكرة البالغ 6 GB يعني أن حتى حاسوباً محمولاً قديماً يستطيع استضافته. كما أنه يتعامل مع الرؤية وليس المحادثة فقط، وهو أمر غير معتاد في هذا الحجم. ورخصة Apache 2.0 تعني أنه يمكنك استخدامه تجارياً وفي الإنتاج دون أي قيود.

في الاستخدام اليومي يتسم بالسرعة. على بطاقة RTX 4090 سترى نحو 353 رمزاً في الثانية، وبطاقة RTX 3060 المتوسطة لا تزال تدفع نحو 126 tok/s، وكلاهما أسرع بكثير مما تستطيع قراءته. ويقترب معالج M-series Max من 144 tok/s، وحتى المعالج المركزي وحده على ذاكرة DDR5 يحقق نحو 21 tok/s إن كنت صبوراً. ونافذة السياق البالغة 256K سخيّة، لكن تعامل معها كهامش احتياطي لا كإعداد افتراضي. فالذاكرة ترتفع بحدّة كلما ملأتها: عند سياق 128K يصل الاستهلاك الكلي إلى نحو 14.7 GB، وهو ما سيفيض عن معظم البطاقات الاستهلاكية، لذا أبقِ سياق العمل متواضعاً ما لم تكن لديك ذاكرة وفيرة.

في عائلته نفسها يقع فوق نموذجَي Qwen 3 1.7B و0.6B الصغيرين بوضوح، وهما أنسب للهواتف والاستخدام المدمَج منهما لأن يكونا مساعدك الرئيسي. ومقارنةً بـ Phi-4 Mini 3.8B، يبدو Qwen 3.5 4B أوسع نطاقاً عموماً بفضل دعمه للرؤية وسياقه الأطول، بينما يميل Phi-4 Mini إلى الصمود في الاستدلال المحدَّد بدقة. والسمة البارزة هنا هي قيمة هذا الحجم الصغير: نموذج متعدد الوسائط بحجم 4B يعمل بسرعة على عتاد متواضع وتحت رخصة متساهلة تماماً تركيبة نادرة، وهو ما يجعله خياراً افتراضياً سهلاً لإعداد محلي خفيف.

المواصفات

المعاملات4B

نافذة السياق256K رمز

المطوِّرAlibaba

الرخصةApache 2.0

تاريخ الإصدار2026-03

الأفضل فيمحادثة, رؤية

الحجم حسب التكميم

التكميم	بت/وزن	حجم التنزيل	الحد الأدنى من RAM	الجودة
Q2_K	3.35	1.7 GB	4 GB	فقدان ملحوظ
Q4_K_Mموصى به	4.85	2.4 GB	6 GB	موصى به
Q5_K_M	5.65	2.8 GB	6 GB	عالية
Q8_0	8.5	4.3 GB	8 GB	شبه أصلية
F16	16	8.0 GB	12 GB	أصلية

الأحجام تقديرات محسوبة من عدد المعاملات × عدد البتات لكل وزن؛ وتختلف نسخ GGUF الفعلية قليلاً. · آخر تحديث للبيانات: 2026-06-11 · كيف نحسب هذه الأرقام →

الذاكرة المطلوبة حسب طول السياق

السياق	ذاكرة KV cache (تقديرياً)	إجمالي الذاكرة (Q4)
4K رمز	~0.4 GB	~2.8 GB
8K رمز	~0.8 GB	~3.2 GB
32K رمز	~3.1 GB	~5.5 GB
128K رمز	~12.3 GB	~14.7 GB

تنمو ذاكرة KV cache مع طول السياق — فالنموذج الذي يتسع عند 4K قد تنفد ذاكرته عند 32K. التقديرات تفترض ذاكرة تخزين بدقة FP16 مع grouped-query attention؛ ويختلف الاستهلاك الفعلي حسب بيئة التشغيل.

السرعة التقديرية حسب العتاد

العتاد	عرض النطاق	السرعة التقريبية
NVIDIA RTX 3060 12GB	360 GB/s	~126 tok/s
NVIDIA RTX 4090 24GB	1008 GB/s	~353 tok/s
Apple M-series (base)	100 GB/s	~35 tok/s
Apple M-series Pro	270 GB/s	~95 tok/s
Apple M-series Max	410 GB/s	~144 tok/s
CPU only (dual-channel DDR5)	60 GB/s	~21 tok/s