Question 1

Mistral Small 4 119B çalıştırmak için ne kadar RAM gerekir?

Accepted Answer

Önerilen 4-bit (Q4_K_M) sürüm için yaklaşık 96 GB toplam sistem belleği gerekir; indirme boyutu 72.1 GB'dır. Daha fazla RAM, daha kaliteli nicemlemeler veya daha uzun bağlam kullanmanı sağlar.

Question 2

Mistral Small 4 119B ekran kartı olmadan çalışır mı?

Accepted Answer

Evet — Ollama ve llama.cpp gibi araçlar, RAM'e sığdığı sürece modeli CPU üzerinde çalıştırır. GPU veya Apple Silicon üretimi kat kat hızlandırır ama zorunlu değildir.

Question 3

Mistral Small 4 119B için hangi nicemlemeyi indirmeliyim?

Accepted Answer

Q4_K_M neredeyse herkes için en iyi denge — orijinalden yaklaşık 4 kat küçük, kalite kaybı minimum. Bol RAM'in varsa Q5 veya Q8 seç; Q2'yi sadece başka hiçbir şey sığmıyorsa kullan.

Question 4

Mistral Small 4 119B modelini kendi makinemde fine-tune edebilir miyim?

Accepted Answer

Fine-tuning, çıkarımdan çok daha fazla bellek ister. Mistral Small 4 119B için tam fine-tuning yaklaşık 1428 GB GPU belleği gerektirir; QLoRA bunu yaklaşık 179 GB'a indirir. Çoğu kişi için pratik yol, kiralık GPU üzerinde QLoRA'dır.

Question 5

Q2/Q3'te büyük model mi, Q4/Q5'te küçük model mi daha iyi?

Accepted Answer

Genellikle hayır. Q3'ün altında kalite hızla bozulur — Q4_K_M'deki küçük bir model, Q2'ye sıkıştırılmış büyük modeli çoğunlukla geçer. Q4'ün altına yalnızca belleğine başka hiçbir şey sığmıyorsa in.

Nicemleme	Bit/ağırlık	İndirme	Min RAM	Kalite
Q2_K	3.35	49.8 GB	64 GB	Belirgin kayıp
Q4_K_MÖnerilen	4.85	72.1 GB	96 GB	Önerilen
Q5_K_M	5.65	84.0 GB	128 GB	Yüksek
Q8_0	8.5	126.4 GB	192 GB	Orijinale yakın
F16	16	238.0 GB	256 GB	Orijinal

Bağlam	KV önbelleği (tahmini)	Toplam bellek (Q4)
4K token	~1.8 GB	~73.9 GB
8K token	~3.5 GB	~75.6 GB
32K token	~14.1 GB	~86.2 GB
128K token	~56.5 GB	~128.6 GB

Donanım	Bant genişliği	~Hız
NVIDIA RTX 3060 12GB	360 GB/s	VRAM'e sığmaz
NVIDIA RTX 4090 24GB	1008 GB/s	VRAM'e sığmaz
Apple M-series (base)	100 GB/s	~22 tok/s
Apple M-series Pro	270 GB/s	~58 tok/s
Apple M-series Max	410 GB/s	~88 tok/s
CPU only (dual-channel DDR5)	60 GB/s	~13 tok/s

Mistral Small 4 119B çalıştırabilir miyim?

Sık sorulan sorular