Question 1

Сколько RAM нужно для запуска Phi-4 Reasoning Vision 15B?

Accepted Answer

Около 16 GB общей памяти для рекомендуемой 4-битной сборки (Q4_K_M) — это загрузка размером 9.1 GB. Больше RAM позволит использовать квантизации повыше качеством или более длинный контекст.

Question 2

Запустится ли Phi-4 Reasoning Vision 15B без дискретной видеокарты (GPU)?

Accepted Answer

Да — Ollama и llama.cpp запускают её на CPU, если модель помещается в RAM. GPU или Apple Silicon ускоряют генерацию в несколько раз, но это необязательно.

Question 3

Какую квантизацию Phi-4 Reasoning Vision 15B скачать?

Accepted Answer

Q4_K_M — золотая середина почти для всех: примерно в 4 раза меньше оригинала при минимальной потере качества. Берите Q5 или Q8, если памяти с запасом, а Q2 — только когда больше ничего не помещается.

Question 4

Могу ли я дообучить Phi-4 Reasoning Vision 15B на своей машине?

Accepted Answer

Файнтюнинг требует куда больше памяти, чем инференс. Полное дообучение Phi-4 Reasoning Vision 15B занимает примерно 180 GB памяти GPU, а QLoRA снижает требования примерно до 23 GB. Для большинства практичный путь — QLoRA на арендованном GPU.

Question 5

Что лучше: модель побольше в Q2/Q3 или поменьше в Q4/Q5?

Accepted Answer

Обычно второе. Ниже Q3 качество резко падает — модель поменьше в Q4_K_M, как правило, обходит более крупную, ужатую в Q2. Опускайтесь ниже Q4 только тогда, когда в память не помещается ничего другого.

Квантизация	Бит/вес	Загрузка	Мин. RAM	Качество
Q2_K	3.35	6.3 GB	12 GB	Заметная потеря
Q4_K_MРекомендуется	4.85	9.1 GB	16 GB	Рекомендуется
Q5_K_M	5.65	10.6 GB	16 GB	Высокое
Q8_0	8.5	15.9 GB	24 GB	Почти оригинал
F16	16	30.0 GB	48 GB	Оригинал

Контекст	KV-кэш (оценка)	Всего памяти (Q4)
4K токенов	~0.7 GB	~9.8 GB
8K токенов	~1.4 GB	~10.5 GB

Железо	Пропускная способность	~Скорость
NVIDIA RTX 3060 12GB	360 GB/s	~34 tok/s
NVIDIA RTX 4090 24GB	1008 GB/s	~94 tok/s
Apple M-series (base)	100 GB/s	~9 tok/s
Apple M-series Pro	270 GB/s	~25 tok/s
Apple M-series Max	410 GB/s	~38 tok/s
CPU only (dual-channel DDR5)	60 GB/s	~6 tok/s

Могу ли я запустить Phi-4 Reasoning Vision 15B?

Частые вопросы