Question 1

DeepSeek-OCRの実行に必要なRAMはどれくらいですか？

Accepted Answer

推奨の4bit（Q4_K_M）版なら、システム全体で約4 GBのメモリが必要です（ダウンロードは1.8 GB）。RAMに余裕があれば、より高品質な量子化や長いコンテキストも使えます。

Question 2

DeepSeek-OCRは専用GPUなしでも動きますか？

Accepted Answer

はい — RAMに収まる限り、Ollamaやllama.cppなどのツールがCPUで動かしてくれます。GPUやApple Siliconがあれば生成は数倍速くなりますが、必須ではありません。

Question 3

DeepSeek-OCRはどの量子化をダウンロードすべきですか？

Accepted Answer

ほとんどの人にはQ4_K_Mが最適です — オリジナルの約4分の1のサイズで、品質低下はごくわずか。RAMに余裕があればQ5やQ8を、どうしても入らないときだけQ2を選びましょう。

Question 4

DeepSeek-OCRを自分のマシンでファインチューニングできますか？

Accepted Answer

ファインチューニングは推論よりはるかに多くのメモリを必要とします。DeepSeek-OCRのフルファインチューニングには約36 GBのGPUメモリが必要ですが、QLoRAなら約5 GBまで抑えられます。多くの人にとっては、レンタルGPUでのQLoRAが現実的な選択肢です。

Question 5

Q2/Q3の大きいモデルと、Q4/Q5の小さいモデル、どちらが良いですか？

Accepted Answer

たいていの場合は後者です。Q3を下回ると品質が急激に劣化します — Q4_K_Mの小さいモデルのほうが、Q2に詰め込んだ大きいモデルより良い結果を出すのが普通です。Q4未満は、ほかに何も入らないときだけ選びましょう。

量子化	ビット/重み	ダウンロード	必要RAM	品質
Q2_K	3.35	1.3 GB	4 GB	劣化が目立つ
Q4_K_M推奨	4.85	1.8 GB	4 GB	推奨
Q5_K_M	5.65	2.1 GB	6 GB	高品質
Q8_0	8.5	3.2 GB	6 GB	ほぼ原品質
F16	16	6.0 GB	12 GB	オリジナル

コンテキスト	KVキャッシュ（推定）	合計メモリ（Q4）
4K トークン	~0.3 GB	~2.1 GB
8K トークン	~0.7 GB	~2.5 GB

DeepSeek-OCRは動く？

よくある質問