← モデル一覧へデバイスチェック

NVIDIA RTX 3060で動くLLMは?

NVIDIA RTX 3060はVRAM 12 GBを搭載し、メモリ帯域幅は約360 GB/sです。以下は、カタログの中で収まる全モデルと生成速度の目安です。 動く最大のモデルはPhi-4 Reasoning Vision 15B — およそ ~34 tok/s が目安です。

スペック

メモリVRAM 12 GB
帯域幅~360 GB/s
メモリの種類専用VRAM
公開日2021-02

NVIDIA RTX 3060で動くモデル

38 / 73 モデル
モデルダウンロード(Q4)収まる?速度目安
Phi-4 Reasoning Vision 15B9.1 GB動く~34 tok/s
Qwen 3 14B9.0 GB動く~34 tok/s
DeepSeek R1 14B9.0 GB動く~34 tok/s
Phi-4 14B8.9 GB動く~34 tok/s
Ministral 3 14B8.5 GB動く~36 tok/s
OLMo 2 13B8.3 GB動く~37 tok/s
Gemma 3 12B7.4 GB動く~41 tok/s
Mistral Nemo 12B7.4 GB動く~41 tok/s
Gemma 4 12B7.3 GB動く~42 tok/s
Mellum 2 12B-A2.5B7.3 GB動く~202 tok/s
Qwen 3.5 9B5.5 GB動く~56 tok/s
GLM-4.6V-Flash5.5 GB動く~56 tok/s
Qwen 2.5 VL 7B5.0 GB動く~61 tok/s
Qwen 3 8B5.0 GB動く~62 tok/s
Granite 3.3 8B5.0 GB動く~62 tok/s
Llama 3.1 8B4.9 GB動く~63 tok/s
DeepSeek R1 8B4.9 GB動く~63 tok/s
Gemma 4 E4B4.9 GB動く~112 tok/s
Qwen3-VL 8B4.9 GB動く~63 tok/s
Ministral 3 8B4.9 GB動く~63 tok/s
Gemma 3n E4B4.7 GB動く~126 tok/s
Qwen 2.5 Coder 7B4.6 GB動く~66 tok/s
DeepSeek R1 7B4.6 GB動く~66 tok/s
Mistral 7B4.4 GB動く~70 tok/s
Gemma 4 E2B3.1 GB動く~219 tok/s
Gemma 3 4B2.6 GB動く~117 tok/s
Qwen 3 4B2.4 GB動く~126 tok/s
Qwen 3.5 4B2.4 GB動く~126 tok/s
Phi-4 Mini 3.8B2.3 GB動く~133 tok/s
Llama 3.2 3B1.9 GB動く~158 tok/s
DeepSeek-OCR1.8 GB動く~886 tok/s
Ministral 3 3B1.8 GB動く~168 tok/s
DeepSeek R1 1.5B1.1 GB動く~280 tok/s
Qwen 3 1.7B1.0 GB動く~297 tok/s
SmolLM2 1.7B1.0 GB動く~297 tok/s
Llama 3.2 1B0.7 GB動く~421 tok/s
Gemma 3 1B0.6 GB動く~505 tok/s
Qwen 3 0.6B0.4 GB動く~841 tok/s

GPUでフル動作させるには、4bitビルドがVRAMに収まる必要があります。収まらないモデルもCPU+システムRAMで動かせますが、数倍遅くなります。 · データ更新日: 2026-06-11 · 数値の算出方法 →

よくある質問