Puis-je faire tourner DeepSeek-OCR ?
DeepSeek-OCR de DeepSeek demande environ 4 GB de RAM avec la quantisation 4 bits recommandée (1.8 GB à télécharger). Votre matériel est vérifié ci-dessous — instantanément, rien ne quitte votre navigateur. Comptez environ ~886 tok/s sur un NVIDIA RTX 3060 12GB.
Lecture des signaux matériels…
Caractéristiques
Taille selon la quantisation
| Quantisation | Bits/poids | Téléchargement | RAM min. | Qualité |
|---|---|---|---|---|
| Q2_K | 3.35 | 1.3 GB | 4 GB | Perte sensible |
| Q4_K_MRecommandée | 4.85 | 1.8 GB | 4 GB | Recommandée |
| Q5_K_M | 5.65 | 2.1 GB | 6 GB | Élevée |
| Q8_0 | 8.5 | 3.2 GB | 6 GB | Quasi originale |
| F16 | 16 | 6.0 GB | 12 GB | Originale |
Les tailles sont estimées à partir du nombre de paramètres × bits par poids ; les builds GGUF réels varient légèrement. · Données mises à jour: 2026-06-11 · Comment nous calculons ces chiffres →
Mémoire nécessaire selon la longueur de contexte
| Contexte | Cache KV (est.) | Mémoire totale (Q4) |
|---|---|---|
| 4K tokens | ~0.3 GB | ~2.1 GB |
| 8K tokens | ~0.7 GB | ~2.5 GB |
Le cache KV grossit avec la longueur du contexte — un modèle qui tient à 4K peut manquer de mémoire à 32K. Les estimations supposent un cache FP16 avec grouped-query attention ; l'usage réel varie selon le runtime.
Vitesse estimée selon le matériel
| Matériel | Bande passante | ~Vitesse |
|---|---|---|
| NVIDIA RTX 3060 12GB | 360 GB/s | ~886 tok/s |
| NVIDIA RTX 4090 24GB | 1008 GB/s | ~2479 tok/s |
| Apple M-series (base) | 100 GB/s | ~246 tok/s |
| Apple M-series Pro | 270 GB/s | ~664 tok/s |
| Apple M-series Max | 410 GB/s | ~1009 tok/s |
| CPU only (dual-channel DDR5) | 60 GB/s | ~148 tok/s |
La génération de tokens est limitée par la bande passante mémoire : tok/s ≈ bande passante × 0,85 ÷ taille du modèle en Q4. Les chiffres réels varient selon le runtime et la longueur du contexte.
Le faire tourner en local
Le chemin le plus simple est Ollama — une commande et vous discutez :
ollama run deepseek-ocr:3bSources et téléchargements
Ollama Library
Téléchargez et lancez le modèle avec une seule commande.
ollama.comHugging Face
Poids du modèle, fichiers et détails de la licence.
huggingface.coDépôt GitHub officiel
Code source, releases et issues de DeepSeek.
github.comDeepSeek — page officielle
Page officielle et documentation de DeepSeek.
deepseek.com