← Tous les modèlesTEST DU MODÈLE

Puis-je faire tourner Nemotron 3 Super 120B-A12B ?

Nemotron 3 Super 120B-A12B de NVIDIA demande environ 96 GB de RAM avec la quantisation 4 bits recommandée (72.8 GB à télécharger). Votre matériel est vérifié ci-dessous — instantanément, rien ne quitte votre navigateur. Comptez environ ~48 tok/s sur un Apple M-series Max.

Lecture des signaux matériels…

Caractéristiques

Paramètres120B (12B actifs)
Fenêtre de contexte1M tokens
ÉditeurNVIDIA
LicenceNVIDIA Open Model
Sortie2026-03
Idéal pourChat, Raisonnement, Code

Taille selon la quantisation

QuantisationBits/poidsTéléchargementRAM min.Qualité
Q2_K3.3550.3 GB96 GBPerte sensible
Q4_K_MRecommandée4.8572.8 GB96 GBRecommandée
Q5_K_M5.6584.8 GB128 GBÉlevée
Q8_08.5127.5 GB192 GBQuasi originale
F1616240.0 GB256 GBOriginale

Les tailles sont estimées à partir du nombre de paramètres × bits par poids ; les builds GGUF réels varient légèrement. · Données mises à jour: 2026-06-11 · Comment nous calculons ces chiffres →

Mémoire nécessaire selon la longueur de contexte

ContexteCache KV (est.)Mémoire totale (Q4)
4K tokens~1.8 GB~74.6 GB
8K tokens~3.5 GB~76.3 GB
32K tokens~14.2 GB~87.0 GB
128K tokens~56.7 GB~129.5 GB

Le cache KV grossit avec la longueur du contexte — un modèle qui tient à 4K peut manquer de mémoire à 32K. Les estimations supposent un cache FP16 avec grouped-query attention ; l'usage réel varie selon le runtime.

Vitesse estimée selon le matériel

MatérielBande passante~Vitesse
NVIDIA RTX 3060 12GB360 GB/sNe tient pas dans la VRAM
NVIDIA RTX 4090 24GB1008 GB/sNe tient pas dans la VRAM
Apple M-series (base)100 GB/s~12 tok/s
Apple M-series Pro270 GB/s~32 tok/s
Apple M-series Max410 GB/s~48 tok/s
CPU only (dual-channel DDR5)60 GB/s~7 tok/s

La génération de tokens est limitée par la bande passante mémoire : tok/s ≈ bande passante × 0,85 ÷ taille du modèle en Q4. Les chiffres réels varient selon le runtime et la longueur du contexte.

Le faire tourner en local

Le chemin le plus simple est Ollama — une commande et vous discutez :

ollama run nemotron-3-super:120b

Questions fréquentes

Configuration requise pour Nemotron 3 Super 120B-A12B — Puis-je le faire tourner en local ?