← Alle ModelleMODELL-CHECK

Kann ich Granite 3.3 8B lokal ausführen?

Granite 3.3 8B von IBM benötigt bei der empfohlenen 4-Bit-Quantisierung rund 8 GB RAM (5.0 GB Download). Ihre Hardware wird unten geprüft — sofort, und nichts verlässt Ihren Browser.

Hardware-Signale werden ausgelesen…

Technische Daten

Parameter8.2B
Kontextfenster128K Token
AnbieterIBM
LizenzApache 2.0
Veröffentlicht2025-05
Am besten fürChat

Größe nach Quantisierung

QuantisierungBits/GewichtDownloadMin. RAMQualität
Q2_K3.353.4 GB6 GBSpürbarer Verlust
Q4_K_MEmpfohlen4.855.0 GB8 GBEmpfohlen
Q5_K_M5.655.8 GB12 GBHoch
Q8_08.58.7 GB16 GBNahezu Original
F161616.4 GB24 GBOriginal

Die Größen sind Schätzungen aus Parameterzahl × Bits pro Gewicht; echte GGUF-Builds weichen leicht ab.

Lokal ausführen

Der einfachste Weg ist Ollama — ein Befehl und Sie chatten:

ollama run granite3.3

Häufig gestellte Fragen