Vai al contenuto principale
Modello pronto per CPU

Gemma 4 E4B

40 GPU consumer possono eseguire Gemma 4 E4B in Q4 nativamente. Soglie VRAM precise e benchmark qui sotto.

40 GPU compatibili
4B parametri
128K contesto
Top pick
RTX 5090 · 32 GB VRAM runs Q4 natively

Prices and availability may change · affiliate link

Javier Morales
Javier Morales Specialista hardware IA — 8 anni di esperienza
GitHub: github.com/javier-morales-ia

llama.cpp 0.2.x · CUDA 12 · ROCm 6 · aggiornato mensilmente · metodologia →

Contesto di esecuzione

ARCHITETTURA TRANSFORMER
CONTESTO 128K TOKENS
QUANTIZZAZIONE 4-BIT GGUF
FORNITORE Google
LICENZA Apache 2.0
Decisione hardware

Questo modello richiede unaGPU entry-level (8 GB VRAM)

Minimo

GTX 1660 Super

Funziona in Q4 — utilizzabile, con qualche attesa

6 GB VRAM
Vedi configurazione compatibile
Bilanciato

RTX 4060 Ti 16GB

Miglior rapporto valore/prestazioni per uso quotidiano

16 GB VRAM
Vedi configurazione compatibile
Ottimale

RTX 5090

Qualita massima, inferenza piu rapida

32 GB VRAM
Vedi configurazione compatibile

Compatible GPUs for Gemma 4 E4B

Le migliori opzioni per compatibilita, margine VRAM e valore: prezzi e disponibilita possono cambiare.

RTX 5090
32 GB VRAM · Q4 nativo Amazon

RTX 5090

0.0 (0 recensioni)

Pro

  • Runs Gemma 4 E4B at Q4 natively
  • 32 GB VRAM — adequate headroom
RTX 4090
24 GB VRAM · Q4 nativo Amazon

RTX 4090

4.8 (2,100 recensioni)

Pro

  • Runs Gemma 4 E4B at Q4 natively
  • 24 GB VRAM — adequate headroom
M4 Ultra
128 GB VRAM · Q4 nativo Amazon

M4 Ultra

0.0 (0 recensioni)

Pro

  • Runs Gemma 4 E4B at Q4 natively
  • 128 GB VRAM — adequate headroom

Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.

*Prezzi e disponibilita possono cambiare. Alcuni link sono affiliati.

Requisiti di sistema

VRAM GPU 2.2 GB GPU entry-level
RAM di sistema 16 GB DDR4/DDR5
Archiviazione 2 GB Q4 · SSD consigliato
CPU i7 → 14 tok/s Funziona senza GPU

VRAM per quantizzazione

Quantizzazione VRAM necessaria Spazio su disco Qualita
FP16 (qualita massima) 8.8 GB 8 GB Massima
Q8 (alta qualita) 4.4 GB 4 GB Quasi senza perdita
Q4 (consigliato) Miglior equilibrio 2.2 GB 2 GB Consigliata
Q2 (minimo) 1.1 GB 1 GB Perdita di qualita

Dettagli modello

Sviluppatore Google
Parametri 4B
Finestra di contesto 128,000 token
Licenza Apache 2.0
Casi d uso chat, vision, reasoning, coding
Rilasciato 2026-04

Installa con Ollama

ollama run gemma4:e4b

Hugging Face

google/gemma-4-E4B
Vedi su HF →
Requisiti tecnici

La tua GPU puo eseguire Gemma 4 E4B?

Gemma 4 E4B richiede <strong class="text-primary-container">2.2 GB di VRAM</strong> in Q4. 40 GPU consumer raggiungono questa soglia. Sotto 8 GB o 0.20000000000000018 GB incontrerai una latenza di offload significativa.

1.1GB Minimo critico
2.2GB Ottimale Q4
4.4GB Alta qualita Q8
8.8GB Massimo FP16

Matrice prestazioni hardware

40 Q4 nativo · 0 offload

Unita GPU VRAM Compatibilita Velocita stimata Azione
RTX 5090 32GB Ottimale 189 tok/s Calcola →
RTX 4090 24GB Ottimale 174 tok/s Calcola →
M4 Ultra 128GB Ottimale 178 tok/s Calcola →
RTX 5080 16GB Ottimale 172 tok/s Calcola →
M3 Ultra 192GB Ottimale 150 tok/s Calcola →
RTX 4080 Super 16GB Ottimale 134 tok/s Calcola →
RTX 5070 Ti 16GB Ottimale 160 tok/s Calcola →
RTX 3090 24GB Ottimale 164 tok/s Calcola →
M4 Max 48GB 48GB Ottimale 102 tok/s Calcola →
RX 7900 XTX 24GB Ottimale 170 tok/s Calcola →
M4 Max 36GB 36GB Ottimale 102 tok/s Calcola →
RTX 4070 Ti Super 16GB Ottimale 121 tok/s Calcola →
RTX 3080 Ti 12GB Ottimale 151 tok/s Calcola →
RX 7900 XT 20GB Ottimale 142 tok/s Calcola →
RTX 5070 12GB Ottimale 120 tok/s Calcola →
RTX 3080 10GB Ottimale 131 tok/s Calcola →
M4 Pro 24GB Ottimale 54 tok/s Calcola →
RX 7800 XT 16GB Ottimale 110 tok/s Calcola →
RX 6800 XT 16GB Ottimale 89 tok/s Calcola →
RTX 4070 12GB Ottimale 90 tok/s Calcola →
RTX 4060 Ti 16GB 16GB Ottimale 54 tok/s Calcola →
RX 7700 XT 12GB Ottimale 76 tok/s Calcola →
RTX 3070 Ti 8GB Ottimale 107 tok/s Calcola →
RTX 4060 Ti 8GB Ottimale 54 tok/s Calcola →
RTX 3070 8GB Ottimale 79 tok/s Calcola →
RX 6700 XT 12GB Ottimale 66 tok/s Calcola →
M3 Pro 18GB Ottimale 32 tok/s Calcola →
RTX 3060 Ti 8GB Ottimale 79 tok/s Calcola →
RTX 2080 Ti 11GB Ottimale 79 tok/s Calcola →
RTX 3060 12GB Ottimale 65 tok/s Calcola →
M2 Pro 16GB Ottimale 39 tok/s Calcola →
RTX 4060 8GB Ottimale 49 tok/s Calcola →
Arc A770 16GB 16GB Ottimale 40 tok/s Calcola →
M1 Pro 16GB Ottimale 37 tok/s Calcola →
RX 7600 8GB Ottimale 51 tok/s Calcola →
RX 6600 XT 8GB Ottimale 48 tok/s Calcola →
Arc A750 8GB 8GB Ottimale 36 tok/s Calcola →
RX 6600 8GB Ottimale 44 tok/s Calcola →
RTX 3050 8GB 8GB Ottimale 39 tok/s Calcola →
GTX 1660 Super 6GB Ottimale 58 tok/s Calcola →

GPU consigliate per Gemma 4 E4B

Benchmark reali
Nessuna recensione a pagamento
Scelta editoriale
Basato sui dati

Le migliori opzioni per compatibilita, margine VRAM e valore: prezzi e disponibilita possono cambiare.

Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.

Gemma 4 E4B — Guida compatibilita

Gemma 4 E4B puo funzionare su CPU senza GPU dedicata, cosa rara per un modello da 4B. Su un i7-13700K con llama.cpp Q4 raggiunge 14 tok/s (funzionale per uso occasionale). Con una GPU ottieni da 4 a 6 volte piu velocita; usa il calcolatore VRAM per i dettagli.

Confronta le GPU per Gemma 4 E4B

Quale GPU conviene? Specifiche reali e benchmark a confronto.

Componenti compatibili

GPU che eseguono Gemma 4 E4B in Q4, ordinate per punteggio di prestazioni IA.

Benchmark reali
Nessuna recensione a pagamento
Basato sui dati
RTX 5090

NVIDIA · 32 GB VRAM

Q4 OK
189 tok/s > $1000
RTX 4090

NVIDIA · 24 GB VRAM

Q4 OK
174 tok/s > $1000
M4 Ultra

Apple · 128 GB VRAM

Q4 OK
178 tok/s > $1000
RTX 5080

NVIDIA · 16 GB VRAM

Q4 OK
172 tok/s $600–1000
M3 Ultra

Apple · 192 GB VRAM

Q4 OK
150 tok/s > $1000
RTX 4080 Super

NVIDIA · 16 GB VRAM

Q4 OK
134 tok/s $600–1000

Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.

Alternative piu pratiche

Modelli simili nella categoria vision con requisiti VRAM comparabili.

Non sai quale GPU ti serve per Gemma 4 E4B?

Il calcolatore VRAM ti dice esattamente quale quantizzazione puo gestire il tuo hardware.

RTX 5090

Controlla disponibilita

Prezzi aggiornati ogni giorno