Vai al contenuto principale
Motore locale pronto

Qwen3 235B-A22B

1 GPU consumer possono eseguire Qwen3 235B-A22B in Q4 nativamente. Soglie VRAM precise e benchmark qui sotto.

1 GPU compatibili
1 con offloading
235B parametri
131K contesto
Top pick
M3 Ultra · 192 GB VRAM runs Q4 natively

Prices and availability may change · affiliate link

Javier Morales
Javier Morales Specialista hardware IA — 8 anni di esperienza
GitHub: github.com/javier-morales-ia

llama.cpp 0.2.x · CUDA 12 · ROCm 6 · aggiornato mensilmente · metodologia →

Contesto di esecuzione

ARCHITETTURA TRANSFORMER
CONTESTO 131K TOKENS
QUANTIZZAZIONE 4-BIT GGUF
FORNITORE Alibaba
LICENZA Apache 2.0
REQUISITO VRAM
129.3 GB
4GB 8GB 12GB 16GB 24GB+
Decisione hardware

Questo modello richiede unaGPU flagship (48 GB+ VRAM)

Minimo

M3 Ultra

Funziona in Q4 — utilizzabile, con qualche attesa

192 GB VRAM
Vedi configurazione compatibile
Bilanciato

M4 Ultra

Miglior rapporto valore/prestazioni per uso quotidiano

128 GB VRAM offload
Vedi configurazione compatibile
Ottimale

M3 Ultra

Qualita massima, inferenza piu rapida

192 GB VRAM
Vedi configurazione compatibile

Compatible GPUs for Qwen3 235B-A22B

Le migliori opzioni per compatibilita, margine VRAM e valore: prezzi e disponibilita possono cambiare.

M3 Ultra
192 GB VRAM · Q4 nativo Amazon

M3 Ultra

0.0 (0 recensioni)

Pro

  • Runs Qwen3 235B-A22B at Q4 natively
  • 192 GB VRAM — adequate headroom
Vedi M3 Ultra su Amazon →
M4 Ultra
128 GB VRAM · Offloading Amazon

M4 Ultra

0.0 (0 recensioni)

Pro

  • Works via CPU offloading
  • 128 GB VRAM — adequate headroom

Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.

*Prezzi e disponibilita possono cambiare. Alcuni link sono affiliati.

Requisiti di sistema

VRAM GPU 129.3 GB GPU fascia alta
RAM di sistema 194 GB 64 GB or more
Archiviazione 117.5 GB Q4 · SSD consigliato
CPU Qualsiasi CPU moderna GPU richiesta

VRAM per quantizzazione

Quantizzazione VRAM necessaria Spazio su disco Qualita
FP16 (qualita massima) 517 GB 470 GB Massima
Q8 (alta qualita) 258.5 GB 235 GB Quasi senza perdita
Q4 (consigliato) Miglior equilibrio 129.3 GB 117.5 GB Consigliata
Q2 (minimo) 64.6 GB 58.8 GB Perdita di qualita

Dettagli modello

Sviluppatore Alibaba
Parametri 235B
Finestra di contesto 131,072 token
Licenza Apache 2.0
Casi d uso chat, reasoning, coding, analysis
Rilasciato 2025-04

Installa con Ollama

ollama run qwen3:235b-a22b

Hugging Face

Qwen/Qwen3-235B-A22B
Vedi su HF →
Requisiti tecnici

La tua GPU puo eseguire Qwen3 235B-A22B?

Qwen3 235B-A22B richiede <strong class="text-primary-container">129.3 GB di VRAM</strong> in Q4. 1 GPU consumer raggiungono questa soglia. Sotto 8 GB o 127.30000000000001 GB incontrerai una latenza di offload significativa.

64.6GB Minimo critico
129.3GB Ottimale Q4
258.5GB Alta qualita Q8
517GB Massimo FP16

Matrice prestazioni hardware

1 Q4 nativo · 1 offload

Unita GPU VRAM Compatibilita Velocita stimata Azione
M3 Ultra 192GB Ottimale 38 tok/s Calcola →
M4 Ultra 128GB Offload 45 tok/s Calcola →

GPU consigliate per Qwen3 235B-A22B

Benchmark reali
Nessuna recensione a pagamento
Scelta editoriale
Basato sui dati

Le migliori opzioni per compatibilita, margine VRAM e valore: prezzi e disponibilita possono cambiare.

Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.

Qwen3 235B-A22B — Guida compatibilita

Qwen3 235B-A22B con 235B parametri si esegue completamente solo su configurazioni multi-GPU o server. Considera eventuali versioni distillate. Il calcolatore VRAM puo aiutarti a trovare alternative compatibili.

Componenti compatibili

GPU che eseguono Qwen3 235B-A22B in Q4, ordinate per punteggio di prestazioni IA.

Benchmark reali
Nessuna recensione a pagamento
Basato sui dati
M3 Ultra

Apple · 192 GB VRAM

Q4 OK
38 tok/s > $1000

Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.

Alternative piu pratiche

Modelli simili nella categoria chat con requisiti VRAM comparabili.

Non sai quale GPU ti serve per Qwen3 235B-A22B?

Il calcolatore VRAM ti dice esattamente quale quantizzazione puo gestire il tuo hardware.

M3 Ultra

Controlla disponibilita

Prezzi aggiornati ogni giorno