M4 Ultra
Pro
- Works via CPU offloading
- 128 GB VRAM — adequate headroom
Hermes 3 405B funziona con 2 GPU tramite offloading della CPU. Soglie VRAM precise e benchmark qui sotto.
Prices and availability may change · affiliate link
llama.cpp 0.2.x · CUDA 12 · ROCm 6 · aggiornato mensilmente · metodologia →
Questo modello richiede unaGPU flagship (48 GB+ VRAM)
M4 Ultra
Funziona in Q4 — utilizzabile, con qualche attesa
M3 Ultra
Miglior rapporto valore/prestazioni per uso quotidiano
M3 Ultra
Qualita massima, inferenza piu rapida
Le migliori opzioni per compatibilita, margine VRAM e valore: prezzi e disponibilita possono cambiare.
Pro
Pro
Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.
Verifica se la tua GPU puo eseguire Hermes 3 405B →
Calcolatore VRAM — verifica compatibilita immediata
M4 Ultra
128 GB · Funziona con offloading · Controlla disponibilita
*Prezzi e disponibilita possono cambiare. Alcuni link sono affiliati.
| Quantizzazione | VRAM necessaria | Spazio su disco | Qualita |
|---|---|---|---|
| FP16 (qualita massima) | 810 GB | 810 GB | Massima |
| Q8 (alta qualita) | 405 GB | 405 GB | Quasi senza perdita |
| Q4 (consigliato) Miglior equilibrio | 230 GB | 230 GB | Consigliata |
| Q2 (minimo) | 115 GB | 115 GB | Perdita di qualita |
| Sviluppatore | Nous Research |
| Parametri | 405B |
| Finestra di contesto | 131,072 token |
| Licenza | llama-3.1-community |
| Casi d uso | agent, function-calling, reasoning, chat |
| Rilasciato | 2024-09 |
Installa con Ollama
ollama run hermes3:405b Hugging Face
NousResearch/Hermes-3-Llama-3.1-405B Hermes 3 405B necessita di <strong class="text-amber-400">230 GB di VRAM</strong> in Q4: nessuna GPU consumer e pienamente compatibile. 2 GPU funzionano con offloading CPU in Q2 (115 GB).
0 Q4 nativo · 2 offload
Le migliori opzioni per compatibilita, margine VRAM e valore: prezzi e disponibilita possono cambiare.
M4 Ultra
128 GB VRAM
Controlla disponibilita →
M3 Ultra
192 GB VRAM
Controlla disponibilita →
Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.
Hermes 3 405B con 405B parametri si esegue completamente solo su configurazioni multi-GPU o server. Considera eventuali versioni distillate. Il calcolatore VRAM puo aiutarti a trovare alternative compatibili.
GPU che eseguono Hermes 3 405B in Q4, ordinate per punteggio di prestazioni IA.
Nessuna GPU consumer ha VRAM sufficiente per questo modello.
Considera versioni distillate o quantizzazione Q2.
Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.
Modelli simili nella categoria agent con requisiti VRAM comparabili.
Il calcolatore VRAM ti dice esattamente quale quantizzazione puo gestire il tuo hardware.
M4 Ultra
Prezzi aggiornati ogni giorno