Qwen2.5 72B con M3 Ultra: ¿Compatible?
72B parámetros · 192GB VRAM (Unified Memory) · Apple
✓
Compatible — la M3 Ultra puede ejecutar Qwen2.5 72B
Calidad máxima disponible. La M3 Ultra tiene suficiente VRAM para FP16 completo.
Análisis de VRAM por cuantización
| Cuantización | VRAM requerida | Tu GPU | ¿Funciona? |
|---|---|---|---|
| FP16 (máxima calidad) | 144 GB | 192 GB | ✓ Sí |
| Q8 (alta calidad) | 72 GB | 192 GB | ✓ Sí |
| Q4 (recomendado) Recomendado | 41 GB | 192 GB | ✓ Sí |
| Q2 (mínimo) | 21 GB | 192 GB | ~ Parcial |
Instalar con Ollama
Ejecuta este comando en tu terminal para descargar y correr Qwen2.5 72B:
ollama run qwen2.5:72b Requiere Ollama instalado. Descárgalo gratis en ollama.ai
Rendimiento estimado
Velocidad estimada
~19 tok/s
(moderada (funcional para uso puntual))
Margen de VRAM en Q4 +151 GB
Mejor cuantización disponible FP16
Ancho de banda de memoria 800 GB/s
Comprar M3 Ultra
La M3 Ultra es una opción premium para ejecutar Qwen2.5 72B.
Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.
Ver M3 Ultra en Amazon →