Skip to main content

Llama 3.3 70B con M4 Ultra: ¿Compatible?

70B parámetros · 128GB VRAM (Unified Memory) · Apple

Compatible — la M4 Ultra puede ejecutar Llama 3.3 70B

Alta calidad disponible. 86GB de margen sobre Q4.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 168 GB 128 GB ✗ No
Q8 (alta calidad) 84 GB 128 GB ✓ Sí
Q4 (recomendado) Recomendado 42 GB 128 GB ✓ Sí
Q2 (mínimo) 21 GB 128 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Llama 3.3 70B:

ollama run llama3.3:70b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~25 tok/s (rápida (cómoda para uso diario))
Margen de VRAM en Q4 +86 GB
Mejor cuantización disponible Q8
Ancho de banda de memoria 1092 GB/s

Comprar M4 Ultra

La M4 Ultra es una opción sólida para ejecutar Llama 3.3 70B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver M4 Ultra en Amazon →