¿Puede la M3 Ultra ejecutar Llama 3.3 70B?

Sí, la M3 Ultra con 192GB de VRAM puede ejecutar Llama 3.3 70B. La mejor cuantización disponible es FP16, que requiere 168GB de VRAM.

¿Cuánta VRAM necesita Llama 3.3 70B?

Llama 3.3 70B necesita 168GB en FP16 (máxima calidad), 84GB en Q8, 42GB en Q4 (recomendado), y aproximadamente 21GB en Q2 (mínimo).

La M3 Ultra tiene 192GB de VRAM de tipo Unified Memory.

70B parámetros · 192GB VRAM (Unified Memory) · Apple

✓

Compatible — la M3 Ultra puede ejecutar Llama 3.3 70B

Calidad máxima disponible. La M3 Ultra tiene suficiente VRAM para FP16 completo.

Cuantización	VRAM requerida	Tu GPU	¿Funciona?
FP16 (máxima calidad)	168 GB	192 GB	✓ Sí
Q8 (alta calidad)	84 GB	192 GB	✓ Sí
Q4 (recomendado) Recomendado	42 GB	192 GB	✓ Sí
Q2 (mínimo)	21 GB	192 GB	~ Parcial

Ejecuta este comando en tu terminal para descargar y correr Llama 3.3 70B:

ollama run llama3.3:70b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Velocidad estimada ~19 tok/s (moderada (funcional para uso puntual))

Margen de VRAM en Q4 +150 GB

Mejor cuantización disponible FP16

Ancho de banda de memoria 800 GB/s

La M3 Ultra es una opción premium para ejecutar Llama 3.3 70B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Llama 3.3 70B

Requisitos completos de VRAM y GPUs compatibles

M3 Ultra

Especificaciones, benchmarks y modelos compatibles

Calculadora de VRAM

Comprueba la compatibilidad detallada de Llama 3.3 70B con M3 Ultra y otras GPUs