¿Puede la M4 Ultra ejecutar Llama 3.2 11B Vision?

Sí, la M4 Ultra con 128GB de VRAM puede ejecutar Llama 3.2 11B Vision. La mejor cuantización disponible es FP16, que requiere 26.4GB de VRAM.

¿Cuánta VRAM necesita Llama 3.2 11B Vision?

Llama 3.2 11B Vision necesita 26.4GB en FP16 (máxima calidad), 13.2GB en Q8, 6.6GB en Q4 (recomendado), y aproximadamente 3.3GB en Q2 (mínimo).

La M4 Ultra tiene 128GB de VRAM de tipo Unified Memory.

11B parámetros · 128GB VRAM (Unified Memory) · Apple

✓

Compatible — la M4 Ultra puede ejecutar Llama 3.2 11B Vision

Calidad máxima disponible. La M4 Ultra tiene suficiente VRAM para FP16 completo.

Cuantización	VRAM requerida	Tu GPU	¿Funciona?
FP16 (máxima calidad)	26.4 GB	128 GB	✓ Sí
Q8 (alta calidad)	13.2 GB	128 GB	✓ Sí
Q4 (recomendado) Recomendado	6.6 GB	128 GB	✓ Sí
Q2 (mínimo)	3.3 GB	128 GB	~ Parcial

Ejecuta este comando en tu terminal para descargar y correr Llama 3.2 11B Vision:

ollama run llama3.2-vision:11b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Velocidad estimada ~162 tok/s (muy rápida (tiempo real))

Margen de VRAM en Q4 +121.4 GB

Mejor cuantización disponible FP16

Ancho de banda de memoria 1092 GB/s

La M4 Ultra es una opción premium para ejecutar Llama 3.2 11B Vision.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Llama 3.2 11B Vision

Requisitos completos de VRAM y GPUs compatibles

M4 Ultra

Especificaciones, benchmarks y modelos compatibles

Calculadora de VRAM

Comprueba la compatibilidad detallada de Llama 3.2 11B Vision con M4 Ultra y otras GPUs