¿Puede la M4 Max 48GB ejecutar Llama 3.2 90B Vision?

Sí, la M4 Max 48GB con 48GB de VRAM puede ejecutar Llama 3.2 90B Vision. La mejor cuantización disponible es Q2, que requiere 27GB de VRAM.

¿Cuánta VRAM necesita Llama 3.2 90B Vision?

Llama 3.2 90B Vision necesita 180GB en FP16 (máxima calidad), 90GB en Q8, 54GB en Q4 (recomendado), y aproximadamente 27GB en Q2 (mínimo).

La M4 Max 48GB tiene 48GB de VRAM de tipo Unified Memory.

90B parámetros · 48GB VRAM (Unified Memory) · Apple

Compatible con offloading — solo cuantización Q2

VRAM insuficiente para Q4 (54GB necesarios). Solo posible en Q2 con offloading parcial a RAM.

Cuantización	VRAM requerida	Tu GPU	¿Funciona?
FP16 (máxima calidad)	180 GB	48 GB	✗ No
Q8 (alta calidad)	90 GB	48 GB	✗ No
Q4 (recomendado)	54 GB	48 GB	✗ No (6 GB menos)
Q2 (mínimo)	27 GB	48 GB	~ Parcial

Ejecuta este comando en tu terminal para descargar y correr Llama 3.2 90B Vision:

ollama run llama3.2-vision:90b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Velocidad estimada ~20 tok/s (rápida (cómoda para uso diario))

Mejor cuantización disponible Q2

Ancho de banda de memoria 546 GB/s

La M4 Max 48GB es una opción ajustada para ejecutar Llama 3.2 90B Vision.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Llama 3.2 90B Vision

Requisitos completos de VRAM y GPUs compatibles

M4 Max 48GB

Especificaciones, benchmarks y modelos compatibles

Calculadora de VRAM

Comprueba la compatibilidad detallada de Llama 3.2 90B Vision con M4 Max 48GB y otras GPUs