¿Puede la M3 Pro ejecutar Llama 3.2 3B?

Sí, la M3 Pro con 18GB de VRAM puede ejecutar Llama 3.2 3B. La mejor cuantización disponible es FP16, que requiere 7.2GB de VRAM.

¿Cuánta VRAM necesita Llama 3.2 3B?

Llama 3.2 3B necesita 7.2GB en FP16 (máxima calidad), 3.6GB en Q8, 1.8GB en Q4 (recomendado), y aproximadamente 0.9GB en Q2 (mínimo).

La M3 Pro tiene 18GB de VRAM de tipo Unified Memory.

3B parámetros · 18GB VRAM (Unified Memory) · Apple

✓

Compatible — la M3 Pro puede ejecutar Llama 3.2 3B

Calidad máxima disponible. La M3 Pro tiene suficiente VRAM para FP16 completo.

Cuantización	VRAM requerida	Tu GPU	¿Funciona?
FP16 (máxima calidad)	7.2 GB	18 GB	✓ Sí
Q8 (alta calidad)	3.6 GB	18 GB	✓ Sí
Q4 (recomendado) Recomendado	1.8 GB	18 GB	✓ Sí
Q2 (mínimo)	0.9 GB	18 GB	~ Parcial

Ejecuta este comando en tu terminal para descargar y correr Llama 3.2 3B:

ollama run llama3.2:3b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Velocidad estimada ~81 tok/s (muy rápida (tiempo real))

Margen de VRAM en Q4 +16.2 GB

Mejor cuantización disponible FP16

Ancho de banda de memoria 150 GB/s

La M3 Pro es una opción premium para ejecutar Llama 3.2 3B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Llama 3.2 3B

Requisitos completos de VRAM y GPUs compatibles

M3 Pro

Especificaciones, benchmarks y modelos compatibles

Calculadora de VRAM

Comprueba la compatibilidad detallada de Llama 3.2 3B con M3 Pro y otras GPUs