Skip to main content

Phi-3.5 MoE con M1 Pro: ¿Compatible?

41.9B parámetros · 16GB VRAM (Unified Memory) · Apple
~

Compatible con offloading — solo cuantización Q2

VRAM insuficiente para Q4 (21GB necesarios). Solo posible en Q2 con offloading parcial a RAM.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 84 GB 16 GB ✗ No
Q8 (alta calidad) 42 GB 16 GB ✗ No
Q4 (recomendado) 21 GB 16 GB ✗ No (5 GB menos)
Q2 (mínimo) 11 GB 16 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Phi-3.5 MoE:

ollama run phi3.5-moe

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~18 tok/s (moderada (funcional para uso puntual))
Mejor cuantización disponible Q2
Ancho de banda de memoria 200 GB/s

Comprar M1 Pro

La M1 Pro es una opción ajustada para ejecutar Phi-3.5 MoE.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver M1 Pro en Amazon →