Skip to main content

Phi-3.5 MoE con M3 Ultra: ¿Compatible?

41.9B parámetros · 192GB VRAM (Unified Memory) · Apple

Compatible — la M3 Ultra puede ejecutar Phi-3.5 MoE

Calidad máxima disponible. La M3 Ultra tiene suficiente VRAM para FP16 completo.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 84 GB 192 GB ✓ Sí
Q8 (alta calidad) 42 GB 192 GB ✓ Sí
Q4 (recomendado) Recomendado 21 GB 192 GB ✓ Sí
Q2 (mínimo) 11 GB 192 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Phi-3.5 MoE:

ollama run phi3.5-moe

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~37 tok/s (rápida (cómoda para uso diario))
Margen de VRAM en Q4 +171 GB
Mejor cuantización disponible FP16
Ancho de banda de memoria 800 GB/s

Comprar M3 Ultra

La M3 Ultra es una opción premium para ejecutar Phi-3.5 MoE.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver M3 Ultra en Amazon →