Skip to main content

Magistral Small 24B con RTX 4070: ¿Compatible?

24B parámetros · 12GB VRAM (GDDR6X) · NVIDIA
~

Compatible con offloading — solo cuantización Q2

VRAM insuficiente para Q4 (13.2GB necesarios). Solo posible en Q2 con offloading parcial a RAM.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 52.8 GB 12 GB ✗ No
Q8 (alta calidad) 26.4 GB 12 GB ✗ No
Q4 (recomendado) 13.2 GB 12 GB ✗ No (1.1999999999999993 GB menos)
Q2 (mínimo) 6.6 GB 12 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Magistral Small 24B:

ollama run magistral:24b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~75 tok/s (muy rápida (tiempo real))
Mejor cuantización disponible Q2
Ancho de banda de memoria 504 GB/s

Comprar RTX 4070

La RTX 4070 es una opción ajustada para ejecutar Magistral Small 24B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver RTX 4070 en Amazon →