¿Puede la RTX 5090 ejecutar Qwen3-Coder-Next 80B-A3B?

Sí, la RTX 5090 con 32GB de VRAM puede ejecutar Qwen3-Coder-Next 80B-A3B. La mejor cuantización disponible es Q2, que requiere 22GB de VRAM.

¿Cuánta VRAM necesita Qwen3-Coder-Next 80B-A3B?

Qwen3-Coder-Next 80B-A3B necesita 176GB en FP16 (máxima calidad), 88GB en Q8, 44GB en Q4 (recomendado), y aproximadamente 22GB en Q2 (mínimo).

La RTX 5090 tiene 32GB de VRAM de tipo GDDR7.

80B parámetros · 32GB VRAM (GDDR7) · NVIDIA

Compatible con offloading — solo cuantización Q2

VRAM insuficiente para Q4 (44GB necesarios). Solo posible en Q2 con offloading parcial a RAM.

Cuantización	VRAM requerida	Tu GPU	¿Funciona?
FP16 (máxima calidad)	176 GB	32 GB	✗ No
Q8 (alta calidad)	88 GB	32 GB	✗ No
Q4 (recomendado)	44 GB	32 GB	✗ No (12 GB menos)
Q2 (mínimo)	22 GB	32 GB	~ Parcial

Ejecuta este comando en tu terminal para descargar y correr Qwen3-Coder-Next 80B-A3B:

ollama run qwen3-coder-next

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Velocidad estimada ~80 tok/s (muy rápida (tiempo real))

Mejor cuantización disponible Q2

Ancho de banda de memoria 1792 GB/s

La RTX 5090 es una opción ajustada para ejecutar Qwen3-Coder-Next 80B-A3B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Qwen3-Coder-Next 80B-A3B

Requisitos completos de VRAM y GPUs compatibles

RTX 5090

Especificaciones, benchmarks y modelos compatibles

Calculadora de VRAM

Comprueba la compatibilidad detallada de Qwen3-Coder-Next 80B-A3B con RTX 5090 y otras GPUs