Skip to main content

Qwen3-Coder 30B-A3B con RTX 5070 Ti: ¿Compatible?

30B parámetros · 16GB VRAM (GDDR7) · NVIDIA
~

Compatible con offloading — solo cuantización Q2

VRAM insuficiente para Q4 (16.5GB necesarios). Solo posible en Q2 con offloading parcial a RAM.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 66 GB 16 GB ✗ No
Q8 (alta calidad) 33 GB 16 GB ✗ No
Q4 (recomendado) 16.5 GB 16 GB ✗ No (0.5 GB menos)
Q2 (mínimo) 8.3 GB 16 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Qwen3-Coder 30B-A3B:

ollama run qwen3-coder:30b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~105 tok/s (muy rápida (tiempo real))
Mejor cuantización disponible Q2
Ancho de banda de memoria 896 GB/s

Comprar RTX 5070 Ti

La RTX 5070 Ti es una opción ajustada para ejecutar Qwen3-Coder 30B-A3B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver RTX 5070 Ti en Amazon →