¿Puede la RTX 5070 Ti ejecutar Qwen3.5 35B-A3B?

Sí, la RTX 5070 Ti con 16GB de VRAM puede ejecutar Qwen3.5 35B-A3B. La mejor cuantización disponible es Q2, que requiere 9.6GB de VRAM.

¿Cuánta VRAM necesita Qwen3.5 35B-A3B?

Qwen3.5 35B-A3B necesita 77GB en FP16 (máxima calidad), 38.5GB en Q8, 19.3GB en Q4 (recomendado), y aproximadamente 9.6GB en Q2 (mínimo).

La RTX 5070 Ti tiene 16GB de VRAM de tipo GDDR7.

35B parámetros · 16GB VRAM (GDDR7) · NVIDIA

Compatible con offloading — solo cuantización Q2

VRAM insuficiente para Q4 (19.3GB necesarios). Solo posible en Q2 con offloading parcial a RAM.

Cuantización	VRAM requerida	Tu GPU	¿Funciona?
FP16 (máxima calidad)	77 GB	16 GB	✗ No
Q8 (alta calidad)	38.5 GB	16 GB	✗ No
Q4 (recomendado)	19.3 GB	16 GB	✗ No (3.3000000000000007 GB menos)
Q2 (mínimo)	9.6 GB	16 GB	~ Parcial

Ejecuta este comando en tu terminal para descargar y correr Qwen3.5 35B-A3B:

ollama run qwen3.5:35b-a3b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Velocidad estimada ~91 tok/s (muy rápida (tiempo real))

Mejor cuantización disponible Q2

Ancho de banda de memoria 896 GB/s

La RTX 5070 Ti es una opción ajustada para ejecutar Qwen3.5 35B-A3B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Qwen3.5 35B-A3B

Requisitos completos de VRAM y GPUs compatibles

RTX 5070 Ti

Especificaciones, benchmarks y modelos compatibles

Calculadora de VRAM

Comprueba la compatibilidad detallada de Qwen3.5 35B-A3B con RTX 5070 Ti y otras GPUs