Qwen3.5 35B-A3B con RTX 5070 Ti: ¿Compatible?
35B parámetros · 16GB VRAM (GDDR7) · NVIDIA
~
Compatible con offloading — solo cuantización Q2
VRAM insuficiente para Q4 (19.3GB necesarios). Solo posible en Q2 con offloading parcial a RAM.
Análisis de VRAM por cuantización
| Cuantización | VRAM requerida | Tu GPU | ¿Funciona? |
|---|---|---|---|
| FP16 (máxima calidad) | 77 GB | 16 GB | ✗ No |
| Q8 (alta calidad) | 38.5 GB | 16 GB | ✗ No |
| Q4 (recomendado) | 19.3 GB | 16 GB | ✗ No (3.3000000000000007 GB menos) |
| Q2 (mínimo) | 9.6 GB | 16 GB | ~ Parcial |
Instalar con Ollama
Ejecuta este comando en tu terminal para descargar y correr Qwen3.5 35B-A3B:
ollama run qwen3.5:35b-a3b Requiere Ollama instalado. Descárgalo gratis en ollama.ai
Rendimiento estimado
Velocidad estimada
~91 tok/s
(muy rápida (tiempo real))
Mejor cuantización disponible Q2
Ancho de banda de memoria 896 GB/s
Comprar RTX 5070 Ti
La RTX 5070 Ti es una opción ajustada para ejecutar Qwen3.5 35B-A3B.
Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.
Ver RTX 5070 Ti en Amazon →