Skip to main content

Qwen2.5-Coder 32B con RTX 4090: ¿Compatible?

32B parámetros · 24GB VRAM (GDDR6X) · NVIDIA

Compatible — la RTX 4090 puede ejecutar Qwen2.5-Coder 32B

Cuantización Q4 recomendada. 4.800000000000001GB de margen disponible.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 76.8 GB 24 GB ✗ No
Q8 (alta calidad) 38.4 GB 24 GB ✗ No
Q4 (recomendado) Recomendado 19.2 GB 24 GB ✓ Sí
Q2 (mínimo) 9.6 GB 24 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Qwen2.5-Coder 32B:

ollama run qwen2.5-coder:32b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~51 tok/s (muy rápida (tiempo real))
Margen de VRAM en Q4 +4.800000000000001 GB
Mejor cuantización disponible Q4
Ancho de banda de memoria 1008 GB/s

Comprar RTX 4090

La RTX 4090 es una opción ajustada para ejecutar Qwen2.5-Coder 32B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver RTX 4090 en Amazon →