Skip to main content

Gemma 4 31B con RTX 4060 Ti 16GB: ¿Compatible?

31B parámetros · 16GB VRAM (GDDR6) · NVIDIA
~

Compatible con offloading — solo cuantización Q2

VRAM insuficiente para Q4 (17.1GB necesarios). Solo posible en Q2 con offloading parcial a RAM.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 68.2 GB 16 GB ✗ No
Q8 (alta calidad) 34.1 GB 16 GB ✗ No
Q4 (recomendado) 17.1 GB 16 GB ✗ No (1.1000000000000014 GB menos)
Q2 (mínimo) 8.5 GB 16 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Gemma 4 31B:

ollama run gemma4:31b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~33 tok/s (rápida (cómoda para uso diario))
Mejor cuantización disponible Q2
Ancho de banda de memoria 288 GB/s

Comprar RTX 4060 Ti 16GB

La RTX 4060 Ti 16GB es una opción ajustada para ejecutar Gemma 4 31B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver RTX 4060 Ti 16GB en Amazon →