Skip to main content

Llama 3.2 1B con RTX 4080 Super: ¿Compatible?

1B parámetros · 16GB VRAM (GDDR6X) · NVIDIA

Compatible — la RTX 4080 Super puede ejecutar Llama 3.2 1B

Calidad máxima disponible. La RTX 4080 Super tiene suficiente VRAM para FP16 completo.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 2.4 GB 16 GB ✓ Sí
Q8 (alta calidad) 1.2 GB 16 GB ✓ Sí
Q4 (recomendado) Recomendado 0.6 GB 16 GB ✓ Sí
Q2 (mínimo) 0.3 GB 16 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Llama 3.2 1B:

ollama run llama3.2:1b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~1198 tok/s (muy rápida (tiempo real))
Margen de VRAM en Q4 +15.4 GB
Mejor cuantización disponible FP16
Ancho de banda de memoria 736 GB/s

Comprar RTX 4080 Super

La RTX 4080 Super es una opción premium para ejecutar Llama 3.2 1B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver RTX 4080 Super en Amazon →