Skip to main content

Llama 3.2 11B Vision con RTX 5080: ¿Compatible?

11B parámetros · 16GB VRAM (GDDR7) · NVIDIA

Compatible — la RTX 5080 puede ejecutar Llama 3.2 11B Vision

Alta calidad disponible. 9.4GB de margen sobre Q4.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 26.4 GB 16 GB ✗ No
Q8 (alta calidad) 13.2 GB 16 GB ✓ Sí
Q4 (recomendado) Recomendado 6.6 GB 16 GB ✓ Sí
Q2 (mínimo) 3.3 GB 16 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Llama 3.2 11B Vision:

ollama run llama3.2-vision:11b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~142 tok/s (muy rápida (tiempo real))
Margen de VRAM en Q4 +9.4 GB
Mejor cuantización disponible Q8
Ancho de banda de memoria 960 GB/s

Comprar RTX 5080

La RTX 5080 es una opción sólida para ejecutar Llama 3.2 11B Vision.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver RTX 5080 en Amazon →