RTX 4060 Ti 16GB
68 modelos de IA caben en 16 GB de VRAM en Q4 nativo. 15 más funcionan con offloading en CPU. Benchmarks reales más abajo.
llama.cpp 0.2.x · CUDA 12 · Ubuntu 22.04 · Prices verified on Amazon · metodología →
Contexto de ejecución
Consultar oferta actual
Enlace de afiliado de Amazon para RTX 4060 Ti 16GB
Algunos enlaces son enlaces de afiliado de Amazon. Podemos ganar una comisión sin coste adicional para ti. La cookie de Amazon puede durar hasta 24 horas tras tu clic.
Especificaciones completas
NVIDIA · 2023-07
| VRAM | 16 GB GDDR6 |
| Ancho de banda | 288 GB/s |
| FP16 TFLOPS | 22.1 |
| AI Score | 45 / 140 |
| CUDA Cores | 4,352 |
| Tensor Cores | 136 |
| TDP | 165 W |
| PCIe | Gen 4 |
| Slots | 2 |
| Power Connector | 8-pin |
| Rango de precio | Buena relacion calidad-precio |
| Lanzamiento | 2023-07 |
Benchmarks de IA
Mediciones reales de inferencia — llama.cpp Q4_K_M
| Tarea | Resultado |
|---|---|
| Llama 1B Q4 | 151 tok/s |
| Llama 3B Q4 | 60 tok/s |
| Llama 7B Q4 | 35 tok/s |
| Llama 13B Q4 | 13 tok/s |
| Llama 30B Q4 | VRAM N/D |
| Llama 70B Q4 | Offload o multi-GPU |
| Stable Diffusion 512px | 5s / img |
| Whisper Large RTF | 0.7x |
RTF < 1.0 = más rápido que tiempo real. En Stable Diffusion y Whisper cuanto menor, mejor; en tokens/s cuanto mayor, mejor.
Comparar RTX 4060 Ti 16GB con otra GPU
¿Vale la pena el upgrade? Compara specs y benchmarks reales lado a lado.
Abrir comparador →Modelos de IA compatibles — RTX 4060 Ti 16GB
68 modelos se ejecutan completos en VRAM · 15 con offloading en CPU
Flux.1 Dev
Whisper Large V3
Stable Diffusion 3.5 Large
Stable Diffusion 3.5 Medium
Gemma 4 27B
Gemma 2 27B
Mistral Small 3
Phi-4
Ver los 68 modelos compatibles →
También funciona con offloading en CPU (15)
- FLUX.2 Dev 8.8 GB Q2
- Qwen2.5-Coder 32B 9.6 GB Q2 Cómo instalar →
- DeepSeek R1 Distill 32B 9.6 GB Q2 Cómo instalar →
- Qwen2.5 32B 9.6 GB Q2 Cómo instalar →
- Qwen3.5 35B-A3B 9.6 GB Q2 Cómo instalar →
- Gemma 3 27B 8.1 GB Q2 Cómo instalar →
- Gemma 4 31B 8.5 GB Q2 Cómo instalar →
- Mixtral 8x7B 14 GB Q2 Cómo instalar →
- Qwen3 32B 8.8 GB Q2 Cómo instalar →
- Qwen3-Coder 30B-A3B 8.3 GB Q2 Cómo instalar →
- Qwen3 30B-A3B 8.3 GB Q2 Cómo instalar →
- CodeLlama 34B 10 GB Q2 Cómo instalar →
- Yi 1.5 34B 10 GB Q2 Cómo instalar →
- Nous Hermes 2 Mixtral 8x7B 13 GB Q2 Cómo instalar →
- Phi-3.5 MoE 11 GB Q2 Cómo instalar →
RTX 4060 Ti 16GB · Amazon
Los precios de las GPU cambian con frecuencia entre tiendas. Consulta la oferta actual antes de comprar.
Consultar oferta actualAlgunos enlaces son enlaces de afiliado de Amazon. Podemos ganar una comisión sin coste adicional para ti. La cookie de Amazon puede durar hasta 24 horas tras tu clic.
RTX 4060 Ti 16GB para Inteligencia Artificial Local
La RTX 4060 Ti 16GB con 16GB de GDDR6 es una opción equilibrada para IA local. Puede correr modelos 7B y 13B en Q4 sin problemas, y modelos 7B en FP16. Es ideal para usuarios que quieren una experiencia fluida con los modelos más populares como Llama 3.1 8B, Mistral 7B, Phi-4 o Qwen2.5 14B.
Los benchmarks reales muestran 35 tokens/segundo en Llama 7B Q4. Para generación de imágenes, Stable Diffusion XL y SD 3.5 Medium caben perfectamente. Whisper Large V3 para transcripción de audio también es compatible.
Con 16GB de VRAM tienes acceso a 68 modelos completos y 15 adicionales con offloading parcial. Usa la calculadora de VRAM para ver las opciones de cuantización disponibles para cada modelo.
Planifica tu build completa de IA
RTX 4060 Ti 16GB · 16 GB VRAM — configura PSU, RAM, almacenamiento y revisa modelos compatibles.
Artículos relacionados
¿No sabes qué modelo correr en tu RTX 4060 Ti 16GB?
La calculadora de VRAM te dice exactamente qué cuantización necesitas.
Consigue el mejor precio para RTX 4060 Ti 16GB
Abre Amazon con nuestro enlace afiliado y revisa disponibilidad, variantes y ofertas actuales.