Aller au contenu principal
Moteur local prêt

RTX 4070

60 modèles IA tiennent dans 12 GB de VRAM en Q4 natif. 21 autres fonctionnent avec offloading CPU. Benchmarks réels ci-dessous.

60 Modèles compatibles
21 avec offloading
12GB GDDR6X
200W TDP
Javier Morales
Javier Morales Spécialiste matériel IA — 8 ans d’expérience
GitHub: github.com/javier-morales-ia

llama.cpp 0.2.x · CUDA 12 · Ubuntu 22.04 · Prices verified on Amazon · méthodologie →

RTX 4070

Contexte d’exécution

MARQUE NVIDIA
BANDE PASSANTE 504 GB/s
FP16 TFLOPS 29.1
AI SCORE 48 / 140
FOURCHETTE PRIX Milieu de gamme
PRIX LANCEMENT $599
AI SCORE (RELATIVE)
48 /140
Entrée Valeur Milieu Haut Flagship
Prix de lancement: $599 Le prix actuel varie sur Amazon

Vérifier l'offre actuelle

Lien affilié Amazon pour RTX 4070

Certains liens sont des liens d'affiliation Amazon. Nous pouvons toucher une commission sans coût supplémentaire pour vous. Le cookie Amazon peut durer jusqu'à 24 heures après votre clic.

Prime

Spécifications complètes

NVIDIA · 2023-04

VRAM 12 GB GDDR6X
Bande passante 504 GB/s
FP16 TFLOPS 29.1
AI Score 48 / 140
CUDA Cores 5,888
Tensor Cores 184
TDP 200 W
PCIe Gen 4
Slots 2
Power Connector 16-pin
Fourchette de prix Milieu de gamme
Sortie 2023-04

Benchmarks IA

Mesures réelles d’inférence — llama.cpp Q4_K_M

Tâche Résultat
Llama 1B Q4 265 tok/s
Llama 3B Q4 106 tok/s
Llama 7B Q4 40 tok/s
Llama 13B Q4 20 tok/s
Llama 30B Q4 VRAM N/D
Llama 70B Q4 Offloading ou multi-GPU
Stable Diffusion 512px 4.5s / img
Whisper Large RTF 0.55x

RTF < 1.0 = plus rapide que le temps réel. Pour Stable Diffusion et Whisper, plus bas est meilleur ; pour les tokens/s, plus haut est meilleur.

Comparer RTX 4070 avec un autre GPU

Mise à niveau utile ? Comparez les specs et benchmarks réels côte à côte.

Ouvrir le comparateur →
Comparaisons rapides : vs RX 7800 XT · vs RX 6800 XT

Modèles IA compatibles — RTX 4070

60 modèles fonctionne entièrement en VRAM · 21 avec offloading CPU

Voir les 60 modèles compatibles →

Fonctionne aussi avec offloading CPU (21)

RTX 4070 · Amazon

Les prix des GPU changent souvent selon les vendeurs. Verifiez l offre actuelle avant achat.

Vérifier l'offre actuelle

Certains liens sont des liens d'affiliation Amazon. Nous pouvons toucher une commission sans coût supplémentaire pour vous. Le cookie Amazon peut durer jusqu'à 24 heures après votre clic.

RTX 4070 pour l’intelligence artificielle locale

RTX 4070 avec 12GB de GDDR6X est une option solide pour l'IA locale. Cette carte couvre les modèles populaires en quantification Q4 et permet d'aller plus loin selon la VRAM disponible.

En benchmarks réels, RTX 4070 atteint 40 tokens/seconde sur Llama 7B Q4. Vous pouvez aussi exécuter 60 modèles entièrement en VRAM, avec 21 modèles supplémentaires en offloading CPU.

Pour vérifier précisément la compatibilité de chaque modèle, utilisez le calculateur VRAM. Vous pouvez également consulter les guides de démarrage pour configurer votre environnement local.

Planifiez votre build IA complet

RTX 4070 · 12 GB VRAM — configurez PSU, RAM, stockage et vérifiez les modèles compatibles.

Configurer votre build →

Vous ne savez pas quel modèle exécuter sur votre RTX 4070 ?

Le calculateur VRAM vous indique exactement quelle quantification utiliser.

Ouvrir le calculateur →

Obtenez le meilleur prix pour RTX 4070

Ouvrez Amazon via notre lien affilié et vérifiez la disponibilité, les variantes et les offres actuelles.

Voir le meilleur prix →