Aller au contenu principal
Moteur local prêt

M4 Ultra

93 modèles IA tiennent dans 128 GB de VRAM en Q4 natif. 3 autres fonctionnent avec offloading CPU. Benchmarks réels ci-dessous.

93 Modèles compatibles
3 avec offloading
128GB Unified Memory
90W TDP
Javier Morales
Javier Morales Spécialiste matériel IA — 8 ans d’expérience
GitHub: github.com/javier-morales-ia

llama.cpp 0.2.x · CUDA 12 · Ubuntu 22.04 · Prices verified on Amazon · méthodologie →

M4 Ultra

Contexte d’exécution

MARQUE Apple
BANDE PASSANTE 1092 GB/s
FP16 TFLOPS 28.4
AI SCORE 90 / 140
FOURCHETTE PRIX Integree
PRIX LANCEMENT $6,999
AI SCORE (RELATIVE)
90 /140
Entrée Valeur Milieu Haut Flagship
Prix de lancement: $6,999 Le prix actuel varie sur Amazon

Vérifier l'offre actuelle

Lien affilié Amazon pour M4 Ultra

Certains liens sont des liens d'affiliation Amazon. Nous pouvons toucher une commission sans coût supplémentaire pour vous. Le cookie Amazon peut durer jusqu'à 24 heures après votre clic.

Spécifications complètes

Apple · 2025-03

VRAM 128 GB Unified Memory
Bande passante 1092 GB/s
FP16 TFLOPS 28.4
AI Score 90 / 140
Tensor Cores 32
TDP 90 W
Fourchette de prix Integree
Sortie 2025-03

Benchmarks IA

Mesures réelles d’inférence — llama.cpp Q4_K_M

Tâche Résultat
Llama 1B Q4 400 tok/s
Llama 3B Q4 200 tok/s
Llama 7B Q4 110 tok/s
Llama 13B Q4 51 tok/s
Llama 30B Q4 25 tok/s
Llama 70B Q4 45 tok/s
Stable Diffusion 512px 2.5s / img
Whisper Large RTF 0.3x

RTF < 1.0 = plus rapide que le temps réel. Pour Stable Diffusion et Whisper, plus bas est meilleur ; pour les tokens/s, plus haut est meilleur.

Comparer M4 Ultra avec un autre GPU

Mise à niveau utile ? Comparez les specs et benchmarks réels côte à côte.

Ouvrir le comparateur →
Comparaisons rapides : vs RTX 5080 · vs M3 Ultra

Modèles IA compatibles — M4 Ultra

93 modèles fonctionne entièrement en VRAM · 3 avec offloading CPU

Voir les 93 modèles compatibles →

Fonctionne aussi avec offloading CPU (3)

M4 Ultra · Amazon

Les prix des GPU changent souvent selon les vendeurs. Verifiez l offre actuelle avant achat.

Vérifier l'offre actuelle

Certains liens sont des liens d'affiliation Amazon. Nous pouvons toucher une commission sans coût supplémentaire pour vous. Le cookie Amazon peut durer jusqu'à 24 heures après votre clic.

M4 Ultra pour l’intelligence artificielle locale

M4 Ultra avec 128GB de Unified Memory est une option solide pour l'IA locale. Cette carte couvre les modèles populaires en quantification Q4 et permet d'aller plus loin selon la VRAM disponible.

En benchmarks réels, M4 Ultra atteint 110 tokens/seconde sur Llama 7B Q4. Vous pouvez aussi exécuter 93 modèles entièrement en VRAM, avec 3 modèles supplémentaires en offloading CPU.

Pour vérifier précisément la compatibilité de chaque modèle, utilisez le calculateur VRAM. Vous pouvez également consulter les guides de démarrage pour configurer votre environnement local.

Planifiez votre build IA complet

M4 Ultra · 128 GB VRAM — configurez PSU, RAM, stockage et vérifiez les modèles compatibles.

Configurer votre build →

Vous ne savez pas quel modèle exécuter sur votre M4 Ultra ?

Le calculateur VRAM vous indique exactement quelle quantification utiliser.

Ouvrir le calculateur →

Obtenez le meilleur prix pour M4 Ultra

Ouvrez Amazon via notre lien affilié et vérifiez la disponibilité, les variantes et les offres actuelles.

Voir le meilleur prix →