M3 Ultra
94 modelli IA entrano in 192 GB di VRAM in Q4 nativo. 3 altri funzionano con offloading CPU. Benchmark reali qui sotto.
llama.cpp 0.2.x · CUDA 12 · Ubuntu 22.04 · Prices verified on Amazon · metodologia →
Contesto di esecuzione
Controlla l'offerta attuale
Link affiliato Amazon per M3 Ultra
Alcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.
Specifiche complete
Apple · 2024-05
| VRAM | 192 GB Unified Memory |
| Banda | 800 GB/s |
| FP16 TFLOPS | 28 |
| AI Score | 82 / 140 |
| Tensor Cores | 80 |
| TDP | 80 W |
| Fascia di prezzo | Integrata |
| Rilascio | 2024-05 |
Benchmark IA
Misurazioni reali di inferenza — llama.cpp Q4_K_M
| Attivita | Risultato |
|---|---|
| Llama 1B Q4 | 400 tok/s |
| Llama 3B Q4 | 168 tok/s |
| Llama 7B Q4 | 95 tok/s |
| Llama 13B Q4 | 37 tok/s |
| Llama 30B Q4 | 19 tok/s |
| Llama 70B Q4 | 38 tok/s |
| Stable Diffusion 512px | 3s / img |
| Whisper Large RTF | 0.35x |
RTF < 1.0 = piu veloce del tempo reale. Per Stable Diffusion e Whisper, piu basso e meglio; per tokens/s, piu alto e meglio.
Confronta M3 Ultra con un altra GPU
Vale la pena fare l upgrade? Confronta specifiche e benchmark reali fianco a fianco.
Apri comparatore →Modelli IA compatibili — M3 Ultra
94 modelli entrano interamente in VRAM · 3 con offloading CPU
Llama 3.3 70B
Flux.1 Dev
Whisper Large V3
Qwen2.5 72B
Stable Diffusion 3.5 Large
FLUX.2 Dev
Llama 3.1 70B
Qwen2.5-Coder 32B
Vedi tutti i 94 modelli compatibili →
Funziona anche con offloading CPU (3)
- Llama 3.1 405B 115 GB Q2 Come installare →
- DeepSeek V3.2 184.5 GB Q2
- Hermes 3 405B 115 GB Q2 Come installare →
M3 Ultra · Amazon
I prezzi delle GPU cambiano spesso tra i rivenditori. Controlla l offerta attuale prima di acquistare.
Controlla l'offerta attualeAlcuni link sono link di affiliazione Amazon. Potremmo ricevere una commissione senza costi aggiuntivi per te. Il cookie Amazon puo durare fino a 24 ore dopo il clic.
M3 Ultra per IA locale
M3 Ultra con 192GB di Unified Memory e un'opzione solida per IA locale. Questa GPU copre i modelli piu usati in quantizzazione Q4 e permette carichi piu grandi in base alla VRAM disponibile.
Nei benchmark reali, M3 Ultra raggiunge 95 token/secondo su Llama 7B Q4. Puoi eseguire 94 modelli interamente in VRAM, con altri 3 modelli in offloading CPU.
Per verificare in dettaglio la compatibilita di ogni modello, usa il calcolatore VRAM. Puoi anche consultare le guide introduttive per configurare il tuo ambiente locale.
Pianifica la tua build IA completa
M3 Ultra · 192 GB VRAM — configura PSU, RAM, storage e verifica i modelli compatibili.
Articoli correlati
Non sai quale modello eseguire sulla tua M3 Ultra?
Il calcolatore VRAM ti dice esattamente quale quantizzazione ti serve.
Ottieni il miglior prezzo per M3 Ultra
Open Amazon with our affiliate link and check availability, variants, and current deals.