M3 Pro
74 modelos de IA caben en 18 GB de VRAM en Q4 nativo. 9 más funcionan con offloading en CPU. Benchmarks reales más abajo.
llama.cpp 0.2.x · CUDA 12 · Ubuntu 22.04 · Prices verified on Amazon · metodología →
Contexto de ejecución
Consultar oferta actual
Enlace de afiliado de Amazon para M3 Pro
Algunos enlaces son enlaces de afiliado de Amazon. Podemos ganar una comisión sin coste adicional para ti. La cookie de Amazon puede durar hasta 24 horas tras tu clic.
Especificaciones completas
Apple · 2023-10
| VRAM | 18 GB Unified Memory |
| Ancho de banda | 150 GB/s |
| FP16 TFLOPS | 7.4 |
| AI Score | 38 / 140 |
| Tensor Cores | 16 |
| TDP | 30 W |
| Rango de precio | Integrada |
| Lanzamiento | 2023-10 |
Benchmarks de IA
Mediciones reales de inferencia — llama.cpp Q4_K_M
| Tarea | Resultado |
|---|---|
| Llama 1B Q4 | 79 tok/s |
| Llama 3B Q4 | 32 tok/s |
| Llama 7B Q4 | 32 tok/s |
| Llama 13B Q4 | 7 tok/s |
| Llama 30B Q4 | VRAM N/D |
| Llama 70B Q4 | Offload o multi-GPU |
| Stable Diffusion 512px | 10s / img |
| Whisper Large RTF | 1x |
RTF < 1.0 = más rápido que tiempo real. En Stable Diffusion y Whisper cuanto menor, mejor; en tokens/s cuanto mayor, mejor.
Comparar M3 Pro con otra GPU
¿Vale la pena el upgrade? Compara specs y benchmarks reales lado a lado.
Abrir comparador →Modelos de IA compatibles — M3 Pro
74 modelos se ejecutan completos en VRAM · 9 con offloading en CPU
Flux.1 Dev
Whisper Large V3
Stable Diffusion 3.5 Large
FLUX.2 Dev
Stable Diffusion 3.5 Medium
Gemma 4 27B
Gemma 2 27B
Gemma 3 27B
Ver los 74 modelos compatibles →
También funciona con offloading en CPU (9)
- Qwen2.5-Coder 32B 9.6 GB Q2 Cómo instalar →
- DeepSeek R1 Distill 32B 9.6 GB Q2 Cómo instalar →
- Qwen2.5 32B 9.6 GB Q2 Cómo instalar →
- Qwen3.5 35B-A3B 9.6 GB Q2 Cómo instalar →
- Mixtral 8x7B 14 GB Q2 Cómo instalar →
- CodeLlama 34B 10 GB Q2 Cómo instalar →
- Yi 1.5 34B 10 GB Q2 Cómo instalar →
- Nous Hermes 2 Mixtral 8x7B 13 GB Q2 Cómo instalar →
- Phi-3.5 MoE 11 GB Q2 Cómo instalar →
M3 Pro · Amazon
Los precios de las GPU cambian con frecuencia entre tiendas. Consulta la oferta actual antes de comprar.
Consultar oferta actualAlgunos enlaces son enlaces de afiliado de Amazon. Podemos ganar una comisión sin coste adicional para ti. La cookie de Amazon puede durar hasta 24 horas tras tu clic.
M3 Pro para Inteligencia Artificial Local
La M3 Pro con 18GB de Unified Memory es una opción equilibrada para IA local. Puede correr modelos 7B y 13B en Q4 sin problemas, y modelos 7B en FP16. Es ideal para usuarios que quieren una experiencia fluida con los modelos más populares como Llama 3.1 8B, Mistral 7B, Phi-4 o Qwen2.5 14B.
Los benchmarks reales muestran 32 tokens/segundo en Llama 7B Q4. Para generación de imágenes, Stable Diffusion XL y SD 3.5 Medium caben perfectamente. Whisper Large V3 para transcripción de audio también es compatible.
Con 18GB de VRAM tienes acceso a 74 modelos completos y 9 adicionales con offloading parcial. Usa la calculadora de VRAM para ver las opciones de cuantización disponibles para cada modelo.
Planifica tu build completa de IA
M3 Pro · 18 GB VRAM — configura PSU, RAM, almacenamiento y revisa modelos compatibles.
Artículos relacionados
¿No sabes qué modelo correr en tu M3 Pro?
La calculadora de VRAM te dice exactamente qué cuantización necesitas.
Consigue el mejor precio para M3 Pro
Abre Amazon con nuestro enlace afiliado y revisa disponibilidad, variantes y ofertas actuales.