Skip to main content

Hermes 2 Pro Llama-3 8B con RTX 5080: ¿Compatible?

8B parámetros · 16GB VRAM (GDDR7) · NVIDIA

Compatible — la RTX 5080 puede ejecutar Hermes 2 Pro Llama-3 8B

Calidad máxima disponible. La RTX 5080 tiene suficiente VRAM para FP16 completo.

Análisis de VRAM por cuantización

Cuantización VRAM requerida Tu GPU ¿Funciona?
FP16 (máxima calidad) 16 GB 16 GB ✓ Sí
Q8 (alta calidad) 8 GB 16 GB ✓ Sí
Q4 (recomendado) Recomendado 5 GB 16 GB ✓ Sí
Q2 (mínimo) 3 GB 16 GB ~ Parcial

Instalar con Ollama

Ejecuta este comando en tu terminal para descargar y correr Hermes 2 Pro Llama-3 8B:

ollama run hermes2-pro-llama3:8b

Requiere Ollama instalado. Descárgalo gratis en ollama.ai

Rendimiento estimado

Velocidad estimada ~188 tok/s (muy rápida (tiempo real))
Margen de VRAM en Q4 +11 GB
Mejor cuantización disponible FP16
Ancho de banda de memoria 960 GB/s

Comprar RTX 5080

La RTX 5080 es una opción premium para ejecutar Hermes 2 Pro Llama-3 8B.

Aviso de afiliado: Este enlace es patrocinado. Podemos recibir una comisión sin coste adicional para ti.

Ver RTX 5080 en Amazon →