Por Javier Morales · Actualizado: 31 de marzo de 2026 · Cohere

Cómo correr Command R+ en local con Ollama

Transparencia: Algunos enlaces de hardware son de afiliado (Amazon). Esto no afecta nuestra evaluación.

Correr Command R+ en local es más sencillo de lo que parece. Con Ollama puedes tener este modelo de 104B parámetros funcionando en tu PC en menos de 5 minutos. Solo necesitas 59 GB de VRAM para la versión Q4 y conexión a internet para la descarga inicial.

En esta guía cubrimos los requisitos exactos de hardware, el proceso de instalación paso a paso, los comandos necesarios y ejemplos de uso para sacarle el máximo partido a Command R+ desde tu propio hardware.

Requisitos de hardware para Command R+

Cuantización	VRAM necesaria	Notas
FP16 (máxima calidad)	208 GB	Calidad de referencia. Solo GPUs con mucha VRAM.
Q8 (alta calidad)	104 GB	Recomendado si tienes suficiente VRAM.
Q4 (equilibrado)	59 GB (recomendado)	El mejor equilibrio calidad/VRAM. Recomendado.
Q2 (mínimo)	30 GB	Solo si tu VRAM es muy limitada. Pérdida notable.

Especificaciones de Command R+

104B

Parámetros

59 GB

VRAM Q4

131K

Contexto

Cohere

Proveedor

Chat general Razonamiento analysis

Paso 1: Instalar Ollama

Ollama es la forma más sencilla de correr Command R+ en local. Disponible para Windows, macOS y Linux.

1 Descarga Ollama desde ollama.com (Windows, macOS o Linux)
2 Ejecuta el instalador y sigue las instrucciones (tarda menos de 1 minuto)
3 Verifica la instalación abriendo una terminal y ejecutando: ollama --version

Paso 2: Ejecutar Command R+

Una vez instalado Ollama, abre una terminal y ejecuta el siguiente comando. Ollama descargará el modelo automáticamente la primera vez:

Terminal Descarga automática


ollama run command-r-plus

La primera ejecución descargará el modelo (~59 GB en Q4). Las ejecuciones posteriores son instantáneas. Una vez descargado, puedes chatear directamente en la terminal o usar la API local.

Paso 3: Ejemplos de uso de Command R+

Uso con la API REST local

Ollama expone una API en http://localhost:11434 compatible con OpenAI:

curl http://localhost:11434/api/generate -d '{
  "model": "command-r-plus",
  "prompt": "Explica qué es la IA local en 2 párrafos",
  "stream": false
}'

Integración con Python (API OpenAI)

Si tienes instalado el cliente OpenAI de Python:

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:11434/v1",
    api_key="ollama",
)

response = client.chat.completions.create(
    model="command-r-plus",
    messages=[{"role": "user", "content": "Hola, ¿cómo puedes ayudarme?"}]
)
print(response.choices[0].message.content)

GPUs compatibles con Command R+

Estas GPUs tienen suficiente VRAM para correr Command R+ en cuantización Q4 (59 GB):

Apple 128 GB

M4 Ultra

integrated

Ver compatibilidad → Ver disponibilidad →

Apple 192 GB

M3 Ultra