El “empate” que cuesta caro: qué decisión estás tratando de tomar (y qué error no te puedes permitir)
Hay un tipo de empate que no se siente neutral. Se siente como una piedra en el zapato.
Abres el tablero y dos sucursales “rinden igual”: mismo ticket promedio, misma conversión, mismo nivel de reclamos. En teoría deberías poder elegir “la mejor”. En la práctica, alguien ya está pidiendo ranking, alguien quiere “reconocer al ganador” y alguien más propone mover dotación “para destrabar”.
Con poco volumen, esa urgencia es el camino rápido a premiar la suerte.
Porque cuando hay pocos casos, el KPI se mueve con cualquier cosa: una venta grande, un día de lluvia, un problema con el sistema, una ausencia, un cliente especialmente ruidoso. Y ahí pasa lo peor: tomas una decisión grande con evidencia chica… y la decisión queda tatuada en la cultura.
Ejemplo típico (y muy real). Sucursal A en zona de oficinas trabaja fuerte de lunes a viernes, recibe más clientes recurrentes y el equipo ya conoce patrones. Sucursal B en zona residencial explota los sábados, atiende más cambios y devoluciones, y le cae más gente nueva por cercanía. Al cierre del mes, la conversión empata.
Si coronas ganadora a A, quizás estás premiando el mix (la intención de compra). Si “corriges” a B, quizás estás castigando la fricción que le tocó administrar (familias, indecisos, postventa).
Aquí la pregunta importante no es “¿quién ganó?”. Es: ¿qué decisión estás intentando tomar y cuánto te cuesta equivocarte?
- Si lo que quieres es mover dotación, el costo de error es alto (operativo y humano).
- Si lo que quieres es ajustar un microproceso, el costo es más bajo y normalmente reversible.
- Si lo que quieres es ajustar incentivos, el costo puede ser brutal si disparas comportamientos raros (y eso no se arregla con un email).
“Poco volumen” no es un número mágico, pero se reconoce fácil: es cuando tu KPI cambia demasiado con muy pocos eventos. Si con una venta, un reclamo o un turno mal cubierto cambia el relato del mes, estás en muestra chica. Y en muestra chica manda la variabilidad.
Una nota que evita peleas internas: rankear te da una sensación deliciosa de control. Es como ordenar el clóset y creer que tu vida ya quedó resuelta. El problema es que, con poco volumen, el “mejor” de esta semana suele ser el “peor” de la próxima sin que haya cambiado nada relevante.
Lo que sí puedes hacer (y se agradece) es tomar decisiones que reduzcan el costo de errarle: mejorar medición, segmentar, buscar estabilidad, y recién ahí intervenir.
Tip práctico #1: antes de comparar sucursales con poco volumen, escribe en una línea la decisión posible. Ejemplos: “¿Reasigno un rol clave?”, “¿Estandarizo la apertura?”, “¿Ajusto el guion de postventa?”. Si no puedes nombrar la decisión, el tablero te va a empujar a un ranking por inercia.
Tip práctico #2: arma un mini “calendario de distorsiones” del periodo (quincena, feriados, obras, eventos del barrio, campañas, cortes de sistema). No es burocracia: es contexto. Y el contexto, con poco volumen, vale oro.
Señales de muestra chica: cómo detectar si el empate es real o puro azar (antes de tocar dotación)
Para comparar sucursales con poco volumen sin sesgo, el promedio del KPI principal no alcanza. El promedio es útil, sí, pero en muestra chica puede mentir con cara seria.
Aquí lo que te salva es mirar tres cosas: estabilidad, dispersión y mix.
Tres preguntas de estabilidad (para no reaccionar al ruido)
Antes de mover dotación o anunciar un “plan de choque”, haz estas preguntas. No como checklist de auditoría, sino como freno de mano.
- ¿Cuánto cambia semana a semana (o por quincena)? Si una sucursal pasa de “excelente” a “regular” cada semana, puede ser ruido… o puede ser un proceso inconsistente que depende demasiado de una persona.
- ¿Quién cambia cuando cambia el mix? Hay equipos que se ven bien cuando el mix es “fácil” (recurrentes, reposición, poco postventa) y se hunden cuando entran casos complejos. Y otros que se lucen justamente ahí.
- ¿La brecha se sostiene en más de un corte? Un empate mensual puede esconder una diferencia real que aparece cuando miras por semana, por turno o por franja horaria.
Regla práctica (de esas que bajan la ansiedad): si el orden relativo entre sucursales cambia en casi todos los cortes, pausa decisiones grandes. Si el patrón se mantiene en al menos dos cortes consecutivos y además se mueven uno o dos indicadores adelantados en la misma dirección, ahí sí vale la pena investigar o pilotear.
Señales de mix que suelen romper la comparación
El mix es el villano silencioso de los rankings.
Una sucursal puede verse peor solo porque atiende más fricción: devoluciones, garantías, aclaraciones, picos de fin de semana, o clientes nuevos que preguntan más. También cambia por canal: no es lo mismo el flujo de gente que entra “a mirar” que el retiro de una compra, ni el cliente que llega por una campaña local.
Dos mini-casos que se repiten, aunque cambie el rubro:
Caso 1: KPI igual, pero dispersión distinta. Dos sucursales cierran el mes con 4.6 de satisfacción. Empate. Pero en A casi todas las encuestas caen entre 4 y 5. En B hay muchas de 5 y varias de 1 por incidentes puntuales.
B no es “peor”; B es más volátil. Y eso cambia la acción: en vez de exigir promedio, buscas bajar incidentes (y proteger la experiencia cuando algo falla). Es otra conversación.
Caso 2: KPI igual, pero mix distinto. Conversión 22% en ambas. A recibe más clientes con intención clara por ubicación y horario. B recibe más “curiosos” de sábado, familias, y gente comparando. Si comparas sin segmentar, castigas el mix.
En operaciones, segmentar no tiene que ser una tesis: muchas veces basta con separar por franja horaria, por día de semana vs fin de semana, o por “tipo de atención” (venta directa vs postventa vs consultas).
Tip práctico #3: si el mix manda, evita metas únicas sobre un solo KPI. Ese combo empuja comportamientos raros: “optimizo conversión” a costa de filtrar clientes, o “bajo reclamos” a costa de decir que no a todo. Si quieres el lado humano (y peligrosamente práctico) de esto, el artículo “Cuando los incentivos deciden por ti” lo explica con claridad: [1]
Qué mirar además del KPI principal: leading indicators y distribución
Piensa el KPI principal como el marcador. Con muestra chica, necesitas mirar el partido.
Indicadores adelantados (leading indicators). Son señales que se mueven antes que el resultado. En tienda suelen existir aunque no sean perfectos:
- tiempo de espera (y no solo promedio: también picos)
- recontacto por el mismo problema (la “segunda vuelta” que nadie quiere)
- porcentaje de casos que requieren supervisor
- devoluciones por error de asesoría
- cumplimiento real de apertura/cierre (cuando se hace “a medias” se nota días después)
Distribución (no solo promedio). Te muestra si dependes de pocos casos enormes. Metida de pata clásica: celebrar un buen promedio cuando en realidad todo se sostuvo por dos ventas grandes o por un cliente corporativo que cayó de casualidad.
Un diagnóstico rápido que sí funciona: toma los tres días con peor resultado y pregunta “¿qué pasó?” sin buscar culpables. Caída de sistema, ausencia clave, pico de devoluciones por promo, reclamo viral. Si eso explica gran parte del periodo, tu lectura no debe ser “equipo malo”, sino “riesgo operativo concentrado”.
Momento de error común (esto es donde te quemas): mover gente por el KPI del mes sin revisar si el resultado fue dominado por uno o dos eventos. Al mes siguiente el “problema” desaparece solo, pero tú ya moviste piezas, generaste resentimiento y enseñaste que el tablero manda más que la realidad.
Tip práctico #4: cuando hay poco volumen, mira también la mediana (si la tienes) y compara “días típicos” vs “días raros”. No es sofisticación; es no dejarte engañar por extremos.
Matriz de decisión: cuándo no actuar, cuándo investigar y cuándo pilotear (sin coronar ganadores)
Cuando el tablero te grita “empate”, lo tentador es hacer algo ya.
Con bajo volumen, muchas veces conviene actuar menos… pero mejor. La decisión madura no es “quién gana”, sino qué acción tiene mejor relación entre velocidad y riesgo de equivocarnos.
Aquí ayuda pensar en una matriz simple (volumen, estabilidad, brecha e impacto) que te abre seis jugadas. No es teoría: es un menú para no improvisar.
Y sí: a veces la jugada correcta es no hacer nada. No por flojera, sino porque el costo de mover es mayor que el costo de esperar y medir mejor.
A continuación, el artefacto tal cual para que puedas usarlo como regla de bolsillo y sea auditable:
Cómo usarla sin convertirte en robot: elige una fila y pregúntate si tu situación calza de verdad. Si no calza, no la fuerces; úsala para descubrir qué te falta (más volumen, más cortes, mejor segmentación, o claridad de impacto).
- Si el volumen es bajísimo y el impacto es bajo, Status Quo puede ser una decisión inteligente.
- Si el volumen es bajo pero la conversación interna está cargada (“favoritismos”, “siempre gana la misma”), Round-Robin suele ser más saludable que pelear por un ranking frágil.
- Si el empate persiste y la decisión es grande, Investigar te ahorra errores caros.
- Si ya tienes volumen y una hipótesis concreta, Pilotear te permite aprender sin apostarlo todo.
Una idea que aterriza bien este enfoque: tener más datos no garantiza mejores decisiones si no sabes qué decisión estás intentando tomar y cuánto duele errarle. Esta columna lo baja a tierra: [2]
Qué dejar por escrito para que sea auditable (sin burocracia)
Esto suena aburrido hasta que hay que explicarle a dirección por qué moviste gente y el mes siguiente lo revertiste.
Una “nota de decisión” corta baja política y sube consistencia. No necesitas un documento eterno: con 6 a 8 puntos bien elegidos ya cambias el juego.
- decisión y fecha
- KPI y periodo observado
- cuántos cortes miraste (semana/quincena/turno)
- mix relevante (qué cambió entre sucursales)
- outliers/eventos y su impacto
- acción elegida y reversibilidad
- guardrails de servicio
- fecha exacta de revisión
Frase que desactiva guerras de ego: “No estamos comparando personas, estamos comparando condiciones. Queremos que el sistema sea más justo y más predecible.”
Tip práctico #5: en esa nota, separa “hechos” de “suposiciones”. Hecho: “hubo 3 caídas de sistema”. Suposición: “por eso bajó la conversión”. Esa distinción te obliga a buscar un indicador adelantado que confirme (o te diga que estás contando un cuento lindo).
Si vas a intervenir: cómo armar un piloto que no contamine la operación
Intervenir no es pecado. Lo que mata es intervenir mal… y enamorarte del resultado porque “ya invertimos”.
Si decides pilotear, la pregunta es cómo mantener la comparación limpia mientras la operación sigue viva.
Regla de campo: si cambias cinco cosas al mismo tiempo, no hiciste un piloto; hiciste un cóctel. Y al día siguiente no sabes qué ingrediente te cayó mal.
Diseños simples que funcionan con poco volumen (y con equipos reales):
- Rotación parcial: no mueves a todo el equipo. Mueves un rol específico (por ejemplo, líder de piso o especialista de postventa) por un periodo corto. Esto suele darte aprendizaje sin romper la operación.
- Ventanas de tiempo: pruebas en franjas controlables (por ejemplo, 11 a 15 de lunes a viernes) donde el mix es más comparable. Es más fácil interpretar resultados cuando el contexto se parece.
- Cohortes comparables: separas “clientes nuevos por campaña local” vs “recurrentes por reposición”, o “compra rápida” vs “casos de asesoría”. No necesitas perfección; necesitas coherencia.
Guardrails que conviene congelar durante el piloto (porque si los mezclas no vas a saber qué funcionó):
- no cambies horarios a la vez
- evita promos locales en medio de la prueba
- no reorganices turnos completos si lo que quieres probar es un microproceso
- no toques incentivos durante el piloto (si los tocas, el comportamiento cambia aunque el proceso sea el mismo)
Criterio de parada sano: si tienes dos cortes consecutivos con caída clara en experiencia (suben reclamos o tiempos de espera) y además el equipo reporta fricción operativa, detén el cambio y vuelve a la base. No negocies con el cliente para “terminar la prueba”.
Momento de error común (otra forma de quemarte): hacer un piloto “para aprender” pero comunicarlo como competencia entre sucursales. En dos días ya estás midiendo orgullo, no proceso. Y el resultado te sale “contaminado” aunque el KPI parezca limpio.
Tip práctico #6: nombra el piloto como lo que es: “prueba de proceso”, “prueba de asignación”, “prueba de capacitación”. Si lo llamas “desafío” o “ranking”, vas a obtener conductas de ranking.
Si te sirve un marco para no pasarte de rosca con experimentos, este artículo sobre exceso de pruebas A/B trae advertencias aplicables a operaciones físicas: [3]
Modos de fallo que hacen que el ranking premie la suerte (y cómo monitorearlos)
Comparando con bajo volumen, hay fallas previsibles. Si las monitoreas, evitas decisiones flojas con apariencia de “mano firme”.
1) Comparar promedios con distribuciones distintas. Síntoma: el promedio se ve bien, pero cada semana hay uno o dos casos que rompen todo. Acción: separa operación normal de eventos raros y pon mitigación para los raros (porque si no, vas a perseguir fantasmas).
2) Efectos de composición (cuando cambia el contexto y tú crees que cambió el equipo). Síntoma: la sucursal “mejora” justo cuando cambia calendario, quincena, obras cerca o campañas. Acción: revisa por segmentos simples: franja horaria, día de semana vs fin de semana, tipo de caso.
3) Gaming por incentivos. Síntoma: sube el KPI, pero suben reclamos o devoluciones, o aparecen derivaciones de más. Acción: pon un contrapeso: conversión con reclamos, ticket con devoluciones, velocidad con recontacto. Y conversación explícita de servicio (sin eso, el equipo optimiza lo que le pagan, no lo que tú crees que le pediste).
4) Confundir dotación con capacidad real. Síntoma: misma cantidad de gente, experiencia distinta por mezcla de perfiles, antigüedad o ausencia de un líder. Acción: mira por turnos y por rangos de antigüedad. A veces no falta gente: falta “orquestación”.
5) Narrativa post hoc (la explicación brillante que aparece después). Síntoma: después de ver el resultado, todos encuentran una causa “obvia”. Acción: escribe la hipótesis antes y define qué indicador adelantado debería moverse. Si no se mueve nada más y solo cambia el KPI, sospecha suerte.
Monitoreo liviano (que no te coma la semana): durante 2 a 4 semanas, dos revisiones la primera semana y luego semanal si no hay degradación. Pide dos cortes consecutivos apuntando en la misma dirección y coherencia con al menos un indicador adelantado.
Tip práctico #7: cuando detectes un modo de fallo, no lo conviertas en regaño. Conviértelo en ajuste del sistema. Si no, lo único que logras es que la gente aprenda a esconder el problema (y tú te quedas con un KPI “bonito” y una realidad frágil).
Cierre operativo: un checklist de 10 minutos para decidir hoy (y dejar rastro)
Si estás con el tablero abierto y la ansiedad subiendo, aquí va una forma de decidir hoy sin premiar la suerte y sin castigar el mix.
No es para “hacer pasos”. Es para recuperar el control de la decisión.
¿Qué decisión concreta estás por tomar: mover dotación, ajustar proceso o esperar?
¿El “empate” se sostiene en 3 o 4 cortes, o cambia todo el tiempo?
¿Hay outliers que dominen el periodo?
¿El mix es comparable por horario, canal y tipo de caso?
¿Qué dos indicadores adelantados acompañan al KPI principal?
¿Qué opción es más reversible si te equivocas?
¿Qué guardrails de servicio no estás dispuesto a romper?
¿Cuál es tu criterio de parada?
¿Qué vas a comunicar para que no suene a premio o castigo?
¿Qué fecha exacta usarás para revisar?
Plan realista para el lunes (sin épica, con impacto): primero escribe la nota de decisión y agenda la revisión antes de cambiar nada. Luego separa el KPI por franja horaria, identifica outliers con causa, y elige un microproceso para estandarizar en ambas sucursales.
Si con eso logras que el equipo deje de pelear por el ranking y empiece a hablar de mix, dispersión y estabilidad, ya ganaste una mejora operativa que no siempre sale en el tablero… pero se siente en todo lo demás.
| Estrategia de asignación | Mejor para | Ventajas | Riesgos | Recomendado cuando |
|---|---|---|---|---|
| Rotación Equitativa (Round-Robin) | Empates de bajo volumen, prioridad: equidad | Simple, percibe justicia, evita favoritismos | No optimiza, oculta problemas reales | Volumen <75/mes, métricas muy similares, equidad clave |
| No actuar (Status Quo) | Empates de bajo volumen, impacto bajo | Evita decisiones prematuras, bajo costo | Ineficiencias persistentes, oportunidades perdidas | Volumen <50/mes, diferencia <5%, impacto nulo |
| Investigar (Análisis Causa Raíz) | Empates persistentes, volumen moderado, alto impacto | Identifica causas, decisiones basadas en datos | Largo análisis, parálisis por análisis | Volumen >50/mes, diferencia <10%, impacto alto |
| Pilotear (Cambio Controlado) | Empates con volumen para A/B, impacto medio | Aprendizaje controlado, decisión reversible | Contaminación, complejidad operativa, sesgo | Volumen >100/mes, diferencia <15%, impacto medio |
| Intervención Directa (Cambio Estratégico) | Fallo claro en una sucursal, alto impacto | Corrección rápida, mejora inmediata | Irreversible, impacto negativo si análisis erróneo | Análisis concluyente de fallo, impacto crítico |
| Monitoreo Continuo (Sin Intervención) | Alta variabilidad, factores externos incontrolables | Evita reaccionar a ruido, permite ajuste | Pérdida de oportunidades, problemas no abordados | Mercado volátil, factores externos dominantes, bajo impacto |
Fuentes
- revistalideres.ec — revistalideres.ec
- expansion.mx — expansion.mx
- infobae.com — infobae.com

