El problema real no es técnico: es de visibilidad
Cuando una empresa implementa un agente de IA, la conversación inicial suele girar en torno a lo que el agente puede hacer. Pocas veces se habla de cómo saber si lo está haciendo bien.
El resultado habitual: el equipo técnico tiene acceso a logs, trazas y métricas de infraestructura. El CFO o COO recibe, en el mejor caso, un reporte mensual con capturas de pantalla. En el peor caso, no recibe nada y asume que "está funcionando" porque nadie se queja.
Eso no es gobierno. Es fe.
Un agente de IA es un proceso de negocio. Y como cualquier proceso de negocio, debe poder medirse con indicadores que la dirección pueda leer, interpretar y usar para tomar decisiones. Sin necesidad de intermediarios técnicos.
Este artículo describe las cuatro métricas que permiten hacer exactamente eso.
Métrica 1: Tasa de resolución autónoma
Esta es la métrica más directa. Mide qué porcentaje de las tareas asignadas al agente se completan sin intervención humana.
Si el agente gestiona solicitudes de aprobación de gastos, por ejemplo, la tasa de resolución autónoma indica cuántas de esas solicitudes procesa solo, versus cuántas requieren que alguien del equipo intervenga.
Un agente bien calibrado debería resolver de forma autónoma entre el 70% y el 90% de los casos para los que fue diseñado. Si ese número baja del 60%, hay un problema: o el agente no está bien entrenado para el volumen real de casos, o el alcance definido en la implementación no coincide con lo que el negocio le está pidiendo.
Esta métrica no requiere acceso técnico. Es un número. Se puede poner en un dashboard de gestión junto al resto de KPIs operativos.
Métrica 2: Tasa de escalado
Complementaria a la anterior. Mide con qué frecuencia el agente transfiere una tarea a un humano porque no puede o no debe resolverla solo.
El escalado no es necesariamente un problema. Un agente bien diseñado escala cuando corresponde: casos fuera de su alcance, situaciones que requieren criterio, excepciones que no estaban previstas. El problema aparece cuando la tasa de escalado es alta de forma sistemática o cuando sube sin razón aparente.
Un incremento sostenido en la tasa de escalado es una señal de alerta temprana. Puede indicar que el volumen de casos atípicos está creciendo, que el agente necesita ajuste, o que hay un cambio en el proceso de negocio que no se reflejó en la configuración del agente.
Para el CFO, esta métrica funciona como un indicador de riesgo operativo. Si la tasa de escalado sube, hay algo que revisar antes de que se convierta en un problema mayor.
Métrica 3: Tiempo de ciclo por tarea
Mide cuánto tiempo tarda el agente en completar una tarea desde que la recibe hasta que entrega el resultado.
Esta métrica tiene dos usos. El primero es comparativo: ¿cuánto tardaba ese mismo proceso antes del agente? Si el proceso de conciliación de facturas tardaba 4 horas con intervención manual y ahora tarda 12 minutos, eso es un dato de negocio concreto, no una promesa de marketing.
El segundo uso es de monitoreo continuo. Si el tiempo de ciclo empieza a crecer sin que haya cambiado el volumen de trabajo, puede indicar un problema de rendimiento, una dependencia externa que está fallando, o una acumulación de casos sin resolver.
El tiempo de ciclo es una métrica que cualquier director de operaciones entiende de inmediato. No necesita traducción técnica.
Métrica 4: Costo por tarea
Esta es la métrica que más interesa a un CFO y, paradójicamente, la que menos se instrumenta en implementaciones de agentes.
Cada vez que un agente ejecuta una tarea, consume recursos: llamadas a modelos de lenguaje, tiempo de cómputo, integraciones con sistemas externos. Ese consumo tiene un costo. Si ese costo no se mide por tarea, es imposible calcular el ROI real del agente.
El cálculo no es complejo. Si el agente procesa 800 solicitudes al mes y el costo total de infraestructura del agente es de 400 euros mensuales, el costo por tarea es de 0,50 euros. Si el mismo proceso costaba 8 euros por tarea con intervención humana, el ahorro es de 7,50 euros por tarea, o 6.000 euros al mes en ese proceso específico.
Esos rangos varían según el tipo de proceso, el volumen y la complejidad. Pero el mecanismo de cálculo es el mismo. Y es un cálculo que el CFO puede hacer solo, sin necesidad de que el equipo técnico lo traduzca.
Un ejemplo concreto: área de compras en empresa industrial
Una empresa de distribución industrial con 80 empleados implementó un agente para gestionar el proceso de validación de órdenes de compra: verificar límites de aprobación, cruzar con presupuesto disponible y enrutar la solicitud al aprobador correspondiente.
Antes del agente, ese proceso tardaba entre 6 y 24 horas dependiendo de la disponibilidad del equipo. Con el agente, el tiempo de ciclo promedio bajó a 18 minutos para el 78% de los casos. El 22% restante se escala a un responsable porque involucra excepciones o montos fuera de política.
El costo mensual del agente, incluyendo infraestructura y gobierno, se situó en un rango de 300 a 500 euros. El equipo de compras recuperó entre 25 y 35 horas mensuales que antes dedicaba a validaciones rutinarias.
Esas cuatro métricas —tasa de resolución, tasa de escalado, tiempo de ciclo y costo por tarea— estaban disponibles en un dashboard que el COO revisaba cada semana. Sin necesidad de hablar con el equipo técnico.
Qué hacer si su empresa no tiene estas métricas hoy
Si su empresa ya tiene agentes en producción y no puede responder con datos concretos a estas cuatro preguntas, hay un problema de gobierno, no de tecnología.
Si está evaluando implementar agentes y nadie le ha hablado de cómo va a medir su rendimiento, es una señal de que la propuesta que tiene sobre la mesa está incompleta.
Las métricas no son un extra. Son parte del diseño del agente. Un agente sin instrumentación de negocio es un proceso sin control.
Si quiere revisar qué métricas tiene sentido instrumentar en su caso —o evaluar si los agentes que ya tiene están generando el retorno esperado— solicite un diagnóstico gratuito. Es un formulario corto, sin llamada inmediata, y le devolvemos una evaluación concreta en menos de 48 horas.