Por qué los primeros 90 días son el momento de decisión real
La mayoría de los proyectos de IA en empresas mid-size no fracasan en la implementación técnica. Fracasan en la transición entre el piloto y la segunda fase.
El equipo técnico entrega algo que funciona. El proveedor presenta una demo. Y el CFO tiene que decidir si aprobar más presupuesto sin tener claro qué medir ni qué esperar.
El resultado habitual: la decisión se pospone, el proyecto pierde impulso y el equipo vuelve a los procesos anteriores.
Este artículo propone cinco métricas que un CFO puede exigir antes de esa decisión. No son métricas técnicas. Son métricas de negocio que cualquier responsable financiero puede interpretar sin necesidad de entender cómo funciona el modelo de lenguaje por debajo.
Métrica 1: Tasa de adopción real del agente
Un agente en producción que nadie usa no genera valor. La primera pregunta no es si el sistema funciona, sino si el equipo lo está usando.
Qué medir: porcentaje de transacciones o consultas del proceso objetivo que pasan por el agente versus las que siguen resolviéndose de forma manual o por canales alternativos.
Umbral razonable a 90 días: entre el 60% y el 80% de adopción en el proceso específico donde se implementó. Si está por debajo del 50%, hay un problema de integración, de confianza del equipo o de diseño del flujo.
Por qué importa al CFO: la adopción baja es el indicador más temprano de que el ROI proyectado no se va a materializar. No porque el sistema falle, sino porque el equipo lo evita.
Métrica 2: Reducción de horas manuales en el proceso objetivo
Esta es la métrica más directa para justificar la inversión inicial.
Qué medir: horas semanales dedicadas al proceso antes de la implementación versus después. Incluir tanto el tiempo de ejecución como el tiempo de revisión y corrección.
Hipótesis de rango: en procesos de reporting, conciliación o atención a consultas internas, es razonable esperar una reducción de entre el 30% y el 60% del tiempo manual en los primeros 90 días, dependiendo del volumen y la complejidad del proceso.
Ejemplo concreto: una empresa de distribución con operaciones en tres países implementó un agente para consolidar el reporte semanal de inventario. El proceso requería entre 6 y 8 horas semanales de un analista financiero. A las 10 semanas, el tiempo de revisión y ajuste manual se redujo a menos de 2 horas. El analista pasó a validar outputs en lugar de construirlos.
Por qué importa al CFO: convierte el costo del proyecto en un número comparable. Si el agente libera 20 horas mensuales de un perfil con un costo de 3.000 euros al mes, el cálculo de recuperación de inversión deja de ser abstracto.
Métrica 3: Tasa de precisión de los outputs
Un sistema que automatiza pero introduce errores genera más trabajo, no menos.
Qué medir: porcentaje de outputs del agente que requieren corrección manual antes de ser utilizados. Esto incluye errores de datos, formatos incorrectos, omisiones o interpretaciones equivocadas.
Umbral razonable a 90 días: en procesos estructurados, una tasa de error por encima del 10% es una señal de que el sistema necesita ajuste antes de escalar. En procesos críticos como reporting financiero, el umbral debería ser más estricto.
Por qué importa al CFO: la precisión determina si el sistema reduce o redistribuye la carga. Un agente con alta tasa de error no libera tiempo, lo desplaza hacia revisión y corrección.
Métrica 4: Costo operativo por transacción automatizada
Esta métrica conecta el gasto en infraestructura de IA con el volumen de trabajo procesado.
Qué medir: costo mensual total del sistema (licencias, APIs, tiempo de gobierno) dividido por el número de transacciones o tareas completadas por el agente en ese período.
Para qué sirve: permite comparar el costo de automatizar una tarea con el costo de ejecutarla manualmente. También permite proyectar qué ocurre con el costo unitario cuando el volumen escala.
Señal de alerta: si el costo por transacción automatizada es similar o superior al costo manual equivalente, el caso de negocio no se sostiene en el volumen actual. Puede sostenerse si el volumen crece, pero eso debe estar explícito en la proyección.
Por qué importa al CFO: es la métrica que permite evaluar si el modelo es escalable o si el ahorro depende de un volumen mínimo que todavía no se ha alcanzado.
Métrica 5: Tiempo estimado de recuperación de la inversión inicial
No es una métrica de los 90 días en sí misma, sino el resultado de combinar las anteriores.
Cómo calcularlo: inversión inicial del proyecto dividida por el ahorro mensual neto generado (horas liberadas valoradas a costo real, menos costo operativo del sistema).
Rango razonable para proyectos mid-size: entre 4 y 10 meses para procesos de volumen medio. Si el cálculo supera los 18 meses, el proyecto necesita revisión de alcance o de supuestos.
Por qué importa al CFO: es el número que convierte el debate sobre tecnología en un debate sobre rentabilidad. Y es el número que justifica —o no— aprobar la segunda fase.
Cómo usar estas métricas antes de la reunión de revisión
La recomendación práctica es simple: antes de la reunión de revisión de los 90 días, solicite al equipo responsable del proyecto un informe que responda estas cinco preguntas con datos reales, no con estimaciones.
Si el equipo no puede responderlas, no es necesariamente una señal de que el proyecto fracasó. Puede ser una señal de que no se definieron los indicadores de éxito al inicio, lo cual es un problema de metodología que conviene corregir antes de escalar.
Si el equipo puede responderlas y los números son razonables, la decisión de continuar tiene base. Si los números no son razonables, la conversación sobre ajustes puede ser concreta en lugar de especulativa.
Conclusión
Aprobar la segunda fase de un proyecto de IA sin métricas claras es asumir un riesgo innecesario. Las cinco métricas descritas aquí no requieren conocimiento técnico para interpretarse. Requieren que el proyecto haya sido diseñado desde el inicio con criterios de negocio medibles.
Si está evaluando un proyecto de IA en su empresa y quiere revisar si los indicadores actuales son suficientes para tomar esa decisión, podemos hacer ese análisis juntos en una llamada breve.