En este artículo explicamos qué son los intervalos de confianza en modelos de Machine Learning y el gran valor que aportan en entornos de negocio. Dejamos también un vídeo de nuestra ponencia sobre en tema en la PyCon España 2022.
A día de hoy son cada vez más las empresas que se apoyan en modelos y técnicas de Machine Learning y Analítica Avanzada para tomar sus decisiones de negocio.
No hay duda de que los datos son el petróleo de esta nueva era y tomar decisiones basadas en ellos supone una ventaja competitiva considerable. No obstante, siguen existiendo escenarios (fluctuación de la bolsa, precio de la energía y commodities, etc.) cuya gran complejidad hace que sean difíciles de modelar hasta con los algoritmos más punteros.
En estas situaciones la solución más viable suele ser cuantificar la incertidumbre del modelo o asignar unos intervalos de confianza en las predicciones para poder tomar decisiones de negocio más precisas.
Qué son los intervalos de confianza
Si te preguntan qué edad tiene una determinada persona, ¿qué responderías? Podrías decir un dato específico basándote en su aspecto físico, el entorno en el que se encuentra, y comparándolo con tu edad o la de otras personas que conoces (28 años), pero la realidad es que no tienes ni idea. ¿No sería mejor decir un intervalo de edades alrededor de la estimación inicial para asegurarte de que la respuesta es correcta? Entre 26 y 30 años. Este es el ejemplo inicial que pusimos en la charla para explicar el concepto de intervalo de confianza.
En el Machine Learning podríamos decir que un intervalo de confianza es un rango de valores entre los cuales se estima que está cierto valor desconocido que ha sido inferido por nuestro modelo predictivo. De esta manera aseguras que la predicción que se ofrece es acertada.
Tal y como comentábamos en la charla, encontramos esta aproximación bastante a menudo en nuestro día a día: cada vez que realizamos un pedido por Amazon, cada vez que pedimos un Glovo, un Cabify, la hora de salida de un vuelo… Las diferentes compañías estiman la hora de llegada en un rango de valores que será mayor cuanto mayor sea la incertidumbre de la estimación. Un paquete pedido a Amazon o una cena en Glovo presentan horquillas de entrega más ajustadas, mientras que en otro tipo de escenarios en los que haya mayor incertidumbre en la entrega, el rango de fechas provistas será significativamente mayor.
Ofrecer una ventana de entrega ajustada resulta de gran valor para los clientes, ya que les permite organizarse mejor, asegurar que el pedido llegará a tiempo y que estarán en el domicilio durante la entrega. En consecuencia, también es realmente beneficioso para la empresa, pues la experiencia del cliente será mejor y ahorrará recursos en entregas fallidas.
El gran valor de los intervalos de confianza para negocio
Como comentábamos más arriba, predecir intervalos de confianza tiene un gran valor a nivel de negocio. Sobre todo, en sectores tan estratégicos como la banca o la energía, en las que un pequeño error puede acarrear grandes pérdidas.
Durante la charla pusimos como ejemplo los modelos de predicción que usan algunas compañías para la compraventa de electricidad en el mercado energético. En la explicación podréis ver claramente que, en caso de hacer una estimación sobre el precio de la energía, es muy distinto aportar un valor puntual que aportar la distribución de precios estimada. Una estimación de un mismo precio, pongamos 120€ puede estar contenida en intervalos de distinto tamaño (100€, 140€), (119, 121€). Si nos quedáramos en la estimación puntual no podríamos medir la incertidumbre, una variable de gran importancia para sectores que toman decisiones directamente sobre los outputs de los modelos provistos. Estrategias como “jugar a lo seguro” apostando únicamente por predicciones con baja incertidumbre para minimizar pérdidas son muy comunes en ciertos sectores, donde los intervalos predictivos son completamente necesarios.
Echa un ojo al vídeo en el que profundizamos en estos casos de uso, explicamos las diferentes aproximaciones posibles para asegurar el tiro en los modelos de Machine Learning (intervalo de confianza, intervalo de predicción y predicción basada en cuartiles) y definimos las ventajas y desventajas de cada uno.
“Asegurando el tiro: intervalos de confianza para tus modelos de Machine Learning” Ángel Luengo y Guillermo Delgado en la PyCon España 2022.
¿Te interesa saber más sobre intervalos de confianza o modelos de Machine Learning? ¿Quieres dar el paso hacia la Transformación Digital y obtener el máximo valor de tus datos? Contacta con nosotros sin compromiso. Además, si quieres conocer mejor decide y mantenerte al tanto de futuras acciones, síguenos en las redes sociales (Linkedin, Twitter, Youtube).