
📉 Model Drift: el enemigo silencioso de tus modelos en producción#
Tu modelo llegó a producción. Las métricas eran excelentes. Dos años después, los stakeholders se quieren volver a Excel. ¿Qué pasó? Model drift.
🔍 ¿Qué es el Model Drift?#
Es el deterioro gradual del rendimiento de un modelo predictivo con el tiempo. No importa qué tan bien lo hayas entrenado — todos los modelos son vulnerables.
📦 Dos tipos principales#
🔄 Data Drift – Los features cambian. Ejemplo: la altura se guardaba en pulgadas y ahora el sistema registra centímetros. El modelo predice a personas de 183 pulgadas… ¡más de 15 pies!
🧠 Concept Drift – La relación entre variables cambia. Ejemplo: un modelo de readmisión hospitalaria que de repente cubre una población completamente diferente.
🔬 Cómo detectarlo#
📊 Monitorear métricas en producción regularmente (AUC, precisión, recall) 📈 Graficar performance vs. tiempo 🕳️ Revisar valores faltantes por feature a lo largo del tiempo
Si no monitoreás tu modelo en producción, el drift lo van a notar los stakeholders antes que vos.
🛠️ Cómo corregirlo#
✅ Reparar el pipeline de datos al formato original de entrenamiento 🔁 Reentrenar el modelo con datos nuevos (especialmente si cambió la población)
💡 Explicación en pocas palabras#
Imaginá que entrenás a alguien con las reglas del fútbol clásico. Si el deporte cambia de reglas, esa persona jugará mal. Los modelos de ML son iguales: si el mundo cambia, el modelo hay que actualizarlo o va a fallar.
Más información en el link 👇

