Resumen del Proyecto
Este proyecto fue desarrollado como parte de un desafío de ciencia de datos propuesto por Bankaya. El objetivo fue construir un modelo de riesgo crediticio que permita clasificar a los clientes en función de su comportamiento de pago, y asignar tasas de interés individualizadas según el riesgo estimado.
Contenido del Proyecto
Metodología
El desarrollo del modelo incluyó las siguientes etapas:
- Limpieza de datos y codificación de variables.
- Análisis exploratorio y creación de categorías de riesgo.
- Integración de información externa de créditos por cliente.
- Entrenamiento de varios modelos: regresión logística, árbol de decisión, random forest, red neuronal y XGBoost.
- Evaluación mediante métricas de clasificación, con enfoque en el recall.
Resultados
- El modelo XGBoost alcanzó un recall del 100% para la clase de riesgo alto.
- Se generó un score de riesgo por persona.
- Se asignaron tasas de interés dinámicas entre el 10% y el 50% basadas en la probabilidad de incumplimiento.
- Los resultados están disponibles en el CSV enlazado anteriormente.