Determinación de los factores de riesgo del cáncer de mama mediante aprendizaje automático y el índice SHAP

Para citar o enlazar este item, por favor use el siguiente identificador: http://dspace.ups.edu.ec/handle/123456789/22862
Título : Determinación de los factores de riesgo del cáncer de mama mediante aprendizaje automático y el índice SHAP
Autor : Mieles Sarmiento, Wellington Cristóbal
Baque Rodríguez, Danny Alexander
Director de Tesis: Quiroz Martínez, Miguel Ángel
Resumen traducido: Breast cancer is a malignant tumor that affects people all over the world, more frequently in the female sex, although it does not exclude the male sex. It is among the five deadliest types of cancer, having a greater influx in less developed countries where access to health programs is poorer. Finding the best machine learning (ML) algorithm for effective breast cancer prediction with the least chance of error. This allows us to set the objective of being able to analyze the different algorithms and select the least error that it has, enriching the algorithms with the Breast Cancer Wisconsin data set. It was concluded that the best algorithm is XGBoost with Shap; We use confusion matrices to see the performance of the algorithms, Roc Curve to know the global performance and its accuracy by dividing the correct predictions by the total predictions.
Resumen : El cáncer de mama es un tumor maligno que afecta a las personas de todo el mundo, con mayor frecuencia en el sexo femenino, aunque no excluye al sexo masculino. Se encuentra entre los cinco tipos de cáncer más mortíferos, teniendo mayor afluencia en los países menos desarrollados donde el acceso a los programas de salud es más deficiente. Encontrar el mejor algoritmo de machine learning (ML) para una predicción de cáncer de mamá efectiva con la mínima posibilidad de error. Esto permite plantear como objetivo el poder analizar los diferentes algoritmos y seleccionar el que menor error tenga enriqueciendo los algoritmos con el dataset de Breast Cáncer Wisconsin. Se concluyó que el mejor algoritmo es XGBoost con Shap; Utilizamos matrices de confusión para ver el desempeño de los algoritmos, Curva de Roc para conocer el rendimiento global y su precisión dividiendo las predicciones correctas por el total de predicciones.
Palabras clave : FACTORES
CÁNCER MAMA
APRENDIZAJE AUTOMÁTICO
ÍNDICE SHAP
Fecha de publicación : 2022
URI : http://dspace.ups.edu.ec/handle/123456789/22862
Idioma: spa
Pertenece a las colecciones: Grado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
UPS-GT003874.pdfTexto completo1,26 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons