Determinación de los factores de riesgo del cáncer de mama mediante aprendizaje automático y el índice SHAP
Para citar o enlazar este item, por favor use el siguiente identificador:
http://dspace.ups.edu.ec/handle/123456789/22862
Título : | Determinación de los factores de riesgo del cáncer de mama mediante aprendizaje automático y el índice SHAP |
Autor : | Mieles Sarmiento, Wellington Cristóbal Baque Rodríguez, Danny Alexander |
Director de Tesis: | Quiroz Martínez, Miguel Ángel |
Resumen traducido: | Breast cancer is a malignant tumor that affects people all over the world, more frequently in the female sex, although it does not exclude the male sex. It is among the five deadliest types of cancer, having a greater influx in less developed countries where access to health programs is poorer. Finding the best machine learning (ML) algorithm for effective breast cancer prediction with the least chance of error. This allows us to set the objective of being able to analyze the different algorithms and select the least error that it has, enriching the algorithms with the Breast Cancer Wisconsin data set. It was concluded that the best algorithm is XGBoost with Shap; We use confusion matrices to see the performance of the algorithms, Roc Curve to know the global performance and its accuracy by dividing the correct predictions by the total predictions. |
Resumen : | El cáncer de mama es un tumor maligno que afecta a las personas de todo el mundo, con mayor frecuencia en el sexo femenino, aunque no excluye al sexo masculino. Se encuentra entre los cinco tipos de cáncer más mortíferos, teniendo mayor afluencia en los países menos desarrollados donde el acceso a los programas de salud es más deficiente. Encontrar el mejor algoritmo de machine learning (ML) para una predicción de cáncer de mamá efectiva con la mínima posibilidad de error. Esto permite plantear como objetivo el poder analizar los diferentes algoritmos y seleccionar el que menor error tenga enriqueciendo los algoritmos con el dataset de Breast Cáncer Wisconsin. Se concluyó que el mejor algoritmo es XGBoost con Shap; Utilizamos matrices de confusión para ver el desempeño de los algoritmos, Curva de Roc para conocer el rendimiento global y su precisión dividiendo las predicciones correctas por el total de predicciones. |
Palabras clave : | FACTORES CÁNCER MAMA APRENDIZAJE AUTOMÁTICO ÍNDICE SHAP |
Fecha de publicación : | 2022 |
URI : | http://dspace.ups.edu.ec/handle/123456789/22862 |
Idioma: | spa |
Pertenece a las colecciones: | Grado |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
UPS-GT003874.pdf | Texto completo | 1,26 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons