Desarrollo de un modelo de clasificación automático en el software R para las etapas de la enfermedad renal crónica Mediante Machine Learning

Para citar o enlazar este item, por favor use el siguiente identificador: http://dspace.ups.edu.ec/handle/123456789/27120
Título : Desarrollo de un modelo de clasificación automático en el software R para las etapas de la enfermedad renal crónica Mediante Machine Learning
Autor : Tallana Castro, Alex Fernando
Director de Tesis: Romero Mejía, Luis Geovanny
Resumen traducido: This project presents the development of an automatic classification model for the stages of chronic kidney disease using some machine learning techniques, such as support vector machines and neural networks. The UCI Machine Learning database, with approximately 400 instances of patients with and without CKD, was used to train and test the model. R software was used for modeling, but prior previously, the database was preprocessed in order to identify missing data and outliers in each of the variables. Similarly, data analysis and processing was performed in which new variables were added, such as the estimated glomerular filtration rate (eGFR), calculated with the CKD-EPI equation, to classify instances according to their value. Then, features were selected based on the level of correlation of the variables with eGFR, with the aim of improving the performance of the model, seeking to classify instances in the five stages of CKD. Thus, the best model obtained was the use of ANNs, with a total of 6 features, such as age, blood urea, serum creatinine, hemoglobin, packed cell volume and the number of red blood cells. The model generated an accuracy of 91% and a sensitivity of 93% for classifying test instances that did not have CKD. For individuals with stage 1 and 2, the model performed below 70%, making it not as reliable for these stages. In the case of stage 3, the model reached an accuracy of 76% and a sensitivity of 80%. On the other hand, in stage 4, it had an accuracy of 82% and a sensitivity of 95%. In addition, with an accuracy of 100% and a sensitivity of 57% for people in severe renal failure.
Resumen : En este proyecto se presenta el desarrollo de un modelo de clasificación automático para las etapas de la Enfermedad Renal Crónica (ERC) mediante algunas técnicas de machine learning, como las máquinas de soporte vectorial (MSV) y las redes neuronales (ANN). Se utilizó la base de datos de UCI Machine Learning, con aproximadamente 400 instancias de pacientes con y sin ERC, para entrenar y probar el modelo. Se utilizó el software R para el modelado, pero previo a esto se realizó el preprocesamiento de la base de datos con el fin de identificar los datos faltantes y atípicos en cada una de las variables. De igual forma, se realizó un análisis y un procesamiento de los datos en el cual se añadieron nuevas variables, como la tasa de filtrado glomerular estimada (TFGe), calculada con la ecuación CKD-EPI, para clasificar instancias según su valor. Luego, se seleccionaron características en base al nivel de correlación de las variables con la TFGe, con el objetivo de mejorar el rendimiento del modelo, buscando clasificar instancias en las cinco etapas de ERC. De esta forma, se obtuvo como mejor modelo el uso de las ANN, con un total de 6 características, como la edad, urea en sangre, creatinina sérica, hemoglobina, volumen de células empaquetadas y la cantidad de células rojas. El modelo generó una precisión del 91% y una sensibilidad del 93% para clasificar instancias de prueba que no padecían ERC. En el caso de personas con etapas 1 y 2, el modelo tuvo un rendimiento por debajo del 70%, por lo cual no era tan fiable en estas etapas. En el caso de la etapa 3, el modelo llego a una precisión del 76% y una sensibilidad del 80%. En cambio, en la etapa 4, se tuvo una precisión del 82% y una sensibilidad del 95%. Además, con una precisión del 100% y una sensibilidad del 57% para las personas que se encontraban en un fallo renal grave.
Palabras clave : BIOMEDICINA
SOFTWARE R
ENFERMEDADES CRÓNICAS
MACHINE LEARNIG
Fecha de publicación : 2024
URI : http://dspace.ups.edu.ec/handle/123456789/27120
Idioma: spa
Pertenece a las colecciones: Grado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TTQ1462.pdfTexto completo2,13 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons