Desarrollo de un sistema Web basado en matrices de distancias para seleccionar artículos académicos similares en la revisión de la literatura científica

Para citar o enlazar este item, por favor use el siguiente identificador: http://dspace.ups.edu.ec/handle/123456789/27226
Título : Desarrollo de un sistema Web basado en matrices de distancias para seleccionar artículos académicos similares en la revisión de la literatura científica
Autor : Cadena Peña, Kevin Patricio
Villavicencio Garcia, Alexis Nicolas
Director de Tesis: Vallejo Huanga, Diego Fernando
Resumen traducido: Due to the constant increase in publications of scientific articles in various virtual libraries worldwide every year, searching for relevant academic documents for research has become a complex process that sometimes requires significant time and effort. This research article addresses this problem by developing a web system that makes it easier for users to identify the most relevant scientific articles for their research. The system allows users to upload a set of data that includes the attributes, titles, keywords, and abstracts of each extracted document. Each scientific article was subjected to the NLP process to purify and homogenize the information. To measure the divergence between scientific documents, similarity matrices are calculated using two different metrics that assemble the three attributes into a single weighted matrix. The results are presented through a web interface, including a summary table, a heat map, a twodimensional scatter diagram, and a graph. The experimentation was carried out using a data set composed of 192 scientific articles from Springer, IEEE, and Scopus, covering the areas of Exact Sciences, Computer Sciences, Medicine, and Social Sciences. The results revealed greater similarity between documents that share the same study topic.
Resumen : Debido al aumento constante de las publicaciones de artículos científicos en diversas bibliotecas virtuales a nivel mundial cada año, la búsqueda de documentos académicos relevantes para investigaciones se ha convertido en un proceso complejo que en ocasiones suele requerir una gran cantidad de tiempo y esfuerzo. Este artículo de investigación aborda esta problemática mediante el desarrollo de un sistema web que facilita a los usuarios la identificación de los artículos científicos m´as relevantes para sus investigaciones. El sistema permite los usuarios cargar un conjunto de datos que incluye los atributos títulos, palabras clave y resúmenes de cada documento extraído. Cada artículo científico fue sometido al proceso NLP con el fin de depurar y homogeneizar la información. Para medir la divergencia entre los documentos científicos, se calculan matrices de similitud mediante el uso de dos métricas diferentes que ensamblan los tres atributos en una sola matriz ponderada. Los resultados obtenidos se presentan a través de una interfaz web, que incluye una tabla de resumen, un mapa de calor, un diagrama de dispersión bidimensional y un grafo. La experimentación se llevó a cabo utilizando un conjunto de datos compuesto por 192 artículos científicos recopilados de Springer, IEEE y Scopus, abarcando las áreas de Ciencias Exactas, Ciencias de la Computación, Medicina y Ciencias Sociales. Los resultados revelaron una mayor similitud entre documentos que comparten la misma temática de estudio.
Palabras clave : COMPUTACIÓN
ANÁLISIS DE SISTEMAS
SITIOS WEB
MATRICES DE DISTANCIAS
SIMILITUD
Fecha de publicación : feb-2024
URI : http://dspace.ups.edu.ec/handle/123456789/27226
Idioma: spa
Pertenece a las colecciones: Grado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TTS1757.pdfTexto completo2,79 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons