Aplicación del algoritmo k-prototypes para la segmentación de compañías ecuatorianas supervisadas por la superintendencia de compañías, valores y seguros

Para citar o enlazar este item, por favor use el siguiente identificador: http://dspace.ups.edu.ec/handle/123456789/32386
Title: Aplicación del algoritmo k-prototypes para la segmentación de compañías ecuatorianas supervisadas por la superintendencia de compañías, valores y seguros
Authors: Narváez Rea, Mateo Francisco
Advisor: Caiza Simbaña, Mario Javier
Abstract: This research focuses on the analysis and segmentation of Ecuadorian companies registered with the Superintendence of Companies, Securities, and Insurance (SuperCias), utilizing financial, sectoral, and geographical variables from the fiscal year 2024. Despite the significance of SuperCias in regulating and stabilizing the national corporate environment, it has been identified that the complexity and heterogeneity of the reported information hinder the detection of performance patterns through traditional statistical methods. This limitation restricts the ability to guide evidence-based decisions, resulting in an incomplete analysis of the sector. By employing unsupervised learning techniques, specifically the K-Prototypes algorithm within the Team Data Science Process (TDSP) framework, this study aims to identify natural groupings that capture both the categorical and numerical data present in the dataset. The implementation of this model allows for the simultaneous processing of quantitative financial metrics and qualitative corporate data. The segmentation results intend to reveal distinct business clusters, highlighting specific characteristics within each group. These strategies are designed to optimize the analysis of mixed-type datasets, providing a more robust understanding of the corporate landscape.
Translated abstract: La presente investigación se enfoca en el análisis y segmentación de las empresas ecuatorianas registradas en la Superintendencia de Compañías, Valores y Seguros (SuperCias), utilizando variables financieras, sectoriales y geográficas correspondientes al año 2024. Teniendo en cuenta la importancia de la SuperCias en la regulación y transparencia, se ha identificado que la complejidad y heterogeneidad de la información reportada en los balances (datos categóricos y numéricos) dificultan la detección de patrones mediante métodos estadísticos tradicionales. Esta limitación restringe la capacidad para orientar decisiones basadas en evidencia, generando lo que genera un análisis incompleto. Utilizando técnicas de aprendizaje no supervisado, específicamente el algoritmo KPrototypes en conjunto con el marco de trabajo Team Data Science Process (TDSP), se busca identificar agrupamientos naturales que capturen tanto los datos categóricos como numéricos que se encuentran en la base. La implementación de este modelo permite procesar tanto datos financieros cuantitativos de las empresas como datos cualitativos. Los resultados de la segmentación buscan mostrar clusters empresariales diferenciados, destacando grupos con características particulares entre si. Estas estrategias están diseñadas para optimizar el análisis de las bases de datos con datos mixtos de los mismos.
Keywords: NEGOCIOS DIGITALES
ANÁLISIS FINANCIERO
TOMA DE DECISIONES
SISTEMA DE INFORMACIÓN
Issue Date: 2026
URI: http://dspace.ups.edu.ec/handle/123456789/32386
Language: spa
Appears in Collections:Grado

Files in This Item:
File Description SizeFormat 
TTQ2751.pdfTexto completo871,87 kBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons