Desarrollo e implementación de un sistema de lectura asistida mediante voz para personas invidentes con técnicas de visión artificial e inteligencia artificial

Para citar o enlazar este item, por favor use el siguiente identificador: http://dspace.ups.edu.ec/handle/123456789/29576
Título : Desarrollo e implementación de un sistema de lectura asistida mediante voz para personas invidentes con técnicas de visión artificial e inteligencia artificial
Autor : Paredes Paredes, Fernando Esteban
Director de Tesis: Romero Mejía, Luis Geovanny
Resumen traducido: This project addresses the design, development, and implementation of a voice-assisted reading system specifically aimed at visually impaired individuals. By leveraging advanced techniques in computer vision and artificial intelligence, the system accurately and efficiently converts printed text into audio format, enabling inclusive access to information in educational, workplace, and daily environments. The work involved selecting and configuring hardware components such as a Raspberry Pi 4, a Logitech C920s camera, and Genius SP-U115 speakers, along with software tools like the EAST model for text detection, Tesseract OCR for optical character recognition, and gTTS for voice synthesis. Additionally, interaction mechanisms, including keyboard commands and auditory feedback, were integrated to ensure an accessible and autonomous user experience. Tests conducted in various lighting scenarios confirmed the system’s remarkable performance, achieving accuracies of up to 95 % under optimal conditions. Processing times and audio clarity were also evaluated, demonstrating the device’s feasibility for real-time use. This project represents a significant step towards technological inclusion, enhancing the quality of life for visually impaired individuals and laying the groundwork for future improvements and expansions.
Resumen : Este proyecto aborda el diseño, desarrollo e implementación de un sistema de lectura asistida mediante voz, especialmente orientado a personas con discapacidad visual. Utilizando técnicas avanzadas de visión artificial e inteligencia artificial, el sistema convierte de manera precisa y eficiente texto impreso en formato de audio, facilitando el acceso inclusivo a la información en entornos educativos, laborales y cotidianos. El trabajo incluyó la selección y configuración de componentes de hardware, como una Raspberry Pi 4, una cámara Logitech C920s y altavoces Genius SP-U115, junto con herramientas de software como el modelo EAST para detección de texto, Tesseract OCR para reconocimiento óptico de caracteres y gTTS para la síntesis de voz. Además, se integraron mecanismos de interacción, como comandos mediante teclado y retroalimentación auditiva, para garantizar una experiencia accesible y autónoma. Las pruebas realizadas en diversos escenarios de iluminación confirmaron un rendimiento destacado del sistema, alcanzando precisiones de hasta un 95 % bajo condiciones óptimas. Se evaluaron también tiempos de procesamiento y claridad del audio generado, demostrando que el dispositivo es viable para un uso en tiempo real. Este proyecto representa un avance significativo hacia la inclusión tecnológica, mejorando la calidad de vida de las personas con discapacidad visual y sentando las bases para futuras mejoras y expansiones.
Palabras clave : BIOMEDICINA
INTELIGENCIA ARTIFICAIL
SISTEMA DE TRANSMICIÓN DE DATOS
SOFTWARE
Fecha de publicación : 2025
URI : http://dspace.ups.edu.ec/handle/123456789/29576
Idioma: spa
Pertenece a las colecciones: Grado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TTQ1889.pdfTexto completo8,87 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons