Desarrollo de un sistema para reconocimiento de texto y conversión a audio, utilizando Raspberry Pi para personas no videntes

Para citar o enlazar este item, por favor use el siguiente identificador:
Title: Desarrollo de un sistema para reconocimiento de texto y conversión a audio, utilizando Raspberry Pi para personas no videntes
Authors: Cruz Garcés, Ronald Luciano
Advisor: Jaya Duche, Manuel Rafael
Abstract: The main objective of this project is to help people with visual disabilities. A prototype is presented whose main objective will be to detect a printed document and transform it into an audio format, which will reproduce the text detected from the previously made capture. The concept features a single module that allows an audio file to be played back using real-time image detection technology. The project uses the Raspberri Pi card for the processing part and a camera compatible with the aforementioned card for image capture. Finally, the results obtained show the design of the prototype of capture and conversion to audio, several experiments are carried out to show the precision of capture and reading of the printed text. This project has the advantage of using portable devices that apart from this prototype can be used for more tasks. According to the tests carried out, it can be determined that the optimal distance for good focus is 30 cm from the camera to the document since at that distance the entire sheet focuses, lighting is an important part when processing text printed since with good lighting the prototype can better recognize the text and deliver better information to the person requesting it, the Raspberry Pi 4 card offers the necessary resources for the correct functioning of the prototype since it has 4 GB of RAM for its Additional processing is supported by IR-CUT camera.
Translated abstract: El presente proyecto tiene como objetivo principal ayudar a las personas con discapacidad visual. Se presenta un prototipo que su principal objetivo será detectar un documento impreso y transformarlo a un formato de audio, el cual reproducirá el texto detectado de la captura previamente realizada. El concepto presenta un solo módulo que permite reproducir un archivo de audio mediante la tecnología de detección de imágenes en tiempo real. El proyecto utiliza la tarjeta Raspberri Pi para la parte de procesamiento y una cámara compatible con la tarjeta antes mencionada para la captura de imágenes. Finalmente, los resultados obtenidos muestran el diseño del prototipo de captura y conversión a audio, se realiza varios experimentos para mostrar la precisión de captura y lectura del texto impreso. Este proyecto tiene la ventaja de utilizar dispositivos portátiles que aparte de este prototipo se puede usar para más tareas. De acuerdo a las pruebas realizadas se puede determinar que la distancia óptima para el buen enfoque es 30 cm desde la cámara hacia el documento ya que a esa distancia enfoca el total de la hoja, la iluminación es una parte importante a la hora de procesar texto impreso ya que con una buena iluminación el prototipo puede reconocer mejor el texto y entregar mejor información a la persona que lo solicita, la tarjeta Raspberry Pi 4 ofrece los recursos necesarios para el correcto funcionamiento del prototipo ya que cuenta con 4 GB en RAM para su procesamiento, adicional es compatible con la cámara IR-CUT.
Issue Date: Mar-2021
Language: spa
Appears in Collections:Grado

Files in This Item:
File Description SizeFormat 
UPS - TTS295.pdfTexto completo4,81 MBAdobe PDFView/Open

This item is licensed under a Creative Commons License Creative Commons