Ensamblaje de genoma de Sphingobium yanoikuyae a partir de datos de secuenciación de Illumina y PACBIO archivados en la base de datos de NCBI

Para citar o enlazar este item, por favor use el siguiente identificador: http://dspace.ups.edu.ec/handle/123456789/28673
Title: Ensamblaje de genoma de Sphingobium yanoikuyae a partir de datos de secuenciación de Illumina y PACBIO archivados en la base de datos de NCBI
Authors: Andrade González, Karol Sarai
Pazmiño Carrera, Camila Mayte
Advisor: Vaca Suquillo, Ivonne De Los Ángeles
Abstract: Sphingobium yanoikuyae is a bacterium belonging to the Sphingomonadaceae family, it is characterized by the fact that it degrades several aromatic compounds, since it has enzymes that metabolize these contaminating compounds, therefore it has enormous potential to be used in bioremediation. Research was carried out to establish a pipeline for S. yanoikuyae genome assembly from Illumina and PACBIO sequences, stored at NCBI. Raw sequences were preprocessed by filtering and trimming; through the implementation of bioinformatics tools on the Galaxy and KBase platform; Quality control was done in FASTQC obtaining parameters such as the N50, the total assembly size and the number of contigs. Furthermore, assembly programs such as SPAdes, Megahit, Skesa or Velvet allowed an assembly to be carried out, however their results were not very precise or reliable; while, with Unicycler, a better assembly of the complete genome was obtained, highlighting the fused or hybrid assembly with 89 contigs and a length of 5402608 bp. Finally, Prokka was used for annotation, identifying 5045 genetic elements.
Translated abstract: Sphingobium yanoikuyae es una bacteria perteneciente a la familia Sphingomonadaceae, se caracteriza porque degrada varios compuestos aromáticos, ya que posee enzimas que metabolizan estos compuestos contaminantes, por ello tiene un enorme potencial para ser usada en biorremediación. Se realizó una investigación para establecer un pipeline para el ensamblaje del genoma de S. yanoikuyae, a partir de secuencias de Illumina y PACBIO, almacenadas en NCBI. Las secuencias crudas se preprocesaron mediante filtrado y recorte; a través de la implementación de herramientas bioinformáticas en la plataforma de Galaxy y KBase; se hizo el control de calidad en FASTQC obteniendo parámetros como el N50, el tamaño total de ensamblaje y el número de contigs. Además, programas para ensamblaje como SPAdes, Megahit, Skesa o Velvet permitieron realizar un ensamblaje, sin embargo, sus resultados fueron poco precisos y confiables; mientras que, con Unicycler se obtuvo un mejor ensamblaje del genoma completo, destacando el ensamblaje fusionado o híbrido con 89 contigs y una longitud de 5402608 pb. Finalmente, para su anotación se usó Prokka identificando 5045 elementos genéticos.
Keywords: BIOTECNOLOGÍA
ENSAMBLAJE HÍBRIDO
CONTIGS
SPHINGOBIUM YANOIKUYAE
Issue Date: 2024
URI: http://dspace.ups.edu.ec/handle/123456789/28673
Language: spa
Appears in Collections:Grado

Files in This Item:
File Description SizeFormat 
TTQ1739.pdfTexto completo1,23 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons