• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.95.2022.tde-19072022-153242
Document
Author
Full name
Livia Maria Silva Moura
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2022
Supervisor
Committee
Setubal, João Carlos (President)
Almeida Junior, Nalvo Franco de
Hoffmann, Christian
Varani, Alessandro de Mello
Title in English
Recovery of high-quality MAGs in time-serial metagenomic data and FixAME development: an assisting curation tool of genomic assembly error
Keywords in English
Bioinformatics
Curation
Genome
Metagenome
Microbiology
Tool
Abstract in English
On a daily based, there is a huge amount of biological data being generated that brings deeper insight into our world. This exponential growth of information has brought many challenges, especially when dealing with metagenomic data. Thousands of metagenomic-assembled genomes (MAG) are recovered annually, and many methods try to achieve the best output possible through assembly and binning approaches. But the question that every time is more frequent is: Are these MAGs reliable? The importance of having good quality data is undeniable. Retrieving reliable and complete, or nearly-complete MAGs, provides important data for further analysis and research purposes. Within this scenario, we'd like to know if it is possible to improve the MAGs metrics quality when compared to the state-of-the art in time series data. In addition, we'd like to develop a tool capable of locating and fixing assembly errors, thereby assisting in genomic curation. Here, we describe an approach of MAGs recovery from time-serial data called the "screening method", drastically reducing the recovery from potentially unreliable MAGs. In addition, we present FixAME, a tool capable of helping curate assembled sequences of metagenome, single genome, a set of bins, phages, archaea, or any organism that contains single double-stranded DNA.
Title in Portuguese
Recuperação de MAGs de alta qualidade em dados metagenômicos tempo seriado e desenvolvimento de FixAME: uma ferramenta auxiliar de curadoria de erros de montagem genômica
Keywords in Portuguese
Bioinformática
Curadoria
Ferramenta
Genoma
Metagenomica
Microbiologia
Abstract in Portuguese
Diariamente, há uma grande quantidade de dados biológicos sendo gerados que trazem uma visão mais profunda do nosso mundo. Esse crescimento exponencial de informações trouxe muitos desafios, principalmente quando se trata de dados metagenômicos. Milhares de genomas montados a partir de dados metagenômicos (MAG) são recuperados anualmente, e muitos métodos tentam alcançar o melhor resultado possível por meio de abordagens de montagem e binning. Mas a pergunta que cada vez é mais frequente é: esses MAGS são confiáveis? A importância de ter dados de boa qualidade é inegável. A recuperação de MAGs confiáveis e completos, ou quase completos, fornece dados importantes para análises futuras e propósitos de pesquisa. Dentro desse cenário, gostaríamos de saber se é possível melhorar a qualidade das métricas dos MAGs quando comparadas ao estado da arte em dados seriados no tempo. Além disso, gostaríamos de desenvolver uma ferramenta capaz de localizar e corrigir erros de montagem, dessa forma auxiliando na curadoria genômica. Aqui, nós descrevemos uma abordagem de MAGs recuperados de dados seriados no tempo chamado "método de triagem", reduzindo drasticamente a recuperação de MAGs potencialmente não confiáveis. Além disso, apresentamos FixAME, uma ferramenta capaz de auxiliar na curadoria de sequências montadas de metagenoma, genoma único, conjunto de bins, fagos, arqueias ou qualquer organismo que contenha DNA de fita simples.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2022-12-12
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.