• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.10.2020.tde-28112019-114932
Document
Author
Full name
Bruno Bello Pede Castro
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2019
Supervisor
Committee
Gennari, Solange Maria (President)
Brandão, Paulo Eduardo
Lorenzi, Hernan
Setubal, João Carlos
Su, Chunlei
Title in English
Develop a pipeline to call SNPs from whole genome sequences of Toxoplasma gondii and integrate with conventional genotyping methods
Keywords in English
Toxoplasma gondii
Bioinformatics
Pipeline
Virtual machine
Whole genomic sequencing
Abstract in English
Toxoplasmosis is a parasitic disease caused by Toxoplasma gondii. Toxoplasma gondii is an intracellular parasite that is related to Plasmodium falciparum, the agent that causes malaria in human. Toxoplasma gondii infects all warm-blooded vertebrates, including mammals and birds. Recent advances in DNA sequencing technologies have made it possible to obtain and use whole genome sequences to genotype any organism, including T. gondii. In the past, PCR-RFLP and MLST are the most common methods to genotype and identify T. gondii and invaluable database is generated over the last decades using these methods. However, the conventional PCR-RFLP and MLST data cannot be easily integrated with the whole genome sequence typing. The objective of this work is to develop a pipeline to map reads coming from a whole genome sequencing to identify SNPs (Single Nucleotide Polymorphisms), and to integrate the data with PCR-RFLP and MLST data. In this work, we used sequencing data from a total of 62 T. gondii isolates from various locations around the world. From these sequences, improved data for phylogenetic analysis were generated using the SplitsTree4 software and population genetics data through the FastStructure tool. In addition, other tools that work in conjunction with the pipeline were developed, making it possible to extract genomic sequences for the 10 PCR-RFLP markers and eight introns for MLST, which were used for genetic analysis of T. gondii in the literature. To make these tools available to the research community; we integrate all software and instruction set used in Perl scripts into a virtual machine, making it possible to perform Bioinformatics tasks from any personal computer, regardless of the operating system running. For this, we use multiplatform virtualization software, VirtualBox. Implement of these tools will facility molecular genetics and population genetics of T. gondii. These tools can be easily modified to work with other organisms as needed.
Title in Portuguese
Desenvolvimento de uma pipeline para identificação de SNPs a partir de sequências genômicas completas de Toxoplasma gondii e sua integração aos métodos convencionais de genotipagem
Keywords in Portuguese
Toxoplasma gondii
Bioinformática
Máquina virtual
Pipeline
Sequenciamento genômico completo
Abstract in Portuguese
A toxoplasmose é uma doença parasitária causada pelo Toxoplasma gondii. O Toxoplasma gondii é um parasita intracelular relacionado ao Plasmodium falciparum, o agente causador da malária em humanos. O Toxoplasma gondii pode infectar todos os vertebrados homeotérmicos, incluindo mamíferos e pássaros. Recentes avanços nas tecnologias de sequenciamento de DNA tornaram possível a obtenção de sequências genômicas completas para praticamente qualquer organismo, incluindo o Toxoplasma gondii e com isso, a tendência é que genotipagens do tipo PCR-RFLP e MLST, atualmente utilizadas, devam ser substituídas. Uma vez que esse inestimável banco de dados gerado ao longo das últimas décadas não pode ser relacionado a essa nova tecnologia, esse trabalho teve como objetivo aliviar esse problema, desenvolvendo uma pipeline, capaz de mapear leituras provenientes de um sequenciamento genômico completo, em plataforma Illumina e identificar SNPs (Single Nucleotide Polymorphisms). Nesse trabalho, foram utilizados dados de sequenciamento de um total de 62 isolados de T. gondii provenientes de vários locais do mundo. A partir dessas sequências, foram gerados dados aprimorados para análise filogenética utilizando o software SplitsTree4 e dados de genética de populações, através da ferramenta FastStructure. Além disso, outras ferramentas que funcionam em conjunto à pipeline foram desenvolvidas, possibilitando também extrair sequências genômicas para os 10 marcadores PCR-RFLP e oito introns, que foram utilizados para análise genética de T. gondii na literatura. Para disponibilizar essas ferramentas para a comunidade de pesquisa, integramos todos os softwares e o conjunto de instruções utilizadas em linguagem Perl, em uma máquina virtual, tornando possível a execução de tarefas de Bioinformática a partir de qualquer computador pessoal, independente do sistema operacional que estiver executando. Para isso, utilizamos um software de virtualização multiplataforma, o VirtualBox.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
3_SAG2.pdf (3.98 Kbytes)
5_SAG2.pdf (4.09 Kbytes)
alt_SAG2.pdf (4.27 Kbytes)
Apico.pdf (4.47 Kbytes)
BTUB.pdf (4.06 Kbytes)
c22_8.pdf (4.32 Kbytes)
c29_2.pdf (4.35 Kbytes)
GRA6.pdf (4.01 Kbytes)
L358.pdf (4.36 Kbytes)
PK1.pdf (4.25 Kbytes)
SAG1.pdf (4.26 Kbytes)
SAG3.pdf (4.00 Kbytes)
Publishing Date
2020-03-18
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2023. All rights reserved.