• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.17.2021.tde-04102021-161934
Document
Author
Full name
Rafael dos Santos Bezerra
Institute/School/College
Knowledge Area
Date of Defense
Published
Ribeirão Preto, 2021
Supervisor
Committee
Slavov, Svetoslav Nanev (President)
Costa, Antonio Charlys da
Levi, José Eduardo
Title in Portuguese
Aplicação de métodos de bioinformática para identificação de infecções virais com impacto em hemoterapia
Keywords in Portuguese
Doença pós-doação
DPD
Hemoterapia
Metagenômica
Pipeline bioinformática
SNG
Viroma
Vírus emergentes
Vírus reemergentes
Abstract in Portuguese
Com a chegada de novas tecnologias de sequenciamento, como as de segunda e terceira geração, o tempo e custo das análises reduziram drasticamente enquanto a obtenção de dados aumentou significativamente. Desta maneira, ampliou-se a utilização dessas novas metodologias possibilitando diversas aplicações. Dentre essas aplicações podemos destacar a metagenômica. A metagenômica consiste na obtenção do material genético de todos os organismos presentes em uma única amostra, seja ela ambiental ou clínica. O viroma é uma área da metagenômica em que o foco são os vírus encontrados nestas amostras. Dentre as possíveis aplicações da análise do viroma está a identificação de vírus emergentes e re-emergentes com impacto na área de hemoterapia. Para isso aplicamos técnicas de identificação do viroma em bolsas de sangue com Doença Pós-Doação (DPD) relatada pelo doador (geralmente sintomas relacionados a infecção) febre, exantema, conjuntivite, dores retro orbitais, artralgia, mialgia, diarreia, vômitos, enjôo) e amostras de doações de sangue obtidas de doadores positivos para infecções rotineiramente triadas nos bancos de sangue da região norte (Macapá, Amapá) e sul do país (Santa Maria, Rio Grande do Sul). Para isso foi implementada uma pipeline bioinformática de alto rendimento para identificação de vírus emergentes e re- emergentes. A implementação foi realizada em BASH script, DOCKER (containers) e alguns PERL scripts desenvolvidos inhouse. Dentre os principais passos executados podemos citar o controle de qualidade das sequências com o software FastQC, limpeza das sequências de baixa qualidade e caudas poli-x com Trimmomatic e AfterQC, montagem dos genomas com o software SPAdes e finalmente classificação taxonômicas das sequências com Kraken2 e Diamond. As análises filodinâmicas dos vírus encontrados e com genoma recuperado foram feitas através dos softwares IQ-TREE e do pacote BEAST. Dentre nossos resultados das amostras com DPD de Ribeirão Preto podemos destacar o primeiro relato do vírus da Influenza A (H2N3) em amostras de plasma de doadores de sangue. Assim como também identificamos o vírus da Dengue e Parvovírus B19 (todos sem testagem obrigatória). Interessantemente em amostras provenientes da região norte do país encontramos o pouco conhecido Gemykibivírus humano-2, um vírus relacionado a quadros clínicos graves e coinfecções com HIV. Outro achado interessante nestas amostras foi o Merkell cell poliomavírus com genoma completo recuperado (o que pode indicar um estado viremico). No Brasil, até então não foram desenvolvidos estudos abrangentes sobre infecções emergentes com impacto na transfusão de sangue e a sua ameaça real para os processos hemoterápicos é subestimada e pouco conhecida. Porém há alguns desafios neste âmbito a serem superados, dentre eles podemos citar as análises bioinformáticas dos dados gerados, que demanda muitas vezes altos recursos computacionais e mão de obra especializada. Portanto, este estudo visa investigar o impacto das viroses emergentes e não suspeitas na área da hemoterapia utilizando sequenciamento de última geração e a implementação de um pipeline bioinformática eficiente para análise do viroma.
Title in English
Application of bioinformatics methods to identify viral infections with impact on hemotherapy
Keywords in English
Bioinformatics pipeline
Emerging viruses
Hemotherapy
Metagenomics
NGS
PDDR
Postdonation disease reports
Reemerging viruses
Viroma
Abstract in English
With the introduction in the laboratory practice of new sequencing technologies, like second and third generation techniques, the time and cost of the sequencing has drastically reduced while the generated data has increased significantly. In this way, the field of application of these new techniques has expanded incliding analysis of the microbial communities of clinical and environmental samples known as metagenomics. Virome is an important area of metagenomics where the focus is concentrated on the viruses found in these samples. Among the possible applications of virome analysis is the identification of emerging and re-emerging viruses which can impact the area of hemotherapy. To investigate these agents, we applied virome techniques in blood units obtained from donors who related with Post-Donation Disease Reports (PDDR) (including symptoms like fever, rash, conjunctivitis, retro-orbital pain, arthralgia, myalgia, diarrhea, vomiting, and nausea among others). We also applied viral metagenomics to blood donations obtained from high-risk blood donors from Northern and Southern Brazil. To do this, a high-performance bioinformatics pipeline was implemented to identify emerging and re- emerging viruses. The implementation was carried out in BASH script, DOCKER (containers) and in-house developed PERL scripts. The main stages of the pipeline include quality control of the sequences with the FastQC software, cleaning of low-quality sequences and poly-x tails by Trimmomatic and AfterQC, genome assembly by SPAdes software and finally sequence taxonomy using Kraken2 and Diamond. The phylodynamic analyzes of the most important viruses found were performed using the IQ-TREE software and the BEAST package. Among our results from PDDR samples we can highlight the first report in the literature of the Influenza A virus (H2N3) in plasma samples from blood donors. We also identified the dengue virus and Parvovirus B19 (both not included in the route testing of the blood collection services). Interestingly, in samples from North Brazil, we identified in high-risk blood donors the scarcely studied studied Human Gemykibivirus-2, which has already been related to severe clinical conditions and HIV co-infections. Another interesting finding in these samples was the Merkell cell polyomavirus with high sequence numbers (which may indicate a viremic state). In Brazil, comprehensive studies on infections which can impact transfusion safety have not been performed and the real impact of the emerging viruses on the hemotherapy processes is underestimated and little known. However, some challenges in this area must be overcame, and among them we can mention the bioinformatics analysis of the generated data, which often requires high computational resources and specialized labor. Therefore, our study examines in extensive manner the impact of emerging viruses in the area of hemotherapy using the newest sequencing generation and implementing an efficient bioinformatics pipeline for virome analysis.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2021-11-19
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.