• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
https://doi.org/10.11606/T.76.2024.tde-23042024-120251
Documento
Autor
Nome completo
Victor Henrique Rabesquine Nogueira
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Carlos, 2024
Orientador
Banca examinadora
Guido, Rafael Victório Carvalho (Presidente)
Andrade, Carolina Horta
Honorio, Káthia Maria
Minardi, Raquel Cardoso de Melo
Nascimento, Alessandro Silva
Título em português
Descoberta de novos inibidores para doenças infecciosas: estudos integrados de modelagem molecular e aprendizado de máquina para a malária e o COVID-19
Palavras-chave em português
Aprendizado de máquina
COVID-19
Malária
Modelagem molecular
Modelos Generativos
Resumo em português
Os processos de descoberta e desenvolvimento de fármacos são extremamente complexos, podendo levar mais de 15 anos desde a identificação do alvo até a comercialização de um medicamento com mais de $1 bi investidos ao longo desses anos. Os métodos computacionais voltados para descoberta e desenvolvimento de fármacos têm auxiliado a reduzir tanto os custos quanto o tempo de tal processo, além de maximizarem a chance de sucesso. Tais métodos têm sido essenciais para a coleta, o pré-processamento, a análise e a inferência de dados e têm desempenhado um importante papel para a descoberta de novas entidades químicas (NCE, do inglês, new chemical entities) nas últimas décadas. A busca por NCEs por métodos computacionais está associada à utilização de representações moleculares que podem influenciar diretamente na qualidade dos resultados. Neste trabalho métodos computacionais foram utilizados para a avaliação de representações moleculares e para a descoberta de novos potenciais inibidores para doenças infecciosas. Portanto, esta tese foi dividida em três partes: i) avaliação da robustez de uma representação molecular utilizando autocodificadores variacionais (VAE, do inglês, variational autoencoder); ii) geração inibidores do parasito causador da malária usando VAE; e iii) busca por inibidores da Mpro de SARS-CoV-2, combinando abordagens computacionais e ensaios experimentais. I) À medida que esforços para melhorar a robustez das representações moleculares avançam, avança a importância de métodos rigorosos para testá-las e validá-las. Usando um VAE para gerar amostras anômalas de uma representação molecular em cadeia conhecido como SELFIES, sua suposição fundamental serem sempre válidas quando convertidas em outra representação em cadeia (e.g., SMILES) foi verificada como não verdadeira neste trabalho. Os resultados obtidos mostraram que regiões específicas no espaço latente do VAE, explorado de forma contínua e radial, foram particularmente eficazes na geração de SELFIES que desafiaram a suposição fundamental. A organização da validade no espaço latente ajuda a entender melhor os fatores que afetam a confiabilidade da representação molecular. Portanto, neste trabalho propomos o VAE e a abordagem de geração de anomalias associada como uma ferramenta eficaz para avaliar a robustez de representações moleculares. II) A malária é uma das doenças tropical infecciosas com a maior taxa de mortalidade no mundo. A OMS estima que 619 mil mortes tenham ocorrido em decorrência da doença em 2021, sendo cerca de 76 % desse total mortes de crianças com menos de cinco anos de idade. O tratamento recomendado para a doença é feito com terapia combinada com derivados de artemisinina. Entretanto, o surgimento de cepas resistentes do parasito aos tratamentos disponíveis torna necessário a descoberta de novos antimaláricos. Neste trabalho é apresentado um modelo generativo utilizando VAE, treinado com um conjunto de 4 milhões de moléculas, utilizando SELFIES como representação molecular, e refinado com conjuntos distintos para a geração de novos inibidores do parasita. O modelo generativo apresentou parâmetros de qualidade satisfatórios que permitiram a proposição de mais de 100 mil moléculas como candidatas a inibidores do parasita. Diante disso, aplicamos diversos filtros classificatórios para a seleção de um subconjunto de 20 moléculas para a aquisição e/ou síntese e validação experimental. III) A pandemia de COVID-19 fez com que o mundo mudasse drasticamente. O SARS-CoV-2, vírus responsável por causar a doença, já matou aproximadamente 7 milhões de pessoas ao redor do mundo, sendo mais de 705 mil no Brasil (dados de outubro/2023). Embora as vacinas e os tratamentos tenham diminuído consideravelmente o impacto da pandemia, novas variantes virais continuam a surgir e fazem com que esforços para encontrar agentes terapêuticos sejam extremamente necessários. Nesse contexto, um estudo de triagem virtual de compostos naturais brasileiros para seleção e teste experimental de candidatos a inibidores da protease principal (Mpro) do vírus. Os 10 melhores hits virtuais foram submetidos a 100 ns de simulações de dinâmica molecular para verificação da estabilidade do modo de interação e cálculo de energia livre de ligação por MM-GBSA e metadinâmica. O composto mais promissor, taxifolina (NuBBE_139), foi avaliado experimentalmente in vitro contra a Mpro e mostrou valor de IC50 de 820 μM e um perfil de inibição competitivo. Em suma, embora contenha três partes distintas, esta tese focou na aplicação de métodos computacionais em química medicinal. Cada abordagem contribuiu sinergicamente para avanços na área ao utilizar diferentes ferramentas computacionais para alvos diferentes. Os autocodificadores variacionais geraram moléculas inéditas, com propriedades semelhantes a antimaláricos conhecidos, mas diferentes o bastante para possibilitar a proposição de novas classes de compostos com esse fim. A utilização dessa arquitetura também revelou falhas nos SELFIES, testando sua validade na conversão para SMILES e revelando, pela primeira vez, a metodologia como uma maneira eficiente de geração de anomalias representacionais. Além disso, métodos tradicionais, como triagem virtual e dinâmica molecular, permitiram a identificação de um inibidor competitivo da Mpro de SARSCoV- 2, com IC50 na faixa de submilimolar.
Título em inglês
Discovery of new inhibitors for infectious diseases: integrated molecular modeling and machine learning studies for malaria and COVID-19
Palavras-chave em inglês
COVID-19
Generative models
Machine Learning
Malaria
Molecular Modeling
Resumo em inglês
The drug discovery and development processes are extremely complex and can take more than 15 years from target identification to the commercialization of a drug, with more than $1 billion invested over those years. In this sense, computational methods aimed at drug discovery and development have helped to reduce both the costs and time of this process, as well as maximize the chance of success. These methods have been essential for data collection, pre-processing, analysis, and inference. Additionally, they have been crucial in discovering new chemical entities (NCE) in recent decades. The search for NCEs aided by computational methods is associated with using molecular representations that directly influence the quality of results. In this work, computational methods were used for the evaluation of molecular representations robustness and the discovery of potential new inhibitors for infectious diseases. Hence, this thesis was divided into three parts: i) assessment of the robustness of a molecular representation using variational autoencoders (VAE); ii) generating inhibitors for the malaria parasite using VAE; and iii) searching for inhibitors of SARS-CoV-2 Mpro, combining computational approaches and experimental assays. I) As efforts to improve the robustness of molecular representations progress, the importance of rigorous methods to test and validate them increases. Using a VAE to generate anomalous samples from a popular molecular representation called SELFIES, its fundamental assumption always being valid when converted to another string representation (e.g., SMILES) was tested. The results showed that specific regions in the latent space of the VAE, explored continuously and radially, are particularly effective in generating SELFIES that challenge this assumption. This organization of validity in the latent space helps better understand the factors affecting the reliability of the molecular representation. This work proposes VAE and the associated anomaly generation approach as an effective tool for assessing the robustness of molecular representations. II) Malaria is one of the infectious tropical diseases with the highest mortality rate globally. WHO estimates that 619,000 deaths occurred due to the disease in 2021, with about 76 % of this total being deaths of children under the age of five. The recommended treatment for the disease relies on artemisinin-derivatives combined therapy (ACT). However, the increasing resistance of the parasite to the available treatments makes the search for new antimalarials necessary. In this work, we built a generative model using variational autoencoder architecture, trained with a set of 4 million molecules using SELFIES as a molecular representation and refined with two different sets for generating new parasite inhibitors. The model showed satisfactory quality parameters that allow the generation of more than 100,000 molecules as inhibitor candidates.In light of that, we applied several filters to sort and select the 20 most promising compounds for synthesis and experimental validation. III) The COVID-19 pandemic has caused drastic changes worldwide. The SARS-CoV-2 virus, responsible for causing the disease, has already killed, approximately, 7 million people worldwide, with more than 705,000 in Brazil (data from October 2023). Although vaccines and treatments have considerably improved the pandemic's impact, new viral variants continue to emerge, making efforts to find new therapeutic agents extremely needed. In this context, we conducted a virtual screening study of Brazilian natural compounds for the selection and experimental testing of inhibitor candidates for SARS-CoV-2 Mpro protease. The top 10 virtual hit compounds were subjected to 100 ns molecular dynamics simulations to check their binding mode and stability, and to compute the binding free energy by MMGBSA and metadynamics studies. The most promising compound, taxifolin (NuBBE_139), was experimentally assessed in vitro against Mpro protease and showed an IC50 value of 820 μM and a competitive inhibition profile. In summary, although it contains three distinct parts, this thesis focuses on the application of computational methods in medicinal chemistry. Each approach contributed synergistically to advances in the field by using different computational tools for different targets. Variational autoencoders generated novel molecules, with properties similar to known antimalarials but sufficiently different to make it possible to propose new classes of compounds for this purpose. The use of this architecture also revealed flaws in SELFIES, testing its validity in the conversion to SMILES and revealing, for the first time, the methodology as an efficient way of generating representational anomalies. In addition, traditional methods such as virtual screening and molecular dynamics enabled the identification of a competitive inhibitor of SARS-CoV-2 Mpro, with an IC50 in the submillimolar range.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2024-04-24
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.