• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.76.2018.tde-07032018-150722
Document
Author
Full name
Antonio Marinho da Silva Neto
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2017
Supervisor
Committee
Montalvão, Rinaldo Wander (President)
Chahine, Jorge
Coutinho, Kaline Rabelo
Freitas, Luiz Carlos Gomide
Muniz, João Renato Carvalho
Title in Portuguese
Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
Keywords in Portuguese
Análise conformacional
Espaço conformacional
Estrutura de proteínas
Geometria diferencial
Teoria da informação
Abstract in Portuguese
Um dos maiores desafios atuais na biologia estrutural é como lidar com flexibilidade de proteínas. Além do desafio experimental, uma limitação teórica é a falta de uma linguagem matemática conveniente para representação do espaço conformacional de proteínas. As representações mais populares apresentam diversas limitações, que se refletem nas dificuldades associadas à análise de ensembles conformacionais. Nesse contexto, a aplicação de geometria diferencial (GD) e teoria da informação (TI) foi pouco explorada. Neste trabalho investigamos o uso de descritores de GD e TI como uma representação matemática do espaço conformacional de proteínas aplicada à análise de ensembles conformacionais. O cálculo dos descritores de GD consiste em representar o backbone de proteínas como curvas espaciais e caracterizá-las utilizando os seus valores de curvatura, κ, e torção, τ . Baseado nesses valores, definimos medidas de flexibilidade, de distância entre conformações e aplicamos uma estratégia de clustering para identificação de estados conformacionais. Para permitir a aplicação de TI, desenvolvemos um sistema de codificação desses descritores para expressar cada conformação por uma sequência de símbolos finitos. A partir dessas sequências, definimos uma medida da informação associada a um resíduo, Rres, e a uma conformação, Rconf. Para investigar sua eficácia, aplicamos os métodos propostos aos ensembles conformacionais de três sistemas testes: 1) Ubiquitina, 2) E1-DBD do HPV18 e 3) as etapas de formação do complexo c-Myb-KIX. A análise da representação por geometria diferencial se mostrou igualmente eficaz ou superior aos métodos comumente utilizados em todos os sistemas analisados. O método é especialmente útil para monitoramento de estabilidade de hélices e para análise de proteínas e regiões muito flexíveis, pois evita a necessidade de sobreposição estrutural. Os valores de Rconf se apresentaram úteis para análise de processos de enovelamento e resíduos próximos a regiões funcionais tendem a apresentar maiores valores Rres. No entanto, o papel desses resíduos é incerto e mais estudos são necessários para determinar se há e qual é seu real significado. Apesar disso, as medidas de informação se mostraram úteis para comparação de estados conformacionais e permitem levantar hipóteses testáveis em laboratório. Por fim, a representação por GD é computacionalmente conveniente, intuitiva, evita todas as limitações dos métodos popularmente utilizados e se mostrou eficaz para análise de ensembles conformacionais.
Title in English
Differential geometry and information theory application to protein conformational analyses
Keywords in English
Conformational analyses
Differential geometry
Flexibility
Information theory
Protein structure
Abstract in English
One of the major challenges of modern structural biology is how to deal with protein flexibility. Besides the experimental difficulties, a relatively overlooked theoretical challenge is the lack of a proper mathematical language to represent proteín conformational space. The most popular representations have severe limitations, which reflects on the difficulties associated with conformational ensemble analyses. However, differential geometry (GD) and information theory (TI) can help to overcome such difficulties and were not well explored in this context. Here we investigate the usage of DG and TI as a mathematical representation of protein conformational space applied to the analyses of conformational ensembles. The DG descriptors calculation consists of representing protein backbone as a spatial curve and describes it by its curvature, κ, and torsion, τ . Based on those values, the distance between conformation and flexibility measurements were defined and a clustering algorithm was applied to identify conformational states. For the application of TI, a coding system for DG descriptors was developed to express each conformation as a sequence of finite symbols. Based on those sequences, information measurements associated to a residue, Rres, and to a conformation, Rconf , were defined. To investigate its efficacy, the proposed method was applied to conformation ensembles of three test systems: 1) Ubiquitin, 2) E1-DBD of HPV18 and 3) the steps of c-Myb-KIX binding. The DG analyses show equally good or superior performance when compared with popular methods on all tested system. In addition, the methods are especially useful to monitoring helix stability and analyses of very flexible proteins (or regions), since avoids the necessity of superposing structures. The values of Rconf are useful to compare different steps of a folding process and residues near regions involved in binding events tend to present higher values of Rres. However, those residues importance is uncertain and further studies are necessary to determinate if and how those can contribute to protein function. Nevertheless, the information measurements were informative on the comparison of compare conformational states and allow to formulate a testable hypothesis. On the other hand, the GD representation is computationally convenient, intuitive and avoid most of the limitations of the popular method applied to conformational ensemble analyses.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2018-04-04
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.