• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.76.2023.tde-06092023-100207
Documento
Autor
Nombre completo
Renan dos Reis
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Carlos, 2023
Director
Tribunal
Costa, Luciano da Fontoura (Presidente)
Levada, Alexandre Luis Magalhães
Silva Filho, Antonio Carlos Roque da
Título en portugués
Redes de meta-modelagem e suas aplicações no estudo de anotações de proteínas
Palabras clave en portugués
Anotação de proteínas
Ciência de redes
Enzimas ativas em carboidratos
Meta-modelagem
Reconhecimento de padrões
Resumen en portugués
A crescente disponibilidade de dados tem motivado o desenvolvimento de novas abordagens de modelagem para sua análise e interpretação, incluindo métodos estatísticos, mineração de dados e aprendizado de máquina. Apesar de serem particularmente eficazes, os modelos baseados em dados tendem a ter interpretabilidade limitada, o que pode dificultar a compreensão de suas previsões. Para lidar com essas questões, este trabalho foca na extensão e aplicação de uma abordagem formal de meta-modelagem que possa fornecer subsídios para caracterizar, melhorar e integrar modelos baseados em dados. O procedimento proposto consiste na aplicação de ciência de redes na construção de uma rede de meta-modelagem que conecta conjuntos de dados a modelos científicos. Primeiro, a meta-modelagem envolve a delimitação de três domínios: um domínio de universo que contém todos os dados acessíveis para modelagem, um ambiente de dados com conjuntos de dados organizados, e uma estrutura de modelagem capaz de explicar esse ambiente de dados. Depois disso, a rede é construída com base em duas operações: a associação bijetiva entre conjuntos de dados e modelos (resumida no conceito de cartucho) e a conexão entre os elementos de cada conjunto de dados e cada modelo. Com essas propriedades, a rede permite avaliar quantitativamente a interação entre modelos na mesma estrutura de modelagem, além de facilitar a criação de novos modelos por meio da correspondência entre operações lógicas de modelos e operações entre conjuntos de dados. Esta abordagem foi aplicada a dois problemas de modelagem. No primeiro caso, o foco estava no reconhecimento de padrões em sequências binárias. Nele, descrevemos detalhadamente a interação entre seis modelos de padrões, além de derivar um modelo preciso para um conjunto de dados usando uma composição lógica de modelos pré-existentes, o que mostra o potencial dessa abordagem para estudar a detecção de padrões em sequências de símbolos. No segundo caso, o método foi aplicado para auxiliar a análise exploratória da anotação de domínios de proteínas em enzimas ativas em carboidratos, presente no banco de dados CAZy. O estudo desse meta-modelo revelou informações sobre a modularidade das classes funcionais e suas relações evolutivas e funcionais. Coletivamente, esses resultados indicam que a rede de meta-modelagem desenvolvida tem potencial para auxiliar na caracterização e aprimoramento da modelagem científica em múltiplas áreas, com aplicações promissoras para a análise de anotação de proteínas.
Título en inglés
Meta-modeling networks and their applications in the study of protein annotations
Palabras clave en inglés
Carbohydrate-active enzymes
Meta-modeling
Network science
Pattern recognition
Protein annotation
Resumen en inglés
The growing availability of data has motivated the development of new modeling approaches for its analysis and interpretation, including statistical methods, data mining, and machine learning. Despite being particularly effective, data-driven models tend to have limited interpretability, which can make their predictions difficult to understand. To deal with these issues, this work focuses on the extension and application of a meta-modeling formal approach that can provide subsidies to characterize, improve and integrate data-based models. The proposed procedure consists of applying network science in the construction of a meta-modeling network that connects datasets to scientific models. First, the metamodeling involves delimiting three domains: a universe domain that contains all data accessible for modeling, a data environment with organized datasets, and a modeling framework capable of explaining this data environment. After that, the network is built based on two operations: the bijective association between datasets and models (summarized in the concept of cartouche) and the connection between the elements of each dataset and each model. With these properties, the network enables to quantitatively evaluate the interaction between models in the same modeling structure, in addition to facilitating the creation of new models through the correspondence between logical operations between models and set operations between datasets. This approach was applied to two modeling problems. In the first case, the focus was on pattern recognition in binary sequences. In this problem, we describe in detail the interaction between six models of patterns, in addition to deriving an accurate model for a dataset using a logical composition of pre-existing models, which shows the potential of this approach to study pattern detection in sequences of symbols. In the second case, the method was applied to aid the exploratory analysis of a protein domain annotation in carbohydrate-active enzymes, available in the CAZy database. The study of this meta-model revealed information about the modularity of functional classes and their evolutionary and functional relationships. Collectively, these results indicate that the developed meta-modeling network has the potential to aid in the characterization and improvement of scientific modeling in multiple areas, with promising applications for protein annotation analysis.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2023-09-06
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.