• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.59.2020.tde-21012020-225928
Document
Auteur
Nom complet
Gabriel do Couto Seabra Gusmão de Paula
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
Ribeirão Preto, 2019
Directeur
Jury
Farias, Clever Ricardo Guareis de (Président)
Santarem Segundo, Jose Eduardo
Santos, Marilde Terezinha Prado
Vencio, Ricardo Zorzetto Nicoliello
Titre en portugais
Suporte à geração de dados abertos ligados em bioinformática
Mots-clés en portugais
Bioinformática
Dados abertos ligados
Dados semiestruturados
Regras de transformação
Resumé en portugais
Diferentes conjuntos de dados na web encontram-se em formatos que dificultam o processamento e a extração automática de informação. A transformação desses dados em Dados Abertos Ligados (DAL) pode facilitar o processamento e a obtenção de novos conhecimentos. DAL define um conjunto de dados compreendido/interpretável por computadores, interconectado e semanticamente anotado. Diversos domínios de conhecimento podem ser beneficiados com o uso de DAL, dentre os quais destaca-se a bioinformática. A bioinformática é caracterizada pelo uso e a disponibilização de grandes quantidades de dados na web, normalmente armazenados em arquivos texto semiestruturados. Existem diferentes abordagens de transformação de dados estruturados e semiestruturados para DAL no domínio biomédico. Porém, essas abordagens não podem ser facilmente estendidas para a bioinformática. Este trabalho teve por objetivo propor uma abordagem de transformação de dados semiestruturados de bioinformática para DAL, chamada de SSD2LOD Transformation Approach. Esta abordagem é composta por quatro atividades, as quais orientam a definição de questões de competência (perguntas de interesse), a especificação de regras de transformação, a transformação dos dados, e, finalmente, a exploração do conjunto DAL resultante. Adicionamente, desenvolvemos um conjunto de ferramentas de suporte para executar o processo de transformação e exploração dos dados, de modo a facilitar a aplicação da abordagem. Na sequência, aplicamos a abordagem proposta em uma prova de conceito utilizando dados de um experimento de genômica funcional disponibilizado na plataforma ArrayExpress. A abordagem SSD2LOD Transformation Approach representa uma solução adequada para a transformação de dados de bioinformática em DAL, permitindo alcançar os benefícios da web semântica neste domínio.
Titre en anglais
Support for the generation of linked open data in bioinformatics
Mots-clés en anglais
Bioinformatics
Linked open data
Semi-structured data
Transformation rules
Resumé en anglais
Data on the web are frequently stored in formats that hinder the automatic processing and extraction of knowledge. However, the transformation of those data into Linked Open Data (LOD) may facilitate the discovery of new knowledge. LOD defines a machinereadable, interconnected and semantically annotated dataset. The bioinformatics domain may benefit from the use of LOD, since it is characterized by the use and availability of large amounts of data on the web, usually stored in semi-structured text files. There are different approaches to support the transformation of structured and semi-structured data into LOD in the biomedical domain. However, these approaches are not easily applied to the bioinformatics domain. This work aimed at developing a transformation approach from semi-structured bioinformatics data into LOD, called SSD2LOD Transformation Approach. The proposed approach consists of four activities, which guide the definition of competency questions (questions of interest), specification of transformation rules, data transformation, and, finally, exploration of the produced LOD set. Additionally, we have developed a toolset to support the process of data transformation and exploration of our LOD transformation approach. Next, we have applied the proposed approach in a proof of concept using source data from a functional genomics experiment available at ArrayExpress. Our approach supports the transformation of bioinformatics data into LOD, thus enabling the benefits of the semantic web in this domain.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2020-05-14
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.