Maxwell Para Simples Indexação

Título
[en] AN APPROACH TO MODEL, STORE AND ACCESS BIOLOGICAL SEQUENCES

Título
[pt] UMA ABORDAGEM PARA MODELAR, ARMAZENAR E ACESSAR SEQUÊNCIAS BIOLÓGICAS

Autor
[pt] CRISTIAN TRISTAO

Vocabulário
[pt] ESTRUTURA

Vocabulário
[pt] BASE DE DADOS

Vocabulário
[pt] MODELAGEM CONCEITUAL

Vocabulário
[en] STRUCTURE

Vocabulário
[en] BIG DATA

Vocabulário
[en] CONCEPTUAL MODELING

Resumo
[pt] As pesquisas na área da biologia molecular vêm produzindo um grande volume de dados e estes precisam ser bem organizados, estruturados e persistidos. Na sua grande maioria os dados biológicos são armazenados em arquivos no formato texto. Para grandes volumes de dados, o caminho natural seria utilizar SGBDs para gerenciá-los. Contudo, estes sistemas não possuem estruturas adequadas para representar e manipular dados específicos ao domínio. Por exemplo, sequências biológicas normalmente são tratadas como simples cadeias de caracteres (tipo texto/varchar) ou BLOB, e desta forma perde-se todo um conjunto de informações composicionais, posicionais e de conteúdo. Esta tese argumenta que a gerência de dados (estrutura, armazenamento e acesso de dados) se transformou em um dos principais problemas para o domínio de pesquisas da bioinformática. Desta maneira propõe-se um modelo conceitual biológico para representar informações do dogma central da biologia molecular, bem como um tipo abstrato de dado (ADT – do inglês Abstract Data Types) específico para a manipulação de sequências biológicas e seus derivados.

Resumo
[en] The researches in molecular biology have been producing a large amount of data and they need to be well organized, structured and persisted. Mostly biological data are stored on files in text format. For large volumes of data, the natural way would be to use DBMS to manage them. However, these systems do not have adequate structures to represent and manipulate data specific to the domain. For example, biological sequences are typically treated as simple strings (type text/varchar) or BLOB, and thus lost a whole set of compositional, positional and content information. This thesis argues that the management of data (structure, storage and data access) has become a major problem for researches in bioinformatics. Thus we propose a conceptual model for representing biological information of the central dogma of molecular biology, as well as an Abstract Data Types (ADT) specific for the manipulation of biological sequences and its derivatives.

Orientador(es)
EDWARD HERMANN HAEUSLER

Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
SERGIO LIFSCHITZ

Banca
EDWARD HERMANN HAEUSLER

Banca
ANTONIO BASILIO DE MIRANDA

Banca
DUNCAN DUBUGRAS ALCOBA RUIZ

Catalogação
2013-04-03

Apresentação
2012-07-09

Tipo
[pt] TEXTO

Formato
application/pdf

Formato
application/pdf

Formato
application/pdf

Formato
application/pdf

Formato
application/pdf

Formato
application/pdf

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=21436@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.21436


Arquivos do conteúdo
CAPA, AGRADECIMENTOS, RESUMO, ABSTRACT, SUMÁRIO E LISTAS PDF
CAPÍTULO 1 PDF
CAPÍTULO 2 PDF
CAPÍTULO 3 PDF
CAPÍTULO 4 PDF
CAPÍTULO 5 PDF
REFERÊNCIAS BIBLIOGRÁFICAS PDF