XINFORMAÇÕES SOBRE DIREITOS AUTORAIS
As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
Coleção Digital
Título: UMA ABORDAGEM DE PRÉ-PROCESSAMENTO AUTOMÁTICO PARA MINERAÇÃO DE TEXTOS EM PORTUGUÊS: SOB O ENFOQUE DA INTELIGENCIA COMPUTACIONAL Autor: CHRISTIAN NUNES ARANHA
Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO
Colaborador(es):
MARLEY MARIA BERNARDES REBUZZI VELLASCO - ORIENTADOR
EMMANUEL PISECES LOPES PASSOS - COORIENTADOR
Nº do Conteudo: 10081
Catalogação: 25/06/2007 Liberação: 25/06/2007 Idioma(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TESE
Natureza: PUBLICAÇÃO ACADÊMICA
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=10081&idi=1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=10081&idi=2
Referência DOI: https://doi.org/10.17771/PUCRio.acad.10081
Resumo:
Título: UMA ABORDAGEM DE PRÉ-PROCESSAMENTO AUTOMÁTICO PARA MINERAÇÃO DE TEXTOS EM PORTUGUÊS: SOB O ENFOQUE DA INTELIGENCIA COMPUTACIONAL Autor: CHRISTIAN NUNES ARANHA
EMMANUEL PISECES LOPES PASSOS - COORIENTADOR
Nº do Conteudo: 10081
Catalogação: 25/06/2007 Liberação: 25/06/2007 Idioma(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TESE
Natureza: PUBLICAÇÃO ACADÊMICA
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=10081&idi=1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=10081&idi=2
Referência DOI: https://doi.org/10.17771/PUCRio.acad.10081
Resumo:
O presente trabalho apresenta uma pesquisa onde é proposto
um novo
modelo de pré-processamento para mineração de textos em
português utilizando
técnicas de inteligência computacional baseadas em
conceitos existentes, como
redes neurais, sistemas dinâmicos, e estatística
multidimensional. O objetivo dessa
tese de doutorado é, portanto, inovar na fase de pré-
processamento da mineração
de textos, propondo um modelo automático de enriquecimento
de dados textuais.
Essa abordagem se apresenta como uma extensão do
tradicional modelo de
conjunto de palavras (bag-of-words), de preocupação mais
estatística, e propõe
um modelo do tipo conjunto de lexemas (bag-of-lexems) com
maior
aproveitamento do conteúdo lingüístico do texto em uma
abordagem mais
computacional, proporcionando resultados mais eficientes.
O trabalho é
complementado com o desenvolvimento e implementação de um
sistema de préprocessamento
de textos, que torna automática essa fase do processo de
mineração
de textos ora proposto. Apesar do objeto principal desta
tese ser a etapa de préprocessamento,
passaremos, de forma não muito aprofundada, por todas as
etapas
do processo de mineração de textos com o intuito de
fornecer a teoria base
completa para o entendimento do processo como um todo.
Além de apresentar a
teoria de cada etapa, individualmente, é executado um
processamento completo
(com coleta de dados, indexação, pré-processamento,
mineração e pósprocessamento)
utilizando nas outras etapas modelos já consagrados na
literatura
que tiveram sua implementação realizada durante esse
trabalho. Ao final são
mostradas funcionalidades e algumas aplicações como:
classificação de
documentos, extração de informações e interface de
linguagem natural (ILN).