$$\newcommand{\bra}[1]{\left<#1\right|}\newcommand{\ket}[1]{\left|#1\right>}\newcommand{\bk}[2]{\left<#1\middle|#2\right>}\newcommand{\bke}[3]{\left<#1\middle|#2\middle|#3\right>}$$
INFORMAÇÕES SOBRE DIREITOS AUTORAIS


As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.

A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.

A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.

A violação de direitos autorais é passível de sanções civis e penais.
Coleção Digital

Avançada


Formato DC|



Título: IDENTIFICAÇÃO DE TABELAS DE DADOS RELACIONAIS EM DOCUMENTOS WEB UTILIZANDO MACHINE LEARNING
Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO
Autor(es): LEON SERFATY KACOWICZ

Colaborador(es):  EDUARDO SANY LABER - Orientador
Número do Conteúdo: 15855
Catalogação:  05/07/2010 Idioma(s):  PORTUGUÊS - BRASIL

Tipo:  TEXTO Subtipo:  TRABALHO DE FIM DE CURSO
Natureza:  PUBLICAÇÃO ACADÊMICA
Nota:  Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]:  https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=15855@1
Referência DOI:  https://doi.org/10.17771/PUCRio.acad.15855

Resumo:
Tabelas são freqüentemente utilizadas em documentos web para apresentar dados. No entanto a detecção de tabelas relacionais ainda continua uma questão em aberto. Neste trabalho tentamos replicar os resultados obtidos por Wang e Hu [1], onde eles apresentam seus resultados utilizando Machine Learning para resolver o problema. Utilizamos as mesmas técnicas de classificação, os mesmo atributos para tabelas e o mesmo banco de dados para teste. Adicionalmente testamos o Multilayer Perceptron como método de classificação alternativo. Em seguida fazemos uma busca pelo conjunto ótimo de atributos a serem utilizados pelos classificadores. Obtivemos um FScore de 95.14% para Árvore de Decisão (utilizando Cross-Validation de 9 partições), o que confirma os resultados apresentados em [1]. Avaliamos também a capacidade de generalização dos classificadores em novos domínios web, obtendo resultados satisfatórios.

Descrição Arquivo
NA ÍNTEGRA  PDF  
Agora você pode usar seu login do SAU no Maxwell!!
Fechar Janela



* Esqueceu a senha:
Senha SAU, clique aqui
Senha Maxwell, clique aqui