$$\newcommand{\bra}[1]{\left<#1\right|}\newcommand{\ket}[1]{\left|#1\right>}\newcommand{\bk}[2]{\left<#1\middle|#2\right>}\newcommand{\bke}[3]{\left<#1\middle|#2\middle|#3\right>}$$
X
INFORMAÇÕES SOBRE DIREITOS AUTORAIS


As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.

A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.

A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.

A violação de direitos autorais é passível de sanções civis e penais.
Coleção Digital

Avançada


Formato DC |



Título: IDENTIFICAÇÃO DE TABELAS DE DADOS RELACIONAIS EM DOCUMENTOS WEB UTILIZANDO MACHINE LEARNING
Autor: LEON SERFATY KACOWICZ
Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO
Colaborador(es):  EDUARDO SANY LABER - ORIENTADOR
Nº do Conteudo: 15855
Catalogação:  05/07/2010 Idioma(s):  PORTUGUÊS - BRASIL
Tipo:  TEXTO Subtipo:  TRABALHO DE FIM DE CURSO
Natureza:  PUBLICAÇÃO ACADÊMICA
Nota:  Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]:  https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=15855@1
Referência DOI:  https://doi.org/10.17771/PUCRio.acad.15855

Resumo:
Tabelas são freqüentemente utilizadas em documentos web para apresentar dados. No entanto a detecção de tabelas relacionais ainda continua uma questão em aberto. Neste trabalho tentamos replicar os resultados obtidos por Wang e Hu [1], onde eles apresentam seus resultados utilizando Machine Learning para resolver o problema. Utilizamos as mesmas técnicas de classificação, os mesmo atributos para tabelas e o mesmo banco de dados para teste. Adicionalmente testamos o Multilayer Perceptron como método de classificação alternativo. Em seguida fazemos uma busca pelo conjunto ótimo de atributos a serem utilizados pelos classificadores. Obtivemos um FScore de 95.14% para Árvore de Decisão (utilizando Cross-Validation de 9 partições), o que confirma os resultados apresentados em [1]. Avaliamos também a capacidade de generalização dos classificadores em novos domínios web, obtendo resultados satisfatórios.

Descrição Arquivo
NA ÍNTEGRA  PDF  
Logo maxwell Agora você pode usar seu login do SAU no Maxwell!!
Fechar Janela



* Esqueceu a senha:
Senha SAU, clique aqui
Senha Maxwell, clique aqui