XINFORMAÇÕES SOBRE DIREITOS AUTORAIS
As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
Coleção Digital
Título: IDENTIFICAÇÃO DE TABELAS DE DADOS RELACIONAIS EM DOCUMENTOS WEB UTILIZANDO MACHINE LEARNING Autor: LEON SERFATY KACOWICZ
Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO
Colaborador(es):
EDUARDO SANY LABER - ORIENTADOR
Nº do Conteudo: 15855
Catalogação: 05/07/2010 Idioma(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TRABALHO DE FIM DE CURSO
Natureza: PUBLICAÇÃO ACADÊMICA
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=15855@1
Referência DOI: https://doi.org/10.17771/PUCRio.acad.15855
Resumo:
Título: IDENTIFICAÇÃO DE TABELAS DE DADOS RELACIONAIS EM DOCUMENTOS WEB UTILIZANDO MACHINE LEARNING Autor: LEON SERFATY KACOWICZ
Nº do Conteudo: 15855
Catalogação: 05/07/2010 Idioma(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TRABALHO DE FIM DE CURSO
Natureza: PUBLICAÇÃO ACADÊMICA
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=15855@1
Referência DOI: https://doi.org/10.17771/PUCRio.acad.15855
Resumo:
Tabelas são freqüentemente utilizadas em documentos web para apresentar dados. No
entanto a detecção de tabelas relacionais ainda continua uma questão em aberto. Neste
trabalho tentamos replicar os resultados obtidos por Wang e Hu [1], onde eles
apresentam seus resultados utilizando Machine Learning para resolver o problema.
Utilizamos as mesmas técnicas de classificação, os mesmo atributos para tabelas e o
mesmo banco de dados para teste. Adicionalmente testamos o Multilayer Perceptron
como método de classificação alternativo. Em seguida fazemos uma busca pelo
conjunto ótimo de atributos a serem utilizados pelos classificadores. Obtivemos um FScore
de 95.14% para Árvore de Decisão (utilizando Cross-Validation de 9 partições), o
que confirma os resultados apresentados em [1]. Avaliamos também a capacidade de
generalização dos classificadores em novos domínios web, obtendo resultados
satisfatórios.
Descrição | Arquivo |
NA ÍNTEGRA |