Título
[pt] O ALGORITMO BOOSTING AT START E SUAS APLICACOES
Título
[en] THE BOOSTING AT START ALGORITHM AND ITS APPLICATIONS
Autor
[pt] JULIO CESAR DUARTE
Vocabulário
[pt] APRENDIZADO DE MAQUINA
Vocabulário
[pt] BOOSTING AT START
Vocabulário
[pt] ADABOOST
Vocabulário
[pt] ALGORITMOS DE COMITE
Vocabulário
[pt] PROCESSAMENTO DE LINGUAGEM NATURAL
Vocabulário
[pt] BOOSTING
Vocabulário
[en] MACHINE LEARNING
Vocabulário
[en] BOOSTING AT START
Vocabulário
[en] ADABOOST
Vocabulário
[en] ENSEMBLE ALGORITHMS
Vocabulário
[en] NATURAL LANGUAGE PROCESSING
Vocabulário
[en] BOOSTING
Resumo
[pt] Boosting é uma técnica de aprendizado de máquina que combina diversos classificadores fracos com o objetivo de melhorar a acurácia geral. Em cada iteração, o algoritmo atualiza os pesos dos exemplos e constrói um classificador adicional. Um esquema simples de votação é utilizado para combinar os classificadores. O algoritmo mais famoso baseado em Boosting é o AdaBoost. Este algoritmo aumenta os pesos dos exemplos em que os classificadores anteriores cometeram erros. Assim, foca o classificador adicional nos exemplos mais difíceis. Inicialmente, uma distribuição uniforme de pesos é atribúda aos exemplos. Entretanto, não existe garantia que essa seja a melhor escolha para a distribuição inicial. Neste trabalho, apresentamos o Boosting at Start (BAS), uma nova abordagem de aprendizado de máquina baseada em Boosting. O BAS generaliza o AdaBoost permitindo a utilização de uma distribuição inicial arbitrária. Também apresentamos esquemas para determinação de tal distribuição. Além disso, mostramos como adaptar o BAS para esquemas de Aprendizado Semi-supervisionado. Adicionalmente, descrevemos a aplicação do BAS em diferentes problemas de classificação de dados e de texto, comparando o seu desempenho com o algoritmo AdaBoost original e alguns algoritmos do estado-da-arte para tais tarefas. Os resultados experimentais indicam que uma modelagem simples usando o algoritmo BAS gera classificadores eficazes.
Resumo
[en] Boosting is a Machine Learning technique that combines several weak classifers with the goal of improving the overall accuracy. In each iteration, the algorithm updates the example weights and builds an additional classifer. A simple voting scheme is used to combine the classifers. The most famous Boosting-based algorithm is AdaBoost. This algorithm increases the weights of the examples that were misclassifed by the previous classifers. Thus, it focuses the additional classifer on the hardest examples. Initially,
an uniform weight distribution is assigned to the examples. However, there is no guarantee that this is the best choice for the initial distribution. In this work, we present Boosting at Start (BAS), a new Machine Learning approach based on Boosting. BAS generalizes AdaBoost by allowing the use of an arbitrary initial distribution. We present schemes for the determination of such distribution. We also show how to adapt BAS to Semi-supervised learning schemes. Additionally, we describe the application of BAS in different problems of data and text classifcation, comparing its performance with the original AdaBoost algorithm and some state-of-the-art algorithms for such tasks. The experimental results indicate that a simple modelling using the BAS algorithm generates effective classifers.
Orientador(es)
RUY LUIZ MILIDIU
Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO
Banca
RUY LUIZ MILIDIU
Banca
GERALDO BONORINO XEXEO
Banca
RAUL PIERRE RENTERIA
Banca
BIANCA ZADROZNY
Banca
FLAVIO LUIS DE MELLO
Catalogação
2017-09-15
Apresentação
2009-09-08
Tipo
[pt] TEXTO
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=31451@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.31451
Arquivos do conteúdo
CAPA, AGRADECIMENTOS, RESUMO, ABSTRACT, SUMÁRIO, LISTAS, EPÍGRAFE PDF CAPÍTULO 1 PDF CAPÍTULO 2 PDF CAPÍTULO 3 PDF CAPÍTULO 4 PDF CAPÍTULO 5 PDF CAPÍTULO 6 PDF CAPÍTULO 7 PDF CAPÍTULO 8 PDF REFERÊNCIAS BIBLIOGRÁFICAS PDF