Título
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE
Título
[pt] MÉTODOS DE MACHINE LEARNING APLICADOS À MODELAGEM PREDITIVA DE CANCELAMENTOS DE CLIENTES PARA SEGUROS DE VIDA
Autor
[pt] THAIS TUYANE DE AZEVEDO
Vocabulário
[pt] APRENDIZADO DE MAQUINA
Vocabulário
[pt] SMOTE
Vocabulário
[pt] OVER SAMPLING
Vocabulário
[pt] UNDER SAMPLING
Vocabulário
[pt] DADO DESBALANCEADO
Vocabulário
[pt] RANDOM FOREST
Vocabulário
[pt] BAGGING
Vocabulário
[pt] PROPENSAO A CANCELAMENTO
Vocabulário
[pt] BOOSTING
Vocabulário
[pt] SEGURO DE VIDA
Vocabulário
[pt] ARVORE DE DECISAO
Vocabulário
[en] MACHINE LEARNING
Vocabulário
[en] SMOTE
Vocabulário
[en] OVER SAMPLING
Vocabulário
[en] UNDER SAMPLING
Vocabulário
[en] UNBALANCED DATA
Vocabulário
[en] RANDOM FOREST
Vocabulário
[en] BAGGING
Vocabulário
[en] CANCELLATION PROPENSITY
Vocabulário
[en] BOOSTING
Vocabulário
[en] LIFE INSURANCE
Vocabulário
[en] DECISION TREE
Resumo
[pt] O objetivo deste estudo foi explorar o problema de churn em seguros de vida, no sentido de prever se o cliente irá cancelar o produto nos próximos 6 meses. Atualmente, métodos de machine learning vêm se popularizando para este tipo de análise, tornando-se uma alternativa ao tradicional método de modelagem da probabilidade de cancelamento através da regressão logística. Em geral, um dos desafios encontrados neste tipo de modelagem é que a proporção de clientes que cancelam o serviço é relativamente pequena. Para isso, este estudo recorreu a técnicas de balanceamento para tratar a base naturalmente desbalanceada – técnicas de undersampling, oversampling e diferentes combinações destas duas foram utilizadas e comparadas entre si. As bases foram utilizadas para treinar modelos de Bagging, Random Forest e Boosting, e seus resultados foram comparados entre si e também aos resultados obtidos através do modelo de Regressão Logística. Observamos que a técnica SMOTE-modificado para balanceamento da base, aplicada ao modelo de Bagging, foi a combinação que apresentou melhores resultados dentre as combinações exploradas.
Resumo
[en] The purpose of this study is to explore the churn problem in life insurance, in the sense of predicting if the client will cancel the product in the next 6 months. Currently, machine learning methods are becoming popular in this type of analysis, turning it into an alternative to the traditional method of modeling the probability of cancellation through logistics regression. In general, one of the challenges found in this type of modelling is that the proportion of clients who cancelled the service is relatively small. For this, the study resorted to balancing techniques to treat the naturally unbalanced base – under-sampling and over-sampling techniques and different combinations of these two were used and compared among each other. The bases were used to train models of Bagging, Random Forest and Boosting, and its results were compared among each other and to the results obtained through the Logistics Regression model. We observed that the modified SMOTE technique to balance the base, applied to the Bagging model, was the combination that presented the best results among the explored combinations.
Orientador(es)
DIOGO ABRY GUILLEN
Banca
PEDRO CARVALHO LOUREIRO DE SOUZA
Banca
DIOGO ABRY GUILLEN
Banca
FLAVIO ERTHAL ABDENUR
Catalogação
2018-09-26
Apresentação
2018-06-18
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.35235
Arquivos do conteúdo
NA ÍNTEGRA PDF