Maxwell Para Simples Indexação

Título
[en] MACHINE LEARNING METHODS APPLIED TO PREDICTIVE MODELS OF CHURN FOR LIFE INSURANCE

Título
[pt] MÉTODOS DE MACHINE LEARNING APLICADOS À MODELAGEM PREDITIVA DE CANCELAMENTOS DE CLIENTES PARA SEGUROS DE VIDA

Autor
[pt] THAIS TUYANE DE AZEVEDO

Vocabulário
[pt] APRENDIZADO DE MAQUINA

Vocabulário
[pt] SMOTE

Vocabulário
[pt] OVER SAMPLING

Vocabulário
[pt] UNDER SAMPLING

Vocabulário
[pt] DADO DESBALANCEADO

Vocabulário
[pt] RANDOM FOREST

Vocabulário
[pt] BAGGING

Vocabulário
[pt] PROPENSAO A CANCELAMENTO

Vocabulário
[pt] BOOSTING

Vocabulário
[pt] SEGURO DE VIDA

Vocabulário
[pt] ARVORE DE DECISAO

Vocabulário
[en] MACHINE LEARNING

Vocabulário
[en] SMOTE

Vocabulário
[en] OVER SAMPLING

Vocabulário
[en] UNDER SAMPLING

Vocabulário
[en] UNBALANCED DATA

Vocabulário
[en] RANDOM FOREST

Vocabulário
[en] BAGGING

Vocabulário
[en] CANCELLATION PROPENSITY

Vocabulário
[en] BOOSTING

Vocabulário
[en] LIFE INSURANCE

Vocabulário
[en] DECISION TREE

Resumo
[pt] O objetivo deste estudo foi explorar o problema de churn em seguros de vida, no sentido de prever se o cliente irá cancelar o produto nos próximos 6 meses. Atualmente, métodos de machine learning vêm se popularizando para este tipo de análise, tornando-se uma alternativa ao tradicional método de modelagem da probabilidade de cancelamento através da regressão logística. Em geral, um dos desafios encontrados neste tipo de modelagem é que a proporção de clientes que cancelam o serviço é relativamente pequena. Para isso, este estudo recorreu a técnicas de balanceamento para tratar a base naturalmente desbalanceada – técnicas de undersampling, oversampling e diferentes combinações destas duas foram utilizadas e comparadas entre si. As bases foram utilizadas para treinar modelos de Bagging, Random Forest e Boosting, e seus resultados foram comparados entre si e também aos resultados obtidos através do modelo de Regressão Logística. Observamos que a técnica SMOTE-modificado para balanceamento da base, aplicada ao modelo de Bagging, foi a combinação que apresentou melhores resultados dentre as combinações exploradas.

Resumo
[en] The purpose of this study is to explore the churn problem in life insurance, in the sense of predicting if the client will cancel the product in the next 6 months. Currently, machine learning methods are becoming popular in this type of analysis, turning it into an alternative to the traditional method of modeling the probability of cancellation through logistics regression. In general, one of the challenges found in this type of modelling is that the proportion of clients who cancelled the service is relatively small. For this, the study resorted to balancing techniques to treat the naturally unbalanced base – under-sampling and over-sampling techniques and different combinations of these two were used and compared among each other. The bases were used to train models of Bagging, Random Forest and Boosting, and its results were compared among each other and to the results obtained through the Logistics Regression model. We observed that the modified SMOTE technique to balance the base, applied to the Bagging model, was the combination that presented the best results among the explored combinations.

Orientador(es)
DIOGO ABRY GUILLEN

Banca
PEDRO CARVALHO LOUREIRO DE SOUZA

Banca
DIOGO ABRY GUILLEN

Banca
FLAVIO ERTHAL ABDENUR

Catalogação
2018-09-26

Apresentação
2018-06-18

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=35235@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.35235


Arquivos do conteúdo
NA ÍNTEGRA PDF