Furto de combustÃveis é uma preocupação enfrentada por vários paÃses e companhias da
indústria de óleo e gás, devido aos seus impactos no meio ambiente e na segurança das
comunidades próximas aos oleodutos. Por isso, o monitoramento e inspeção dos locais onde
estão localizadas as faixas de duto por meio de alertas é fundamental para evitar suspeitas de
furto de combustÃvel e mitigar riscos. Os alertas são acionados por sistemas de monitoramento
e patrulhas são enviadas para verificar a localização e confirmar ou não a ocorrência de furto
de combustÃvel, também conhecido como derivação clandestina. No entanto, vários sinais
podem ser alarmados em um curto perÃodo, e sua correta priorização é essencial para identificar
estas derivações clandestinas, o mais rápido possÃvel. Este trabalho tem como objetivo utilizar
técnicas de ciência de dados e aprendizado de máquina para realizar um modelo preditivo capaz
de prever a probabilidade de um evento resultar em uma derivação clandestina e compreender
os fatores que influenciam na sua ocorrência. Dados de um sistema de monitoramento de janeiro
de 2019 a agosto de 2021 foram fornecidos por uma empresa brasileira de transporte de
combustÃvel. Usamos quatro algoritmos de aprendizado de máquina: Regressão LogÃstica,
Random Forest, XGBoost e Catboost. O Random Forest obteve os melhores resultados na
classificação dos alertas associados (ou não) a uma derivação clandestina, apresentando
acurácia e especificidade de 78,6% e 68,3%, respectivamente. Nesse problema, a especificidade
significa que é possÃvel reduzir o envio de rondas em campo em 68,3% dos casos. Quanto Ã
validação externa, o modelo também apresentou bom desempenho, com acurácia e
especificidade de 61%. A longa duração dos alertas, o elevado histórico de derivações
clandestinas e a ocorrência dos alertas durante a noite são os fatores que mais influenciam na
ocorrência de derivações clandestinas.
|