Maxwell Para Simples Indexação

Título
[pt] ANÁLISE DE TRÁFEGO DE BOTNETS COM MACHINE LEARNING

Título
[en] BOTNET TRAFFIC ANALYSIS USING MACHINE LEARNING

Autor
[pt] GABRIEL MANHAES DE SOUZA

Vocabulário
[pt] MACHINE LEARNING

Vocabulário
[pt] ENGENHARIA DE FEATURES

Vocabulário
[pt] BOTNET

Vocabulário
[pt] KNN

Vocabulário
[pt] AUTOENCODER

Vocabulário
[pt] RANDOM FOREST

Vocabulário
[en] MACHINE LEARNING

Vocabulário
[en] FEATURE ENGINEERING

Vocabulário
[en] BOTNET

Vocabulário
[en] KNN

Vocabulário
[en] AUTOENCODER

Vocabulário
[en] RANDOM FOREST

Resumo
[pt] O objetivo deste estudo é produzir de forma satisfatória um modelo de detecção de tráfego de botnet, utilizando técnicas de pré processamento, engenharia de atributos e otimização especificamente para o dataset CTU-13, que conta com amostras reais de tráfego de malwares conhecidos, além de tráfego normal e background. A metodologia, de forma resumida, foi: remoção dos dados inválidos através de imputação simples; encoding; agrupamento em janelas de 5 segundos, endereço de origem e label; separação em treino e teste; treino do modelo; avaliação dos resultados da predição. Para a avaliação final, foi utilizado: Autoencoder, Stacked Autoencoders, Variational Autoencoder, Random Forest e KNN. Todos modelos tiveram boas métricas, sendo o melhor deles o Random Forest, com o f1-score igual a 0.96.

Resumo
[en] The objective of this study is to satisfactorily produce a botnet traffic detection model, using pre-processing, feature engineering and optimization techniques specifically for the CTU-13 dataset, which has real samples of malware related traffic in addition to normal and background traffic. The methodology, in short, was: removal of invalid data through simple imputation; encoding; grouping in 5 second windows, source address and label; evaluation of prediction results. For the final evaluation, the following were used: Autoencoder, Stacked Autoencoders, Variational Autoencoder, Random Forest and KNN. All models showed good metrics, and the best results were from Random Forest, with a 0.96 f1-score.

Orientador(es)
HELIO CORTES VIEIRA LOPES

Coorientador(es)
ANDERSON OLIVEIRA DA SILVA

Catalogação
2023-09-18

Apresentação
1969-12-31

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=63981@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=63981@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.63981


Arquivos do conteúdo
NA ÍNTEGRA PDF