Maxwell Para Simples Indexação

Título
[en] ANOMALY DETECTION IN DATA CENTER MACHINE MONITORING METRICS

Título
[pt] DETECÇÃO DE ANOMALIAS NAS MÉTRICAS DAS MONITORAÇÕES DE MÁQUINAS DE UM DATA CENTER

Autor
[pt] RICARDO SOUZA DIAS

Vocabulário
[pt] SERIE TEMPORAL

Vocabulário
[pt] DATA CENTER

Vocabulário
[pt] APRENDIZAGEM NAO SUPERVISIONADA

Vocabulário
[pt] DADOS EM FLUXO CONTINUO

Vocabulário
[pt] DETECCAO DE ANOMALIAS

Vocabulário
[pt] METRICA

Vocabulário
[pt] MONITORACAO

Vocabulário
[pt] ALGORITMO

Vocabulário
[en] TIME SERIE

Vocabulário
[en] DATA CENTER

Vocabulário
[en] UNSUPERVISED LEARNING

Vocabulário
[en] STREAMING DATA

Vocabulário
[en] ANOMALY DETECTION

Vocabulário
[en] METRIC

Vocabulário
[en] MONITORING

Vocabulário
[en] ALGORITHM

Resumo
[pt] Um data center normalmente possui grande quantidade de máquinas com diferentes configurações de hardware. Múltiplas aplicações são executadas e software e hardware são constantemente atualizados. Para evitar a interrupção de aplicações críticas, que podem causar grandes prejuízos financeiros, os administradores de sistemas devem identificar e corrigir as falhas o mais cedo possível. No entanto, a identificação de falhas em data centers de produção muitas vezes ocorre apenas quando as aplicações e serviços já estão indisponíveis. Entre as diferentes causas da detecção tardia de falhas estão o uso técnicas de monitoração baseadas apenas em thresholds. O aumento crescente na complexidade de aplicações que são constantemente atualizadas torna difícil a configuração de thresholds ótimos para cada métrica e servidor. Este trabalho propõe o uso de técnicas de detecção de anomalias no lugar de técnicas baseadas em thresholds. Uma anomalia é um comportamento do sistema que é incomum e significativamente diferente do comportamento normal anterior. Desenvolvemos um algoritmo para detecção de anomalias, chamado DASRS (Decreased Anomaly Score by Repeated Sequence) que analisa em tempo real as métricas coletadas de servidores de um data center de produção. O DASRS apresentou excelentes resultados de acurácia, compatível com os algoritmos do estado da arte, além de tempo de processamento e consumo de memória menores. Por esse motivo, o DASRS atende aos requisitos de processamento em tempo real de um grande volume de dados.

Resumo
[en] A data center typically has a large number of machines with different hardware configurations. Multiple applications are executed and software and hardware are constantly updated. To avoid disruption of critical applications, which can cause significant financial loss, system administrators should identify and correct failures as early as possible. However, fault-detection in production data centers often occurs only when applications and services are already unavailable. Among the different causes of late fault-detection are the use of thresholds-only monitoring techniques. The increasing complexity of constantly updating applications makes it difficult to set optimal thresholds for each metric and server. This paper proposes the use of anomaly detection techniques in place of thresholds based techniques. An anomaly is a system behavior that is unusual and significantly different from the previous normal behavior. We have developed an anomaly detection algorithm called Decreased Anomaly Score by Repeated Sequence (DASRS) that analyzes real-time metrics collected from servers in a production data center. DASRS has showed excellent accuracy results, compatible with state-of-the-art algorithms, and reduced processing time and memory consumption. For this reason, DASRS meets the real-time processing requirements of a large volume of data.

Orientador(es)
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
HELIO CORTES VIEIRA LOPES

Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
CASSIO FREITAS PEREIRA DE ALMEIDA

Catalogação
2020-01-17

Apresentação
2019-09-13

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=46523@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=46523@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.46523


Arquivos do conteúdo
NA ÍNTEGRA PDF