Minicurso 3 (MC-3)


Aprendizado de Máquina em Plataformas de Processamento Distribuído de Fluxo: Análise e Detecção de Ameaças em Tempo Real

Horário: 09/05/2018 (Quarta-feira) – 8:30 às 12:00

Autores: Martin Andreoni Lopez (UFRJ), Antonio Gonzalez Pastana Lobato (UFRJ), Igor Jochem Sanz (UFRJ), Diogo Menezes Ferrazani Mattos (UFRJ) e Otto Carlos Muniz Bandeira Duarte (UFRJ)

Apresentador: Otto Carlos Muniz Bandeira Duarte

Resumo: O objetivo deste minicurso é apresentar técnicas de processamento distribuído de fluxos em tempo real para detectar ameaças de segurança nas redes de computadores. Este minicurso foca em uma tecnologia que vem sendo recentemente desenvolvida para detectar e reagir prontamente às ameaças de segurança através da análise em tempo real de grandes massas de dados (big data) baseada em aprendizado de máquina. Com esta técnica espera-se reduzir os tempos de detecção de ameaças de meses ou semanas para minutos ou segundos, mitigando assim os riscos e os prejuízos causados por ataques de segurança. O minicurso aborda as plataformas de processamento distribuído de fluxos e código aberto Apache Storm, Apache Spark e Apache Flink e apresenta suas principais diferenças e uma comparação entre as plataformas. Os principais algoritmos de aprendizado de máquina são apresentados mostrando as arquiteturas para processamento em tempo diferenciado e para tempo real com treinamento desligado (off line) e em linha (on line). São apresentadas as principais técnicas de seleção de caraterísticas e são descritas as principais ameaças de segurança. São mostrados os seguintes conjuntos de dados de tráfego que são usados para a análise: DARPA, KDD, um sintético elaborado no laboratório e um de uma grande operadora de Internet em banda larga do Rio de Janeiro. O minicurso conta com uma parte prática de análise de conjuntos de dados para a detecção em tempo real de ameaças usando a plataforma Apache Spark. Por fim, o minicurso analisa e discute os desafios em aberto com o objetivo de motivar os participantes a fazer pesquisas na área de segurança e de processamento de fluxos. Espera-se que, ao final do minicurso, os participantes sejam capazes i) de compreender diferentes tipos de ameaças de segurança e os avaliar os prejuízos que estas ameaças podem provocar, ii) de utilizar de forma crítica as ferramentas de processamento distribuído de fluxos e analisar os resultados e riscos das ameaças em grandes massas de dados e iii) de obter novas habilidades em segurança da informação, fomentando assim uma pesquisa de alto nível.