Identificação de Ameaças em Fóruns da Dark Web e Surface Web: Um Estudo sobre a Evolução Temporal das Discussões e Generalização de Modelos
Publicado: 12/01/2026 - 10:17
Última modificação: 12/01/2026 - 14:36
Linha de pesquisa: Sistemas de Computação
Resumo: Diante da crescente estruturação do cibercrime e do aumento de ameaças articuladas em ambientes anônimos, a Inteligência de Ameaças Cibernéticas (Cyber Threat Intelligence
(CTI)) torna-se essencial para uma defesa proativa. Esta dissertação propõe dois estudos de caso com o intuito de avaliar aplicações práticas de CTI por meio da integração
de técnicas de mineração de dados em fóruns da Surface Web e Dark Web. O primeiro estudo consiste em investigar a evolução temporal das discussões entre 2015 e
2024 utilizando modelagem de tópicos Latent Dirichlet Allocation (LDA), identificando padrões sazonais e uma transição temática de debates técnicos para práticas criminosas,
como a comercialização de dados pessoais em língua portuguesa. O segundo estudo consiste em avaliar a eficácia da transferência de aprendizado para superar a escassez de
dados rotulados no domínio da segurança. Para isso, foi utilizado um modelo baseado no algoritmo LightGBM com representação TF-IDF, desenvolvido previamente por um
integrante do mesmo projeto de pesquisa, sendo este aplicado em domínios distintos e ambientes multilíngues, português e inglês. Os resultados demonstram que o modelo utilizado
possui capacidade de generalização ao isolar vocabulários de risco em novas fontes, como mercados da Dark Web e fóruns de discussão genéricos, embora apresente alta sensibilidade
a termos técnicos. Este estudo contribui para o desenvolvimento de modelos de CTI com alta eficiência e adaptabilidade em fontes de dados heterogêneas, auxiliando na antecipação de incidentes mesmo diante da escassez de dados rotulados.
Link para a defesa: https://teams.microsoft.com/l/meetup-join/19%3ameeting_ZjMzMDFlOWItOTM2N...