Efficient Dynamic Data Structures for Reachability Queries on Large Temporal Graphs
Publicado: 13/07/2023 - 09:58
Última modificação: 21/07/2023 - 12:44
Linha de Pesquisa: Ciência de Dados
Resumo do trabalho:
Grafos temporais são ferramentas usadas para representar fenômenos que ocorrem ao longo do tempo. Ao incluir o tempo nos estudos sobre grafos, pode-se descrever sistemas como processos que evoluem continuamente e, assim, descobrir novas soluções em problemas relacionados. Existem várias consultas de alto nível que podem nos ajudar na análise de grafos temporais como, por exemplo, a verificação do alcance entre vértices por meio de caminhos temporais e a reconstrução desses caminhos quando possível. Entretanto, tarefas como essas são computacionalmente intensivas e, ademais, nota-se atualmente um aumento substancial do volume de novos dados produzidos. Neste cenário, a hierarquia de memória, incluindo memórias secundárias, deve ser levada em consideração durante o desenvolvimento de aplicações para grafos temporais. Neste trabalho, serão apresentadas estruturas de dados dinâmicas implementadas em memórias primária e secundária que respondem consultas de alcance em grandes grafos temporais. Dentre nossos resultados, destacamos um novo objeto matemático chamado Fecho Transitivo Temporal, uma generalização do Fecho Transitivo comumente estudado em grafos não-temporais. Usando esse novo conceito, propomos três novas estruturas de dados dinâmicas. A primeira estrutura de dados mantém um Fecho Transitivo Temporal em memória primária usando espaço O(n 2 τ ), responde consultas de alcance em tempo O(log τ ) e insere novos contatos em O(n 2 log τ ), onde τ é a quantidade de etiquetas de tempo e n é o número de vértices em um grafo temporal. A segunda estrutura de dados usa uma representação compacta, também em memória primária, que reduz o espaço utilizado pela estrutura em varios cenários e possui desempenho similar na execução das operações. Finalmente, a terceira estrutura de dados persiste os dados em memória secundária usando espaço O(n 2 τ ) e usa algoritmos para responder consultas de alcance e fazer atualizações que acessam, respectivamente, O(1) e O( n 2τ/B) páginas em disco.