SQLSIM: consultas analíticas por similaridade em SGBD Relacionais
Publicado: 13/02/2025 - 11:57
Última modificação: 13/02/2025 - 11:57
Linha de pesquisa: Ciência de Dados
Resumo: Com o crescimento exponencial de dados multidimensionais, torna-se essencial o desenvolvimento de abordagens eficientes para consultas analíticas por similaridade. No entanto, os Sistemas Gerenciadores de Banco de Dados Relacionais (SGBDR) tradicionalmente não oferecem suporte nativo para esse tipo de consulta, tornando necessário o uso de soluções externas que podem impactar a eficiência e a escalabilidade. Neste trabalho, propomos o SQLSIM, uma estratégia para execução de consultas por similaridade diretamente em SGBDRs, eliminando a necessidade de processamento externo e reduzindo o impedance mismatch. A abordagem utiliza funções definidas pelo usuário (UDFs) na linguagem procedural SQL para implementar operações de agrupamento por similaridade em múltiplas dimensões. Além disso, exploramos técnicas para otimizar a execução dessas consultas, aproveitando estruturas de indexação e operadores avançados. A solução foi implementada no PostgreSQL e avaliada por meio de experimentos que demonstraram sua flexibilidade no processamento de grandes volumes de dados. Os resultados indicam que o SQLSIM permite a realização de análises multidimensionais complexas de forma integrada, preservando a compatibilidade com a linguagem SQL padrão.
Link para a defesa: https://teams.microsoft.com/l/meetup-join/19%3ameeting_NmUyZDBiNGEtYjRjZ...