Mineração de Dados

PGC201
por Marcelo Zanchetta do Nascimento
Publicado: 09/11/2022 - 16:19
Última modificação: 09/11/2022 - 16:19
Carga horária: 90 horas
Créditos: 
5

GRUPO: 
Tópicos Avançados

OBJETIVOS GERAIS DA DISCIPLINA: 
Adquirir uma compreensão abrangente sobre mineração de dados (data mining) e descoberta de conhecimento em bancos de dados. Entender as principais técnicas e temas de pesquisa nesta subárea de bancos de dados. Estar apto a aplicar ferramentas de mineração de dados (data mining) a problemas práticos.

EMENTA DO PROGRAMA: 
O que é Data Mining - Regras de Associação - Padrões Sequenciais – Classificação, Técnicas de Amostragem- Avaliação de Classificadores -  Clusterização -  Avaliação de Clusters– Mineração com Restrições - Web Mining.

DESCRIÇÃO DO PROGRAMA:
1. O que é Data Mining ? Que tipo de dados minerar ? As diversas fases do processo de descoberta de conhecimento em bancos de dados :
a) Pré-processamento - Redução : Agregação, Compressão, Discretização.
b) Mineração
c) Pós-processamento dos padrões minerados.
2. Mineração de Regras de Associação em grandes volumes de dados – Algoritmo Apriori – Técnicas de Otimização – Mineração de Regras com Restrições
    3. Mineração de Sequências -  Algoritmo GSP – Algoritmo PrefixSpan- Análise Comparativa          da metodologia e da performance dos dois algoritmos.
   4. Mineração de Sequências com Restrições - Algoritmos SPIRIT
   5. Classificadores 
       5.1 Tipos de Classificadores - Criterios de Avaliação 
       5.2 Método da  Árvore de Decisão - Algoritmos ID3 – J48
  5.3 Backpropagation - Redes Neurais 
       5.4 Classificadores Bayesianos
       5.5 Método KNN 
       5.6 Previsão – Regressão Linear 
       5.7 Técnicas de Amostragem
       5.8 Avaliação de Classificadores - dados com classes não-balanceadas
              Curvas Roc 
   6. Análise de Clusters 
       6.1 Tipos de Clusters
       6.2 Métodos por Particionamento -  K-means - K-medóides (PAM - CLARA) 
       6.3 Métodos Hierárquicos - CURE, BIRCH
       6.4 Métodos baseados em densidade- DBSCAN
       6.5 Avaliação de Clusteres
 7. Outliers - Detecção de Anomalias
8 . Mineração de Arvores – Web Mining

BIBLIOGRAFIA
Pang-Ning Tan, Michael Steinbach, Vipin Kumar: Introduction to Data Mining. Addison-Wesley, 2006.
J.Han, M. Kamber : Data Mining : Concepts and Techniques. Morgan Kaufmann, 2nd Edition, 2006
I. H. Witten, E. Frank : Data Mining : Practical Machine Learning - Tools and Techniques.  Morgan Kaufmann, 2nd Edition, 2005.
Artigos de pesquisa atual sobre o tema.

Tópicos: