English Portuguese

<- Voltar

ELC1098 - Mineração de Dados

Descrição


--------------------------------------------------------------------------------
Disciplina que trata da descoberta de conhecimento por meio de mineração de dados (data mining). Seleção, pré-processamento, e transformação dos dados são partes do processo e compõem boa parte da disciplina. Em uma segunda parte, usamos algoritmos de machine learning para descoberta de padrões ou anomalias.
Local:
Sala -A definir-, Lab. 334
--------------------------------------------------------------------------------

Objetivo

--------------------------------------------------------------------------------
Apresentar conceitos, técnicas e ferramentas relevantes na área de descoberta de conhecimento em base de dados e mineração de dados, explorando os aspectos associados a esta área.
--------------------------------------------------------------------------------

Ementa


--------------------------------------------------------------------------------
UNIDADE 1 - INTRODUÇÃO E VISÃO GERAL
1.1 – A importância dos dados na informática e na sociedade.
1.2 - Definições, mineração de dados e áreas correlatas.
1.3 – O processo de descoberta de conhecimento e mineração de dados (KDD).
1.4 - Dado, informação e conhecimento.

UNIDADE 2 - KDD
2.1 - Seleção de dados.
2.2 - Pré-Processamento de dados.
2.3 - Transformação de dados.
2.4 - Mineração de Dados.
2.5 - Interpretação e avaliação de resultados.

UNIDADE 3 - TAREFAS EM MINERAÇÃO DE DADOS
3.1 - Mineração via regras de associação.
3.2 - Mineração via classificação.
3.3 - Mineração via análise regressiva.
3.4 - Mineração via agrupamento (clustering).

UNIDADE 4 - PRÁTICA EM MINERAÇÃO DE DADOS

*A Bibliografia está no primeiro PDF da disciplina.
--------------------------------------------------------------------------------

Avaliações e dicas

--------------------------------------------------------------------------------
-> Venham na primeira aula, ela engloba boa parte das dúvidas comuns sobre data-disciplines
-> Presença é fundamental.
-> As aulas voltadas para práticas, precedidas por um resumo da respectiva teoria...
-> Slides são guias para o conteúdo, você deve prestar atenção nas aulas, tomar notas e, idealmente, ler o material complementar.
-> Pontualidade é importante, sem assistir o começo do filme, pode ficar difícil de apreciar e entender o restante.
-> A linguagem de programação e as ferramentas são meios para um fim, mas os exemplos serão dados em R.
-> N1 e N2 são compostas por prova, trabalho e práticas em sala de aula.
-> T1 é inédito e controlado. Isto é, o problema é fictício e o dataset é preparado para testar conceitos vistos em sala de aula.
-> T2 é inédito, realista, e parcialmente controlado... os dados são coletados de problemas reais. Você deve usar quaisquer técnicas e ferramentas a sua disposição.
-> Quase todo o conteúdo está expandido no livro da disciplina.
--------------------------------------------------------------------------------

Joaquim V. C. Assunção. Uma Breve Introdução à Mineração de Dados: Bases Para a Ciência de Dados, com Exemplos em R. 192 páginas. Novatec. 2021. ISBN-10 : 6586057507.
Disponível na Amazon , no site da editora etc.

-> Datasets e demais recursos do livro <-