

<- Voltar
ELC1098 - Mineração de Dados
Descrição
-------------------------------------------------------------------------------- Disciplina que trata da descoberta de conhecimento por meio de mineração de dados (data mining). Seleção, pré-processamento, e transformação dos dados são partes do processo e compõem boa parte da disciplina. Em uma segunda parte, usamos algoritmos de machine learning para descoberta de padrões ou anomalias.Local: Sala -A definir-, Lab. 334 --------------------------------------------------------------------------------
Objetivo
-------------------------------------------------------------------------------- Apresentar conceitos, técnicas e ferramentas relevantes na área de descoberta de conhecimento em base de dados e mineração de dados, explorando os aspectos associados a esta área.--------------------------------------------------------------------------------
Ementa
-------------------------------------------------------------------------------- UNIDADE 1 - INTRODUÇÃO E VISÃO GERAL 1.1 – A importância dos dados na informática e na sociedade. 1.2 - Definições, mineração de dados e áreas correlatas. 1.3 – O processo de descoberta de conhecimento e mineração de dados (KDD). 1.4 - Dado, informação e conhecimento. UNIDADE 2 - KDD 2.1 - Seleção de dados. 2.2 - Pré-Processamento de dados. 2.3 - Transformação de dados. 2.4 - Mineração de Dados. 2.5 - Interpretação e avaliação de resultados. UNIDADE 3 - TAREFAS EM MINERAÇÃO DE DADOS 3.1 - Mineração via regras de associação. 3.2 - Mineração via classificação. 3.3 - Mineração via análise regressiva. 3.4 - Mineração via agrupamento (clustering). UNIDADE 4 - PRÁTICA EM MINERAÇÃO DE DADOS *A Bibliografia está no primeiro PDF da disciplina. --------------------------------------------------------------------------------Avaliações e dicas
-------------------------------------------------------------------------------- -> Venham na primeira aula, ela engloba boa parte das dúvidas comuns sobre data-disciplines -> Presença é fundamental. -> As aulas voltadas para práticas, precedidas por um resumo da respectiva teoria... -> Slides são guias para o conteúdo, você deve prestar atenção nas aulas, tomar notas e, idealmente, ler o material complementar. -> Pontualidade é importante, sem assistir o começo do filme, pode ficar difícil de apreciar e entender o restante. -> A linguagem de programação e as ferramentas são meios para um fim, mas os exemplos serão dados em R. -> N1 e N2 são compostas por prova, trabalho e práticas em sala de aula. -> T1 é inédito e controlado. Isto é, o problema é fictício e o dataset é preparado para testar conceitos vistos em sala de aula. -> T2 é inédito, realista, e parcialmente controlado... os dados são coletados de problemas reais. Você deve usar quaisquer técnicas e ferramentas a sua disposição. -> Quase todo o conteúdo está expandido no livro da disciplina. --------------------------------------------------------------------------------