BCC450 - Gerência de Dados na Web - 2018-2

Carga horária da disciplina: 4 horas/aula


Professor(es) em 2018-2

Turma 11 Professor:
Anderson Almeida Ferreira - e-mail

Horários:
Segunda-feira (10h10 - 11h50)
Quarta-feira (10h10 - 11h50)

Objetivos

Discutir dados semiestruturados, envolvendo caracterização, modelagem e linguagens de consulta. Apresentar XML, envolvendo sintaxe, acessórios para gerência de dados, manipulação de dados, linguagens de consulta e compressão de documentos. Estudar problemas relacionados aos processos de extração, coleta, armazenamento e integração de dados disponíveis na Web. Capacitar o aluno a investigar tópicos diversos e avançados da área de gerência de dados na Web.

Ementa

Caracterização dos dados da Web; modelagem de dados semiestruturados; linguagens de consulta; extração de dados da Web; integração de dados da web; aplicações.

Conteúdo Programático

- Dados da Web
        - Características dos dados da Web
        - Web versus bancos de dados
        - Arquitetura das aplicações Web
- Modelagem de dados semi-estruturados e XML
        - Características dos dados semi-estruturados
        - Modelos para representação de dados semi-estruturados
        - XML
        - Representação relacional de dados XML
        - Publicação de dados relacionais através de XML
        - Descoberta de estrutura de dados XML
        - Acessórios para gerência de dados XML
        - Compressão de dados XML
- Linguagens de consulta
        - Linguagens de consulta para a Web
        - Linguagens de consulta para dados semi-estruturados
        - Linguagens de consulta e manipulação de dados XML
- Extração de dados de fontes da Web
        - Caracterização do problema
        - Principais abordagens
        - Ferramentas
        - Avaliação da qualidade das extrações
- Integração de dados da Web
        - Caracterização do problema de integração
        - Abordagens e arquiteturas
        - Fusão de dados
        - Medidas de similaridade
- Tópicos avançados
        - Processamento de consultas em documentos XML
        - Acesso a dados da Web oculta
        - Reconhecimento e extração de entidades
        - Web semântica
        - Web de dados
        - Coleta de páginas da Web
        - Bibliotecas digitais

Bibliografia

- ABITEBOUL, Serge; BUNEMAN, Peter; SUCIU, Dan. Gerenciando dados na WEB. Rio De Janeiro: Campus, 2000.
- GRAVES, Mark. Projeto de banco de dados com XML. São Paulo: Pearson Education, 2003.
- BAEZA-YATES, R; RIBEIRO-NETO, Berthier. Modern information retrieval. New York: Addison Wesley, 2011.
- BREITMAN, Karin Koogan. Web semântica: a internet do futuro. Rio de Janeiro: LTC, 2006.

Bibliografia complementar

- ANTONIOU, G; VAN HARMELEN, Frank. A semantic web primer. Cambridge: MIT Press 2008.
- LIU, Bing. Web data mining: exploring hyperlinks, contents, and usage data . Berlin, New York: Springer, 2007.
- KANTARDZIC, Mehmed. Data mining: concepts, models, methods, and algorithms. Hoboken, NJ: Wiley-Interscience IEEE Press, 2003.
- ELMASRI, Ramez; NAVATHE, Sham. Sistemas de banco de dados. 6. ed. São Paulo: Pearson Addison Wesley, 2011.
- GARCIA-MOLINA, Hector; ULLMAN, Jeffrey D.; WIDOM, Jennifer. Database systems: the complete book . 2. ed. Upper Saddle River: Pearson Prentice Hall, 2009.

Departamento de Computação  |  ICEB  |  Universidade Federal de Ouro Preto
Campus Universitário Morro do Cruzeiro  |  CEP 35400-000  |  Ouro Preto - MG, Brasil
Telefone: +55 31 3559-1692  |  decom@ufop.edu.br