BCC449 - Recuperação de Informação na Web - 2017-1

Carga horária da disciplina: 4 horas/aula


Professor(es) em 2017-1

Turma 11 Professor:
Alvaro Rodrigues Pereira Junior - e-mail

Horários:
Segunda-feira (17h10 - 18h50)
Quarta-feira (17h10 - 18h50)

Objetivos

Estudar o projeto e implementação de técnicas e ferramentas que possibilitem o desenvolvimento de sistemas de recuperação de informação para a Web (também chamados de máquinas de busca na Web). São estudadas técnicas e ferramentas para: coleta de documentos distribuídos, indexação de grandes volumes de dados textuais, manipulação do grafo da Web, e processamento eficiente e eficaz de consultas. Como fortalecimento da teria, são apresentados métodos e arquiteturas utilizados em máquinas de busca reais, como Google.

Ementa

Modelagem de sistemas de recuperação de informação; caracterização da Web; funcionamento de sistemas de coleta; indexação distribuída; linguagens de consulta; operações sobre consultas; geração de funções para ordenação de resultados; avaliação de resultados.

Conteúdo Programático

- Introdução
- Recuperação usando modelo booleano
- Vocabulário de termos e listas invertidas
- Dicionários e recuperação com tolerância
- Construção de índice
- Compressão de índice
- Pontuação, peso de termo e modelo de espaço vetorial
- Computação de pontos em um sistema de busca completo
- Avaliação em recuperação de informação
- Feedback de relevância e expansão de consultas
- Introdução à busca Web
- Coleta na Web e indexação
- Análise de links

Bibliografia

- MANNING, Christopher D; RAGHAVAN, Prabhakar; SCHUTZE, Hinrich. Introduction to Information Retrieval. New York: Cambridge University Press, 2008.
- BAEZA-YATES, Ricardo; RIBEIRO-NETO, Berthier. Recuperação de Informação: Conceitos e Tecnologia das Máquinas de Busca. 2. ed. Porto Alegre: Bookman, 2013.
- LIU, Bing. Web Data Mining:  Exploring Hyperlinks, Contents, and Usage Data. Berlin, New York: Springer, 2007.

Bibliografia complementar

- WITTEN, Ian H; MOFFAT, Alistair; BELL, Timothy C. Managing Gigabytes:  Compressing and Indexing Documents and Images.  2. ed. San Francisco, Calif.: Morgan Kaufmann Publishers, 1999.
- CHAKRABARTI, Soumen. Mining the Web:  Discovering Knowledge From Hypertext Data. San Francisco, CA: Morgan Kaufmann Publishers, 2003.
- HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data Mining: Concepts and Techniques. 3. ed. Burlington, MA: Elsevier, 2012. 
- GOLDSCHMIDT, Ronaldo; PASSOS, Emmanuel Lopes. Data Mining: Um Guia Prático: conceitos, técnicas, ferramentas, orientações e aplicações. Rio de Janeiro: Elsevier, 2005.
- HEAPS, H. S. Information Retrieval, Computational and Theoretical Aspects. New York: San Francisco, London: Academic Press, 1978.

Departamento de Computação  |  ICEB  |  Universidade Federal de Ouro Preto
Campus Universitário Morro do Cruzeiro  |  CEP 35400-000  |  Ouro Preto - MG, Brasil
Telefone: +55 31 3559-1692  |  decom@ufop.edu.br