BCC449 - Recuperação de Informação na Web - 2017-1Carga horária da disciplina: 4 horas/aula Professor(es) em 2017-1
ObjetivosEstudar o projeto e implementação de técnicas e ferramentas que possibilitem o desenvolvimento de sistemas de recuperação de informação para a Web (também chamados de máquinas de busca na Web). São estudadas técnicas e ferramentas para: coleta de documentos distribuídos, indexação de grandes volumes de dados textuais, manipulação do grafo da Web, e processamento eficiente e eficaz de consultas. Como fortalecimento da teria, são apresentados métodos e arquiteturas utilizados em máquinas de busca reais, como Google.EmentaModelagem de sistemas de recuperação de informação; caracterização da Web; funcionamento de sistemas de coleta; indexação distribuída; linguagens de consulta; operações sobre consultas; geração de funções para ordenação de resultados; avaliação de resultados.Conteúdo Programático- Introdução- Recuperação usando modelo booleano - Vocabulário de termos e listas invertidas - Dicionários e recuperação com tolerância - Construção de índice - Compressão de índice - Pontuação, peso de termo e modelo de espaço vetorial - Computação de pontos em um sistema de busca completo - Avaliação em recuperação de informação - Feedback de relevância e expansão de consultas - Introdução à busca Web - Coleta na Web e indexação - Análise de links Bibliografia- MANNING, Christopher D; RAGHAVAN, Prabhakar; SCHUTZE, Hinrich. Introduction to Information Retrieval. New York: Cambridge University Press, 2008.- BAEZA-YATES, Ricardo; RIBEIRO-NETO, Berthier. Recuperação de Informação: Conceitos e Tecnologia das Máquinas de Busca. 2. ed. Porto Alegre: Bookman, 2013. - LIU, Bing. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Berlin, New York: Springer, 2007. Bibliografia complementar- WITTEN, Ian H; MOFFAT, Alistair; BELL, Timothy C. Managing Gigabytes: Compressing and Indexing Documents and Images. 2. ed. San Francisco, Calif.: Morgan Kaufmann Publishers, 1999.- CHAKRABARTI, Soumen. Mining the Web: Discovering Knowledge From Hypertext Data. San Francisco, CA: Morgan Kaufmann Publishers, 2003. - HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data Mining: Concepts and Techniques. 3. ed. Burlington, MA: Elsevier, 2012. - GOLDSCHMIDT, Ronaldo; PASSOS, Emmanuel Lopes. Data Mining: Um Guia Prático: conceitos, técnicas, ferramentas, orientações e aplicações. Rio de Janeiro: Elsevier, 2005. - HEAPS, H. S. Information Retrieval, Computational and Theoretical Aspects. New York: San Francisco, London: Academic Press, 1978. |
Departamento de Computação | ICEB | Universidade Federal de Ouro Preto
Campus Universitário Morro do Cruzeiro | CEP 35400-000 | Ouro Preto - MG, Brasil
Telefone: +55 31 3559-1692 | decom@ufop.edu.br