Pesquisa de Informação

INESC TEC Science Bits – Episódio 12

PODCAST INESC TEC Science Bits

 

Oradores convidados:

Sérgio Nunes, Centro de Sistemas de Informação e de Computação Gráfica

Ricardo Campos, Laboratório de Inteligência Artificial e Apoio à Decisão

Palavras-chave: Information Retrieval | Recuperação de Informação | Motores de Busca | Processamento de Linguagem Natural | Sobrecarga de Informação

Fotografia de Sérgio Nunes e Ricardo Campos
Sérgio Nunes e Ricardo Campos

Informação: mais abundante que água?

Todos os dias pesquisamos por informação e a internet providencia. Imagens, publicações em redes sociais, podcasts, vídeos, etc. A lista fica longa e o consumo também. Mas como é que a informação nos chega tão rapidamente – e tão especificamente?

O complexo sistema por detrás de uma pesquisa

Information Retrieval, em português Recuperação de Informação, conhecida pela maioria como simplesmente Pesquisa de Informação, é uma área da Informática que lida com a recolha, o armazenamento e a obtenção de informação (documentos, imagens, vídeos, etc), tendo em vista a resposta a necessidades de informação dos utilizadores. Inicialmente focada na recuperação de documentos em sistemas bibliotecários, assumiu um papel central no início dos anos 90 com o surgimento da web e dos motores de busca. Nos dias de hoje estes sistemas fazem parte da nossa vida quotidiana e a procura de informação tornou-se uma tarefa comum e natural para a maioria das pessoas num mundo cada vez mais digital.

Suponhamos que uma pessoa precisa de comprar uma garrafa metálica amarela. Se em tempos prévios à pandemia, a procura aconteceria maioritariamente em lojas físicas, no presente e no futuro o processo tenderá a ocorrer em espaços cada vez mais digitais. Esta necessidade de informação necessita de ser traduzida numa expressão de pesquisa concreta, a usar por exemplo no Google. Afinal de contas, quer-se uma garrafa e não um garrafão. Quer-se que seja amarela e não laranja. Quer-se que seja em metal e não em plástico (os oceanos agradecem). Portanto, são várias as palavras a incluir na caixa de pesquisa: garrafa, amarela, metal. Isto são palavras-chaves, um conceito central na área da recuperação de informação. Após inserir os dados e clicar no “enter”, o serviço de pesquisa devolve tipicamente inúmeros resultados (se bem que todos sabemos que só olhamos para a primeira página de resultados, quem vai à segunda página é porque provavelmente está desesperado). Os resultados são organizados por ordem de relevância, usando as caraterísticas da informação indexada e tendo por base modelos de recuperação de informação. O objetivo é fazer com que os resultados correspondam da melhor forma ao pedido do utilizador – neste caso, da pessoa que quer comprar uma garrafa metálica amarela.

Fazer pesquisa do processo de pesquisa

Procurar informação é um ato natural a cada um de nós e investigadores procuram entender melhor como é que seres humanos fazem as suas pesquisas. Um ramo que parece tão simples envolve imensos desafios. Por exemplo, pesquisas descontextualizadas podem levar a maus resultados: se pesquisar por um banco, é um banco de jardim ou uma entidade financeira? O mesmo pode acontecer em pesquisas sem foco temporal: se pesquisar pelo jogo do Benfica vs. Porto, os resultados que quer são do jogo de há uns meses ou de há uns anos? De futebol ou de andebol?

Assim sendo, para ultrapassar estes desafios, há vários projetos que mergulham no mundo da pesquisa de informação. Os investigadores Sérgio Nunes e Ricardo Campos têm trabalhado para resolver estes e outros desafios.

PHP Code Snippets Powered By : XYZScripts.com
EnglishPortugal