Durante cinco dias, a Delft University of Technology (TU Delft) foi o ponto de encontro da comunidade científica internacional dedicada à recuperação de informação, reunindo aproximadamente 500 especialistas para discutir modelos de pesquisa e recomendação, a integração de modelos de linguagem e os desafios associados à avaliação e eficiência desses sistemas. O INESC TEC marcou presença na 48.ª edição da European Conference on Information Retrieval (ECIR 2026) com uma equipa de investigadores para apresentar vários artigos científicos e organizar um workshop.
O INESC TEC é já uma referência pelos seus contributos científicos em várias frentes da Inteligência Artificial (IA) e na ECIR 2026 destacou-se pela apresentação de oito artigos científicos, pela organização de um workshop internacional e pelo envolvimento de Ricardo Campos, investigador do INESC TEC, na coordenação científica da conferência, enquanto Full Paper Chair.
“A participação no ECIR 2026 reforça o posicionamento do INESC TEC numa área científica altamente competitiva e em rápida evolução. Trata-se de uma conferência de referência a nível mundial, a maior a nível europeu, na área da recuperação de informação, onde são discutidos alguns dos avanços mais relevantes neste domínio. A presença do INESC TEC, com múltiplos artigos aceites e envolvimento na organização científica, reflete a consistência e o impacto do trabalho que tem vindo a ser desenvolvido pela nossa equipa esta linha de investigação”, refere o também docente da Universidade da Beira Interior (UBI).
Os artigos científicos apresentados evidenciam a forma como a instituição e os seus parceiros (a Universidade do Porto e a UBI) têm vindo a explorar a interseção entre recuperação de informação e Processamento de Linguagem Natural, com aplicações que vão desde a extração e estruturação de informação de documentos do domínio da administração pública até à deteção de desinformação e à pesquisa multimodal.
Entre os destaques está o projeto CitiLink, uma plataforma que transforma atas de reuniões municipais em informação estruturada e pesquisável, contribuindo para uma maior transparência e participação cívica. Desenvolvido em colaboração com vários municípios portugueses, este projeto deu também origem ao CitiLink-Minutes, um novo conjunto de dados anotado com 120 atas municipais, mais de um milhão de tokens e aproximadamente 45,000 anotações, bem como ao modelo MiNER para extração automática de metadados, identificando primeiro as partes mais importantes e, depois, recolhendo dados específicos como nomes, datas ou locais. Estes contributos constituem uma base relevante para investigação futura em recuperação de informação e processamento de linguagem natural.
Outro contributo relevante foi o ClaimPT, um dataset (conjunto de dados) anotado em português, construído a partir de notícias da agência LUSA, concebido para apoiar o desenvolvimento de sistemas automáticos de verificação de factos. Ao identificar afirmações verificáveis em textos jornalísticos, este recurso contribui para o avanço de ferramentas de combate à desinformação, respondendo à escassez de dados de qualidade, nesta área, para a língua portuguesa.
Na área da pesquisa multimodal, foram apresentados o sistema ImageSeek, um sistema que combina texto e imagem para melhorar resultados de pesquisa, permitindo encontrar imagens a partir de descrições em linguagem natural e o pt-image-ir-dataset, criado para apoiar sistemas como o ImageSeek, colmatando também a escassez de recursos nesta área em português.
“Estes trabalhos demonstram como a investigação em recuperação de informação e processamento de linguagem natural, particularmente em língua portuguesa, pode traduzir-se em ferramentas com impacto direto na sociedade, nomeadamente na organização e acesso à informação, no combate à desinformação e na melhoria dos sistemas de pesquisa, contribuindo não só para o avanço do estado da arte, mas também para a criação de bases sólidas para o desenvolvimento de soluções com impacto real”, acrescenta o investigador.

Para além das apresentações científicas, o INESC TEC esteve também envolvido na organização da 9.ª edição do workshop Text2Story 2026, dedicado à extração e compreensão automática de narrativas. O evento reuniu investigadores internacionais e incluiu sessões científicas, apresentações convidadas e distinções para os melhores trabalhos, contribuindo para dinamizar esta comunidade científica que, ao longo das suas nove edições, já envolveu a participação de mais de 500 investigadores.
“O Text2Story tem vindo a afirmar-se como um espaço de referência para a discussão de abordagens à extração e compreensão automática de narrativas, no contexto do ECIR, reunindo uma comunidade internacional cada vez mais consolidada. A continuidade desta iniciativa ao longo destes nove anos reflete a relevância crescente do tema e a forma como tem acompanhado a evolução da área, incorporando novos desafios e abordagens para a extração, representação e análise de narrativas a partir de texto”, explica Ricardo Campos.
A participação do INESC TEC na ECIR 2026 reflete o crescente reconhecimento internacional da instituição nas áreas da recuperação de informação e da IA, consolidando a sua presença em redes científicas de excelência. A próxima edição do ECIR terá lugar em Southampton entre os dias 21 e 25 de março de 2027.

























Notícias, atualidade, curiosidades e muito mais sobre o INESC TEC e a sua comunidade!