Uma abordagem não supervisionada que sumariza e ordena as principais alterações verificadas em duas versões de um mesmo documento – este é o trabalho de investigação que valeu a Ricardo Campos, investigador do INESC TEC, a Adam Jatowt e a Lukas Éder, investigadores da Universidade de Innsbruck, na Áustria, o Best Demo Paper Award na CIKM’23 – ACM International Conference on Information and Knowledge Management.
“Documentos com diferentes versões são comuns em diversas situações e desempenham um papel importante ao permitirem uma visão geral das revisões feitas num determinado documento ou num conjunto de documentos”, explica Ricardo Campos, investigador do INESC TEC. Porém, quanto maior for o documento, mais difícil se torna não só resumir, como compreender as alterações feitas nos documentos com várias versões. Foi, neste contexto, que surgiu a possibilidade de desenvolver uma ferramenta de comparação e resumo, que fosse fácil de usar.
Desta forma, a equipa de investigadores desenvolveu um protótipo que permite aos utilizadores sumarizar diferenças em duas versões do mesmo documento, a partir da extração de palavras-chave. O resultado do trabalho de investigação e desenvolvimento, descrito no artigo “Contrastive Keyword Extraction from Versioned Documents“, permite “entender de forma mais profunda as mudanças ocorridas em diferentes tipos de documentos”.
“O trabalho resulta de uma colaboração com dois investigadores – Adam Jatowt e Lukas Éder – da Universidade de Innsbruck e apresenta uma abordagem não supervisionada que sumariza e ordena as principais alterações verificadas em duas versões de um mesmo documento”, refere Ricardo Campos, acrescentando que a solução já se encontra disponível para utilização. “Existe também um package python disponível online”, conclui o investigador.
O artigo científico foi reconhecido com o Best Demo Paper Award (runner-up) na 32nd ACM International Conference on Information and Knowledge Management – uma conferência Rank A da área de Inteligência Artificial e Ciência de Dados, que decorreu no final de outubro, na Universidade de Birmingham
O prémio visa distinguir os melhores artigos científicos, que se foquem na demonstração de aplicações e software e que envolvam ideais científicas inovadoras. Em 2023, foram submetidos 2435 artigos científicos (74 dos quais na demo track) e aceites 629 para apresentação (26 na demo track) resultando numa taxa média de aceitação de 27% nos cinco tracks da conferência. Os proceedings da conferência são publicados pela Association for Computing Machinery (ACM).
O investigador mencionado na notícia tem vínculo ao INESC TEC, à Universidade da Beira Interior e ao Ci2 (Centro de Investigação em Cidades Inteligentes do Instituto Politécnico de Tomar)