Tecnologias de dados ligados: projeto EPISA desenvolve soluções para facilitar pesquisa e acesso a arquivos

Foi o ponto de partida para a investigação sobre dados ligados em arquivos, no contexto português, e visou facilitar o acesso ao património cultural nacional – e à informação, no geral. O projeto EPISA, que reuniu o INESC TEC, a Direção-Geral do Livro, dos Arquivos e das Bibliotecas (DGLAB) e a Universidade de Évora, já terminou, sendo que da colaboração entre estas organizações, resultou um conjunto de protótipos e provas de conceito, que tornam a informação existente nos arquivos mais acessível, quer para os profissionais, quer para o público. 

Partindo do acervo documental do Arquivo Nacional da Torre do Tombo, o projeto EPISA, liderado pelo INESC TEC, teve como objetivo enriquecer a representação e melhorar o acesso a registos de arquivo através da exploração de tecnologias de dados ligados. “O projeto tratou de múltiplas questões de investigação sobre dados ligados em arquivos e os resultados fornecem normas e tecnologias apropriadas para sistemas nesta área. Foram desenvolvidos diversos protótipos e provas de conceito e a incorporação destas inovações e contribuições em sistemas em produção é algo que se torna possível a partir de agora”, avança Carla Teixeira Lopes, investigadora do INESC TEC. 

Entre os resultados mais relevantes do projeto destaca-se a Plataforma EPISA, uma infraestrutura computacional baseada em tecnologias abertas que suporta o armazenamento, manipulação, acesso e interação com dados ligados. “A Plataforma EPISA beneficia diretamente os arquivistas e os utilizadores de arquivos, nomeadamente ao nível da pesquisa e exploração de informação arquivista, com a criação de novas vistas e «caminhos» sobre os registos”, explica a investigadora. Estas novas interfaces, propostas pelo projeto, possibilitam uma interação mais eficiente tanto para especialistas como para utilizadores. Por outro lado, a utilização de tecnologias da web semântica permite incorporar os dados de arquivo na rede global de dados ligados e ligá-los a outras fontes de informação.  

A par da plataforma, a equipa de investigadores criou também um modelo de dados ligados para arquivos – o ArchOnto. “Este modelo tem um impacto direto no trabalho dos arquivistas, permitindo, por um lado, a criação de descrições mais ricas e, por outro lado, facilitando a interligação de registos e conceitos”. Assim, o ArchOnto apresenta-se como uma alternativa às normas atualmente utilizadas para efeitos de descrição, como é o caso da norma geral internacional de descrição arquivística (ISAD(G)) – que segue uma estrutura hierárquica -, ao propor um modelo de dados ligados, que permite não só uma descrição mais fina como também mais interligada com outras descrições. A especificação da ontologia está disponível e já pode ser usada pela comunidade arquivística.  

 

Exemplificação do ArchOnto

 

O projeto EPISA iniciou um trabalho de investigação sobre o uso de dados ligados em arquivos no contexto português e, do ponto de vista científico, esperamos que as múltiplas publicações e datasets produzidos sejam úteis para outros investigadores e para a comunidade dos arquivos”, remata a investigadora.  

O EPISA – Inferência de Entidades e Propriedades para Arquivos Semânticos – foi um projeto de investigação financiado pela Fundação para a Ciência e a Tecnologia no contexto da chamada a projetos em Ciência dos Dados e Inteligência Artificial na Administração Pública. O projeto decorreu em colaboração com a Direção-Geral do Livro, dos Arquivos e das Bibliotecas (DGLAB) e com a Universidade de Évora. 

A investigadora mencionada na notícia tem vínculo ao INESC TEC e à UP-FEUP. 

PHP Code Snippets Powered By : XYZScripts.com
EnglishPortugal