INESC TEC utiliza dados estatísticos e psicolinguísticos para detetar fake news

No início de maio, a Comissão Europeia registou, diariamente, mais de 2.700 artigos com fake news relacionadas com a covid-19 nas redes sociais, entre publicações falsas ou enganosas. A desinformação foi mesmo considerada a “doença do século” por responsáveis daquele organismo europeu.

É com o objetivo de ajudar o utilizador comum, e sobretudo os jornalistas, a analisar e identificar informação com elevada probabilidade de ser falsa, e também a filtrar o conteúdo mais relevante nas redes sociais, que o Centro de Sistemas de Computação Avançada (CRACS) do INESC TEC está a desenvolver o projeto “Detecting Fake News Automatically”.

“O sistema extrai várias informações do post, que considera relevantes. Os indicadores (mais de 100) podem ser psicolinguísticos (por exemplo tentar associar qual a emoção mais predominante no texto), ou estatísticos sobre o texto (por exemplo a frequência de verbos, adjetivos ou entidades) e vão ser posteriormente passados para um modelo de aprendizagem automática, que aprendeu a fazer a distinção com casos previamente conhecidos e que já tinham sido referenciados como fake news no passado. Com base nessa aprendizagem, o modelo classificará com uma certa probabilidade o novo post como sendo ou não fake news, explica Álvaro Figueira, investigador INESC TEC e professor no Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP).

Recorrendo a técnicas de data mining, aprendizagem automática, processamento em linguagem natural, reconhecimento de entidades mencionadas, análise de sentimento, entre outras, os investigadores esperam que a solução desenvolvida ofereça um maior grau de segurança e garantia de veracidade sobre o conteúdo que se lê nas redes sociais.

“Pretendemos que o sistema utilize a mensagem escrita do post e toda a informação associada a esta, ou seja, os likes, partilhas, comentários, bem como a informação sobre o utilizador que publicou o post. A nossa convicção é que esta informação adicional, associada à mensagem propriamente veiculada, contribua para gerar uma confiança superior na classificação dada pelo sistema”, acrescenta do investigador.

No início de maio, a Comissão Europeia registou, diariamente, mais de 2.700 artigos com fake news relacionadas com a covid-19 nas redes sociais

Detetar as fake news no contexto da covid-19

Este projeto surgiu como output do projeto REMINDS, no qual se pretendeu construir um sistema capaz de detetar automaticamente quais os posts das redes sociais (Facebook e Twitter) mais relevantes para o público em geral, de acordo com critérios jornalísticos, após as eleições norte-americanas de 2016, numa altura em que o problema das fake news ganhou uma maior dimensão e em que empresas tecnológicas e a comunidade científica começaram a trabalhar numa solução. No contexto pandémico atual, há variáveis que mudam e é necessário adaptar o sistema a novos desafios.

“Um dos principais desafios que o projeto enfrenta é a mudança de domínio e contexto temporal em que uma fake news pode surgir. Por exemplo, uma fake news num contexto político tem algumas propriedades textuais e lexicais diferentes de uma fake news num contexto da saúde.  Portanto, tentar desenvolver um sistema que seja capaz de capturar este tipo de diversidade tem sido uma tarefa desafiante. A pandemia por covid-19, tendo um domínio e contexto específicos, tem sido um caso de estudo muito interessante no universo das fake news. É a nossa opinião que o sistema será capaz de adaptar-se e detetar fake news em qualquer domínio, contribuindo para mitigação deste tipo de conteúdos nas redes sociais”, conclui Álvaro Figueira.

No âmbito deste projeto está ainda a ser desenvolvida pelo investigador do INESC TEC, Nuno Guimarães, a tese de doutoramento com o título “Analyzing and Developing Veracity Indicators for Building an Automatic Detector of Fake News Online”. A tese, desenvolvida na FCUP, é supervisionada pelos investigadores do INESC TEC Álvaro Figueira e Luís Torgo.

Os investigadores do INESC TEC mencionados na notícia têm vínculo à UP-FCUP e INESC TEC.

 

 

PHP Code Snippets Powered By : XYZScripts.com
EnglishPortugal