Investigadores do INESC TEC estão a criar rostos de pessoas que não existem (os denominados “dados sintéticos”). Estes rostos criados por computadores parecem reais, mas não pertencem a ninguém, mitigando desta forma vários dos problemas relacionados com privacidade e consentimento na sua recolha. O trabalho pioneiro foi publicado na prestigiada conferência Computer Vision and Pattern Recognition (CVPR) 2024 e marca um avanço significativo no campo da tecnologia de reconhecimento facial.
O problema com os rostos reais
Numa era de crescente integração tecnológica, o reconhecimento facial surge como uma ferramenta transformadora, com aplicações que abrangem a segurança, o retalho, os cuidados de saúde e as redes sociais. No entanto, à medida que a sua adoção se expande, as considerações éticas em torno da privacidade e da segurança dos dados tornam-se fundamentais. Além disso, outros desafios como o enviesamento demográfico, as preocupações com a adaptabilidade a condições variáveis, como o envelhecimento e as disparidades de iluminação, continuam a afetar a tecnologia.
Os rostos sintéticos e o futuro do reconhecimento facial
Para resolver estes problemas, os investigadores do INESC TEC, que se destacaram como coautores de um artigo da 2ª edição do Facial Recognition Challenge in the Era of Synthetic Data (FRCSyn), na CVPR 2024, estão a gerar dados sintéticos.
Apesar de promissores, os sistemas treinados apenas com dados sintéticos continuam a ficar atrás dos sistemas treinados apenas com dados reais. Em resposta, a 2ª edição do Desafio FRCSyn teve como objetivo explorar os limites da tecnologia de reconhecimento facial treinada com dados sintéticos, permitindo aos participantes utilizar novos métodos de síntese facial. A competição permitiu a submissão de modelos treinados em datasets com aproximadamente 500 mil imagens sintéticas, ou com um número ilimitado de imagens.
A equipa constituída pelos investigadores INESC TEC Pedro Carneiro Neto, Jaime Santos Cardoso e Ana Filipa Sequeira, em conjunto com investigadores Fraunhofer IGD, alcançou as melhores classificações em duas categorias: redução de enviesamento utilizando dados sintéticos sem restrições e utilização de dados sintéticos e reais com restrições. “A solução proposta incidiu principalmente na mitigação de viés demográfico (etnia e género)”, explica Pedro Carneiro Neto, “na qual propusemos uma nova perspetiva na forma como consideramos etnias no balanceamento de um dataset, descartando a abordagem anterior de categorização étnica”. Isto permitiu que “o modelo treinasse com imagens que fossem verdadeiramente úteis no aumento da performance de cada etnia”, conclui o investigador.
Os resultados alcançados no desafio permitirão analisar em pormenor as melhorias conseguidas com a utilização de dados sintéticos e o desempenho de ponta da atual tecnologia de reconhecimento facial em cenários operacionais realistas, extraindo contribuições muito valiosas para o avanço neste domínio.
Os investigadores mencionados na notícia têm vínculo ao INESC TEC e à UP-FEUP.