O artigo “Emotional Machines: Toward Affective Virtual Environments” apresenta um modelo que permite identificar as emoções contidas na fala e mapeá-las para ambientes virtuais imersivos. O artigo foi apresentado na conferência ACM Multimedia, uma das conferências de topo a nível mundial na área de multimédia, que decorreu de 10 a 14 de outubro, em Lisboa.
Esta investigação, desenvolvida por Jorge Forero e Gilberto Bernardes, ambos investigadores do Centro de Telecomunicações e Multimédia (CTM) do INESC TEC, partiu da necessidade de compreender melhor a natureza emocional do discurso e de como este se relaciona com a perceção do ambiente. Além disso, o estudo propõe um modelo de reconhecimento das emoções, que considera tanto as componentes semânticas como acústicas da fala, e define uma estratégia que permite mapear as emoções previstas em espaços virtuais.
“Esta proposta permite desambiguar a componente emocional da fala, através da combinação de dois modelos de aprendizagem por computador. Em concreto, existe um modelo que considera a componente semântica para captar o que é dito e outro modelo que tem em conta a parte acústica para compreender como é dito”, explica Jorge Forero.
Os resultados obtidos desta investigação podem ser aplicados nos assistentes virtuais, que beneficiam de poder prever melhor as emoções contidas no discurso, de forma a melhorar as interações, ou aos teleoperadores, que podem telecomandar os seus óculos de realidade virtual através de comandos de voz.
A ACM Multimedia é classificada como A*, de acordo com o core ranking australiano que fornece avaliações das principais conferências nas áreas da computação, e é um evento chave para exibir estudos científicos e produtos industriais inovadores na área de multimédia.
Os investigadores do INESC TEC mencionados na notícia têm vínculo ao INESC TEC, FCT UP-FEUP.