Recursos subaproveitados, energia desperdiçada e custos operacionais elevados. O INESC TEC lidera um projeto que quer propor alternativas à forma como os recursos computacionais são organizados e geridos.
Os supercomputadores de hoje prometem impulsionar a ciência e a inteligência artificial como nunca — mas os custos para o planeta são altos: estima-se que os centros de dados, onde grandes volumes de dados são processados, já representem 13% de todo o consumo energético mundial. O projeto europeu DisaggregatedHPC, coordenado pelo INESC TEC, quer mudar isso. A resposta? Um novo modelo de gestão de recursos, mais eficiente, mais flexível e muito mais amigo do ambiente.
O projeto liderado pelo INESC TEC em colaboração com o instituto NARLabs, em Taiwan, propõe uma mudança de paradigma na forma como os recursos computacionais são organizados e geridos. Como? Ricardo Macedo, investigador do INESC TEC, explica: “A gestão atual de recursos em HPC segue um modelo rígido, onde os recursos computacionais, o CPU, GPU, memória, de um ou mais servidores são alocados exclusivamente um utilizador. Embora isto seja excelente para prevenir variabilidade no desempenho, resulta frequentemente em fragmentação e inutilização de recursos devido à heterogeneidade e requisitos das cargas de trabalho, comprometendo a eficiência da infraestrutura como um todo.”
A colaboração multidisciplinar entre o INESC TEC e o NARLabs – um centro especialista em investigação e operação de sistemas HPC – aponta baterias a três objetivos: analisar o uso de recursos em infraestruturas reais – através de dados recolhidos de infraestruturas de supercomputação –, criar uma plataforma de desagregação gerida por software – conciliando práticas de HPC com princípios da computação em nuvem – e desenvolver um protótipo de validação desta arquitetura.
A desagregação de recursos já é uma prática conhecida em ambientes de cloud computing. “Fundamentalmente, em vez de agrupar os recursos computacionais num único servidor, como é feito tradicionalmente, a desagregação permite que estes recursos sejam disponibilizados de forma independente, como serviços partilhados numa infraestrutura comum”, refere o investigador.
Imaginemos um servidor convencional, em que todos os recursos estão juntos: se uma aplicação precisa de mais memória, mesmo que a CPU esteja subutilizada, não é possível alocar memória adicional sem substituir ou adicionar um novo servidor. Com a desagregação, torna-se possível atribuir dinamicamente apenas os recursos necessários a partir deste serviço partilhado.
O que o DisaggregatedHPC propõe é trazer este nível de elasticidade para os sistemas HPC, sem comprometer o desempenho necessário para aplicações científicas de grande escala.
Trazer o modelo de desagregação de recursos, como é praticado na cloud, para o contexto da computação avançada não é um processo direto – implicaria uma reformulação profunda de todo o ecossistema de hardware e software dos supercomputadores atuais, acarretando custos na ordem dos milhões de euros.
“Desta forma, um dos principais objetivos do nosso projeto é atuar como uma solução intermédia: manter a infraestrutura física tal como está (com a organização tradicional dos servidores), mas dotar a camada de software de mecanismos simulem como um sistema desagregado. Assim, conseguimos alocar dinamicamente os recursos, melhorar o desempenho, aumentar a eficiência na utilização da infraestrutura e reduzir o seu consumo energético”, sustenta Ricardo Macedo.
O DisaggregatedHPC: Towards energy-efficient, software-managed resource disaggregation in HPC infrastructures terá duração de cerca de um ano e vai dar contributos com vista a uma supercomputação mais “verde” até março de 2026.
O investigador referido na notícia tem vínculo ao INESC TEC.