Eduardo Nuno Almeida e Luís Vilaça (CTM)

Eduardo Nuno Almeida e Luís Vilaça (CTM)

“Os investigadores Luís Vilaça e Eduardo Almeida demonstraram uma dedicação e espírito de equipa extraordinários durante a profunda atualização da plataforma SLURM do CTM, mantendo a qualidade das suas atividades no âmbito dos seus doutoramentos e dos projetos em que estão envolvidos. Além da complexa atualização e resolução de problemas associados, os investigadores preparam uma nova versão do manual de utilização que está disponível para todos os investigadores do CTM. Esta nomeação é sustentada pelo profissionalismo, qualidade e sentido de missão com que o trabalho foi realizado. O impacto dos resultados na atividade do centro ficou evidente com o aumento dos recursos disponíveis, eficiência”.

– Coordenação do CTM

O Luís e o Eduardo trabalharam na atualização da plataforma SLURM; podiam descrever essa mesma plataforma (qual a principal finalidade, atuais e potenciais aplicações, etc.) e traçar um pouco do ‘percurso’ da mesma, desde a sua conceção até aos dias de hoje?

A plataforma Slurm é a infraestrutura de computação partilhada do CTM. Esta plataforma é composta por um conjunto de GPUs e CPUs que podem ser utilizados para executar tarefas computacionais complexas, tais como processamento multimédia e machine learning. A gestão dos recursos computacionais é feita de forma automática e centralizada, sendo os recursos alocados às tarefas de acordo com a sua disponibilidade e os requisitos das tarefas. Este mecanismo garante uma utilização eficiente dos recursos partilhados, considerando o tempo de espera das tarefas e a equidade no acesso aos recursos.
Esta plataforma nasceu da necessidade crescente dos investigadores do CTM de realizar experiências que requerem poder computacional avançado. Dado o elevado custo destes recursos e o facto da sua utilização por cada investigador ser intermitente, torna-se essencial gerir e distribuir estes recursos de forma eficiente por todo o Centro. A primeira versão do Slurm foi introduzida no CTM em 2022. Desde então, foram introduzidos mais recursos na plataforma e realizadas diversas melhorias na infraestrutura e manuais de utilização, culminando na introdução de uma nova versão do Slurm em dezembro de 2023. Adicionalmente, o sistema de gestão de issues foi refinado, permitindo aos investigadores do CTM reportarem problemas e transmitirem sugestões para a melhoria da plataforma.

Quais foram os principais desafios no decorrer deste processo? De que forma poderá a mesma apoiar o trabalho e as atividades do CTM?

O Slurm é, neste momento, uma plataforma essencial nas atividades de investigação do CTM. Por este motivo, é importante que a manutenção da plataforma seja tão rápida quanto possível, de forma a minimizar o seu impacto nas atividades do centro. Dada a escala e a complexidade desta manutenção, tornou-se necessário planear e preparar antecipadamente todos os passos deste processo, assim como prever possíveis complicações que pudessem, entretanto, ocorrer. Por outro lado, foi necessária coordenação e colaboração com o SAS e o SRC para que todo o processo decorresse com celeridade e eficiência.
Com esta nova versão da plataforma, os investigadores do CTM têm acesso a mais e melhores recursos computacionais, cuja eficiência foi otimizada, bem como a equidade na distribuição dos mesmos a todo o Centro. Por outro lado, a atualização do manual de utilização do Slurm tem contribuído para que os investigadores possam aprender a utilizar a plataforma de forma autónoma.

Do que mais gostam no vosso trabalho?

Para além do nosso trabalho de investigação, enquanto estudantes de doutoramento em telecomunicações e tecnologias de comunicação multimédia, sentimo-nos motivados com a oportunidade de contribuir para o desenvolvimento de soluções para apoio às atividades de investigação do CTM, como é o caso do Slurm. Esta oportunidade tem nos permitido adquirir, consolidar e aplicar competências importantes na área de administração.

Como comentam esta nomeação?

Gostaríamos de agradecer o reconhecimento do nosso trabalho e esforço por parte da Coordenação do CTM. A concretização deste projeto acarreta diversos desafios técnicos, considerando a complexidade da plataforma, os objetivos traçados pela coordenação e os requisitos dos investigadores. Grande parte destes desafios deriva da necessidade de criar uma solução eficaz, escalável e de fácil manutenção – objetivos esses alcançados através do excelente espírito de equipa e partilha de conhecimento. Sentimo-nos realizados com o trabalho desenvolvido, que se tem traduzido no estabelecimento da plataforma Slurm como pilar importante das atividades de investigação do Centro. Gostaríamos, também, de agradecer à coordenação do CTM, particularmente ao Filipe Ribeiro, pelo apoio prestado durante o desenvolvimento deste projeto.

PHP Code Snippets Powered By : XYZScripts.com
EnglishPortugal