Skip to content

jcssilva4/tensorflow_Test_cluster

Repository files navigation

Este repositório testa o funcionamento de GPUs do cluster Apuana.

O primeiro passo é acessar a VPN do CIN. Mesmo fazendo a conexão utilizando a rede interna do CIn, é necessário usar a VPN do CIn. Para maiores informações sobre o uso da VPN do CIn, consultar a documentação disponível na página do HelpDesk para VPN do CIn (https://helpdesk.cin.ufpe.br/redes/vpn). O canal para tirar dúvidas sobre conexão com a VPN é através do HelpDesk ([email protected]). Após se conectar no nó de login (slurm-client1), pode-se executar comandos do slurm:

  • sinfo # verificar status dos nós
  • squeue # verificar fila de jobs
  • srun hostname # envia um job que executa o comando 'hostname' em um nó do cluster

Este repositório contém o script new_test_slurm.sh. Este script treina uma rede neural na GPU através do TensorFlow. Após clonar este repositório no diretório /home, pode-se testar as GPUs através do seguinte comando:

sbatch new_test_slurm.sh

Para verificar o output do job:

cat job_python310_output.txt

Para verificar erros:

cat job_python310_error.txt

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published