Computação Distribuída com TORQUE Resource Manager - Parte 2
A intenção deste artigo, é fornecer uma visão geral para submissão e controle de trabalhos na estrutura do PBS/TORQUE.
[ Hits: 15.137 ]
Por: Juno Kim em 21/10/2013 | Blog: http://www.kim.eti.br
Diretiva Interpretador Shell Interpretador PBS # Comentário Comentário #PBS Comentário Diretiva #PBS Comentário ComentárioA tabela a seguir, apresenta um resumo de algumas diretivas comumente usadas no PBS TORQUE. Para mais informações, por favor, consulte o manual TORQUE.
------------------------------------------------------------------------------ Diretiva Exemplo Descrição N #PBS N testjob Nome do JOB usado no PBS TORQUE M #PBS M user@domain Envia um e-mail de notificação m #PBS m e Envia um e-mail quando termina o JOB e #PBS e Cria um arquivo de erro o #PBS o ~/out Redireciona a saída para $HOME/out q #PBS q all.q Especifica a fila exemplo: all.q d #PBS d /home/testuser Determina o diretório de trabalho l #PBS l walltime=00:30:00 resource request, i.e. 30 minutes run time l #PBS l nodes=2:ppn=2 request two CPUs on two nodes each --------------------------------------------------------------------------------
Queue Memory CPU Time Walltime Node Run Que Lm State ------------ ------ -------- -------- ---- --- --- -- ----- default -- -- -- -- 0 0 -- E R special -- -- -- -- 0 0 -- E R --- --- 0 0Em seguida, envie o seu trabalho, por exemplo, diretamente para a fila "special". Após o envio bem-sucedido, PBS TORQUE responde à identificação do trabalho com o JOB ID.
95.masterPara exibir o status do(s) trabalho(s) executado(s), use o comando qstat. Note, enquanto qstat mostra todas as tarefas atualmente submetidas ao cluster.
Job id Name User Time Use S Queue ----------------- ------------- ----------- ---- --- - ----- 95.master testjob.sh testuser 0 R special# qstat -u testuser
testuser: Req'd Elap Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time ------------ -------- -------- ----------- ------ ----- --- ------ ----- - ----- 93.master testuse batch test2.sh 16452 1 -- -- 01:00 C 01:41 95.master testuse special testjob.sh 17564 1 -- -- 01:00 C 00:01
jobname.e#{JOBID} jobname.o#{JOBID}Os arquivos de saída, em resumo, contém a saída de suas aplicações, mas quando existe algum erro, é importante analisar o mesmo.
Computação Distribuída com TORQUE Resource Manager
Configurando o proftpd com autenticação de usuário pelo passwd
Qualidade dos profissionais de TI
SNMP em Linux e Windows para monitoramento no Cacti
Ubuntu + Zoneminder = Solução Livre para CFTV
Criar CD de instalação a partir do HD
Nenhum coment�rio foi encontrado.
Aprenda a Gerenciar Permissões de Arquivos no Linux
Como transformar um áudio em vídeo com efeito de forma de onda (wave form)
Como aprovar Pull Requests em seu repositório Github via linha de comando
Quebra de linha na data e hora no Linux Mint
Organizando seus PDF com o Zotero
tentando instalar em um notebook antigo o Linux LegacyOS_2023... [RESO... (9)
Problema com Conexão Outlook via Firewall (OpenSUSE) com Internet Fibr... (5)