控制作业
常用控制命令
| 命令 | 功能 | 
|---|---|
| bjobs | 查看自己未结束的作业 | 
| bjobs -l JOBID | 查看某个未结束作业的详情 | 
| bhist | 查看自己已结束的历史作业 | 
| bhist -l JOBID | 查看某个已结束历史作业的详情 | 
| bpeek JOBID | 查看正在运行某个作业的stdout/stderr | 
| bkill JOBID | 终止某个作业 | 
| btop JOBID | 设置作业最先运行 | 
| bbot JOBID | 设置作业最后运行 | 
作业等待
bwait -w "wait_condition" [-t timeout]
暂停并等待作业条件满足,不满足一直暂停等待,满足则执行完毕返回。
典型用法:在脚本中不要循环使用bjobs判断作业状态,而用bwait等待作业运行完成,这样更优雅且能显著降低对集群的压力。
- 
-w wait_condition:要满足的等待条件,此表达式与上述bsub -w选项的格式相同。
- 
-t timeout:等待条件的超时,范围为1-525600分钟,默认为一年。
