Skip to main content

控制作业

常用作业控制命令

bjobs			#查看自己已提交或正在运行但尚未结束的作业

bjob -l JOBID	#查看某个已提交或正在运行作业的的详细信息

bhist			#查看已完成历史作业

bhist -l JOBID	#查看已完成历史作业的详细信息

bpeek JOBID		#查看正在运行作业的标准输出

bkill JOBID		#终止作业

#仅能对自己的作业进行排序
btop JOBID		#设置作业最先运行
bbot JOBID		#设置作业最后运行

作业依赖

一个计算任务可能分成几步,而每一步对资源的需求不同,因此需要分开提交,但这些作业之间又具有依赖关系,bsub 可使用参数可使用选项 -w 'dependency_expression'指定依赖关系。如果计算任务分成几步,但是每步对资源需求一样,那么请写在一个作业任务中依次执行。

    -w 'done(job_ID | "job_name")':需要job_ID或job_name作业完成且状态为DONE,需要 job_ID 或 job_name 作业完成且状态为 DONE,即退出码为0 -w 'ended(job_ID | "job_name")':需要job_ID或job_name作业完成或退出,状态为EXIT或DONE需要 job_ID 或 job_name 作业完成或退出,状态为 EXIT 或 DONE 支持逻辑表达式&& (AND)、|| (OR)、! (NOT) 孤儿作业(即依赖条件不可能满足的)1分钟后会被自动终止

    查看节点当前负载信息:lsload

    查看节点配置和资源:lshosts

    查看所有节点作业状态:bhosts