Skip to main content

海量作业

作业组

为了便于管理海量的作业,可以对作业定义作业组。

作业组的名字是类似于Linux的路径名的树状结构,如作业组 /test ,而 /test/1 和 /test/2 都属于 /test

需要注意的是作业组是全局的,创建者是这个作业组的拥有者,作业组拥有者可以对这个作业组及其子组内的所有作业进行控制(哪怕这个作业是其他人提交的,拥有者也能进行控制)。如果您不想作业被别人控制,请确保提交到的作业组从/开始拥有者都是自己。

创建作业组

  • 显式创建作业组:bgadd /test
  • 使用bsub提交作业时指定一个不存在的作业组,则作业组会被隐式创建:bsub -g /test

查看作业组

  • bjgroup /test 最后一列就是作业组的拥有者,请注意拥有者也是层次继承的。

删除一个作业组

  • bgdel /test
  • 集群已经配置自动清理空的隐式创建的作业组

控制作业组作业

  • 有了作业组以后就可以对一组作业进行控制了
  • 查看指定作业组的作业:bjobs -g /test
  • 终止指定作业组的所有作业:bkill -g /test 0