查看队列
使用bqueues命令可以查看队列情况
$ bqueues
QUEUE_NAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SUSP e52660tgb! 50 Open:Active - - - - 48 0 48 0e52643tgb! 50 Open:Active - - - - 0 0 0 0e52660ib! 50 Open:Active - - - - 0 0 0 0e52692v2ib! 50 Open:Active - - - - 446 0 446 0e52680v3ib! 50 Open:Active - - - - 96 0 96 0e5v3ib! 50 Open:Active 48 - - - 0 0 0 0e52682v4opa! 50 Open:Active - - - - 285 0 285 0e52680v4ib! 50 Open:Active - - - - 444 0 444 06148v100ib! 50 Open:Active - - - - 0 0 0 0e5645! 50 Open:Active - - - - 0 0 0 0x7542! 50 Open:Active - - - - 0 0 0 0e52640v4! 50 Open:Active - - - - 0 0 0 0e52650v4! 50 Open:Active - - - - 0 0 0 0e52630v4! 50 Open:Active - - - - 0 0 0 0x5650ib 30 Open:Active - - - - 3496 184 2496 0x5650 30 Open:Active - - - - 246 0 246 0e52660tgb 30 Open:Active - - - - 0 0 0 0e52643tgb 30 Open:Active - - - - 64 0 64 0e52660ib 30 Open:Active - - - - 0 0 0 0e52692v2ib 30 Open:Active - - - - 48 0 0 48e52680v3ib 30 Open:Active - - - - 408 0 408 0e5v3ib 30 Open:Active - - - - 1525 0 1465 0e5v3k40ib 30 Open:Active - - - - 0 0 0 0e52682v4opa 30 Open:Active - - - - 132 0 100 32e7v4ib 30 Open:Active - - - - 64 0 64 0e52680v4ib 30 Open:Active - - - - 84 0 0 84e5v4p100ib 30 Open:Active - - - - 0 0 0 06148v100ib 30 Open:Active - - - - 0 0 0 06140ib 30 Open:Active - - - - 936 0 936 0e5645 30 Open:Active - - - - 0 0 0 0x7542 30 Open:Active - - - - 0 0 0 0e52640v4 30 Open:Active - - - - 0 0 0 062v100ib 30 Open:Active - - - - 25 0 25 0e52650v4 30 Open:Active - - - - 24 0 24 0e52630v4 30 Open:Active - - - - 0 0 0 07742 30 Open:Active - - - - 0 0 0 07502 30 Open:Active - - - - 5 5 0 05218 30 Open:Active - - - - 0 0 0 0
使用bqueues -l可以查看每个队列的相信信息
查看节点当前负载信息:lsload
查看节点配置和资源:lshosts
查看所有节点作业状态:bhosts
查看节点GPU配置和拓扑结构:lshosts -gpu
查看节点GPU整体负载:lsload -gpu
查看节点每个GPU负载:lsload -gpuload