Skip to main content

常见问题

网络

登录节点进行网络接入认证

集群中的登录节点进行网络接入认证后即可访问互联网,认证后登录节点所有用户均可访问互联网,请注意网络安全!。

命令行登录和登出p.nju.edu.cn的方法如下

/fs00/software/bin/pnju -u <username> -p <password> -i		#登录网络
/fs00/software/bin/pnju -o									#登出网络

curl -s "http://p.nju.edu.cn/portal_io/login?username=<username>&password=<password>"	#登录网络
curl -s http://p.nju.edu.cn/portal_io/logout											#登出网络

计算节点访问网络

所有计算节点均不能自由无限制的访问外网(含校园网和互联网),如需访问可以单独申请开放。当前已经放开的网络访问:

  • e-Science中心的所有服务:box/table/mirror/repo/git/test/s3/scc…….nju.edu.cn
  • QQ Mail:imap/pop/smtp.qq.com imap/pop/smtp.exmail.qq.com
  • huggingface.co
  • ls13.rlmcloud.com (RLM Cloud - hosted license servers for RLM.)
  • materialsproject.org

no matching host key type found. Their offer: ssh-rsa,ssh-dss

SSH/SFTP登录时报错no matching host key type found. Their offer: ssh-rsa,ssh-dss,添加

安装

pip安装包到自己的目录下

Python的大多数包不需要root权限也能安装,只需在pip install后加-t指定安装目录即可,如:

cd scikit-opt-master
pip install -t $HOME .

这样就装到自己的家目录下。在~/.bashrc里或者作业脚本中加上环境变量

export PYTHONPATH=$HOME:$PYTHONPATH

作业

作业运行时实际占用CPU核数过多

在作业中限定使用的CPU核数与申请核数相同,或者尝试在提交作业时添加如下参数

#BSUB -R affinity[core:cpubind=core:membind=localprefer:distribute=pack]

特别是Python,有些Python包会自动满核并行的,需要使用环境变量(如 OMP_NUM_THREADS)等方式设定线程数。如果实在不行可以 #BSUB -x 独占节点运行作业。

排队作业数上限

动态限制用户排队作业数不能超过MAX(1000,MIN((30000-总作业数)/10,(20000-总排队作业数)/6))

即用户排队作业数,不超过三万减去总作业数的十分之一,也不超过二万减去总排队作业数的六分之一,但保底一千个。