AMD EPYC Rome VASP 测试
周健 2019.11.18
测试算例
Ruddlesden-Popper 钛酸锶 Sr4Ti3O10,305个原子。
输入文件
SYSTEM = STO
PREC=A
ENCUT=520
EDIFF=1E-6
ADDGRID=.T.
ISMEAR= 1
SIGMA=0.2
LWAVE=.F.
LCHARG=.F.
NELMIN=4
NELM=100
LREAL=Auto
K-Points
0
Gamma
2 2 1
0 0 0
eScience中心测试,软件版本:VASP5.4.4 Intel 2018,CUDA 10.1.243
队列信息 | CPU 核数 | Elapsed time (s) | scf次数 | E0 in OSZICAR |
---|---|---|---|---|
e5v3ib队列,2*Intel Xeon E5-2680 v3 (12 Cores 2.50 GHz) 256 G RAM | 24 | 6676 | 23 | -.23554005E+04 |
e52682v4opa队列, 2*Intel Xeon E5-2682 v4 (16 Cores, 2.50 GHz) | 32 | 5967 | 23 | -.23554005E+04 |
6140ib队列, 4*Intel Xeon Gold 6140 (18 Cores, 2.30 GHz) 384 G RAM | 72 | 2080 | 23 | -.23554005E+04 |
6140ib队列, 4*Intel Xeon Gold 6140 (18 Cores, 2.30 GHz) 384 G RAM | 36 | 2456 | 23 | -.23554005E+04 |
6140ib队列, 4*Intel Xeon Gold 6140 (18 Cores, 2.30 GHz) 384 G RAM | 18 | 5005 | 23 | -.23554005E+04 |
7702队列, 2*AMD EPYC 7702 (64 Cores, 256MB Cache, 2.0 GHz) 256 G RAM | 32 | 5034 | 23 | -.23554005E+04 |
7702队列, 2*AMD EPYC 7702 (64 Cores, 256MB Cache, 2.0 GHz) 256 G RAM | 64 | 3663 | 22 | -.23554005E+04 |
7702队列, 2*AMD EPYC 7702 (64 Cores, 256MB Cache, 2.0 GHz) 256 G RAM | 128 | 4401 | 23 | -.23554005E+04 |
7502队列, 2*AMD EPYC 7502 (32 Cores, 128MB Cache, 2.5 GHz) 256 G RAM | 32 | 5290 | 23 | -.23554005E+04 |
7502队列, 2*AMD EPYC 7502 (32 Cores, 128MB Cache, 2.5 GHz) 256 G RAM | 64 | 4176 | 22 | -.23554005E+04 |
62v100ib队列,2*Intel Xeon Gold 6248 (20 Cores, 27.5MB Cache, 2.50 GHz) 768 GB RAM,8*NVIDIA Tesla V100 SXM2 32GB (5120 CUDA Cores 1290MHz, 32GB HBM2 876MHz 4096-bit 900 GB/s, NVLink, PCI-E 3.0 x16) | 1CPU 1GPU | 3053 | 23 | -.23554005E+04 |
校计算中心测试,软件版本:VASP 5.4.4 Intel 2017,CUDA 10.1.168
队列信息 | CPU/GPU | Elapsed time (s) | scf次数 | E0 in OSZICAR |
---|---|---|---|---|
fat_384队列,4*Intel Xeon Gold 6248 (20 Cores, 2.50 GHz) 384 G RAM | 20 | 5326.949 | 23 | -.23554005E+04 |
fat_384队列,4*Intel Xeon Gold 6248 (20 Cores, 2.50 GHz) 384 G RAM | 40 | 3105.863 | 23 | -.23554005E+04 |
fat_384队列,4*Intel Xeon Gold 6248 (20 Cores, 2.50 GHz) 384 G RAM | 80 | 2896.237 | 21 | -.23554005E+04 |
gpu_v100队列,8 X TESLA V100 NVLink GPU,2 X CPU intel Xeon Gold 6248, 20核,2.5GHz, 768GB 内存 | 1/1 | 3202.687 | 23 | -.23554005E+04 |
gpu_v100队列,8 X TESLA V100 NVLink GPU,2 X CPU intel Xeon Gold 6248, 20核,2.5GHz, 768GB 内存 | 2/2 | 2244.153 | 23 | -.23554005E+04 |
gpu_v100队列,8 X TESLA V100 NVLink GPU,2 X CPU intel Xeon Gold 6248, 20核,2.5GHz, 768GB 内存 | 4/4 | 1379.651 | 23 | -.23554005E+04 |
gpu_v100队列,8 X TESLA V100 NVLink GPU,2 X CPU intel Xeon Gold 6248, 20核,2.5GHz, 768GB 内存 | 8/8 | 1214.461 | 23 | -.23554005E+04 |
结论
- AMD EPYC Rome 比 Intel V3/V4 快一些,但比 Intel Gold 系列慢许多
- 核心太多对于VASP并不有利