今度は SandyBridge-EP 搭載の計算サーバで OpenBLAS と Intel MKL の性能を比較してみた。一部の問題(BLAS 性能依存の問題)ではかなりの差が付いている。
○問題1:theta6.dat-s
16コア
SDPA 7.4.0 + OpenBLAS 0.2.2 : 5.618秒
SDPA 7.4.0 + Intel MKL 10.3.11-339 : 11.488秒
32コア
SDPA 7.4.0 + OpenBLAS 0.2.2 : 7.641秒
SDPA 7.4.0 + Intel MKL 10.3.11-339 : 11.847秒
○問題2:FH2+.1A1.STO6G.pqgt1t2p.dat-s
16コア
SDPA 7.4.0 + OpenBLAS 0.2.2 : 35.965秒
SDPA 7.4.0 + Intel MKL 10.3.11-339 : 34.844秒
32コア
SDPA 7.4.0 + OpenBLAS 0.2.2 : 40.050秒
SDPA 7.4.0 + Intel MKL 10.3.11-339 : 42.630秒
○問題3:nug12_r2.dat-s
16コア
SDPA 7.4.0 + OpenBLAS 0.2.2 : 58.188秒
SDPA 7.4.0 + Intel MKL 10.3.11-339 : 115.178秒
32コア
SDPA 7.4.0 + OpenBLAS 0.2.2 : 67.745秒
SDPA 7.4.0 + Intel MKL 10.3.11-339 : 128.341秒
◯SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz 8 Core 20M L3 cache x 2
CPU Fan INTEL 純正水冷クーラー x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
SSD 120GB SSD(起動・OS用)
HDD Enterprize 1TB SATA HDD
DVD DVD-RAM
GPGPU NVIDIA GeForce 580搭載 3GB Memory
電源 850W 以上の80PLUS 高効率電源
OS : CentOS 6.3