大規模最適化問題、グラフ探索、機械学習やデジタルツインなど

旧名:最適化問題に対する超高速&安定計算

openmpi と mvapich2 その3

こちらのクラスタ計算機で SDPARA を用いて OpenMPI と MVAPICH2 の性能差を再び測定した。前回と同じく MVAPICH2 の方が少したけ速いが、今後も継続して調査する予定。

1: OpenMPI 1.5.4
実行例:
/usr/local/openmpi/bin/mpirun -np 16 -machinefile ~/.openmpi/hostfiles --mca btl_openib_max_btls 4 numactl -i all ./sdpara.openmpi.goto.3 ~/data/quantum/N.4P.DZ.pqgt1t2p.dat-s out.N.openmpi.12

2: MVAPICH2 1.7rc1
実行例:
/usr/local/mvapich2-1.7rc1-intel/bin/mpiexec -machinefile ~/mpd.hosts -n 16 numactl -i all ./sdpara.mvapich2.goto.3 ~/data/quantum/N.4P.DZ.pqgt1t2p.dat-s out.N.mvapich2.12

◯問題1 : nug16a_r2.dat-s
OpenMPI 1.5.4 : 732.85秒
MVAPICH2 1.7rc1 : 702.84秒

◯問題2: N.4P.DZ.pqgt1t2p.dat-s
OpenMPI 1.5.4 : 493.66秒
MVAPICH2 1.7rc1 : 483.21秒

以下のクラスタはメモリを 1 ノードで 128GB(8GB x 16枚) から 144GB(8GB x 18枚)に増強する予定。

○opt クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.6 for x86_64