以下の二つクラスタ計算機を用いて簡単な比較実験を行った。両方とも 8 ノード x 8 コア = 64 コアだけを使用する。ソフトウェアは SDPARA 7.3.3 を用いた。同じ 64 コアで CPU のクロック周波数もあまり変わらないのに、以下のように ScaLAPACK の Cholesky 分解ではかなりの性能差がついている。
◯ OPT クラスタ
CPU : Intel Xeon 5670 2.93GHz → 3.2GHz (Turbo Boost)
全部で 16 ノード x 12 コア の中で 8 ノード x 8 コアだけを使用
ネットワークは Inifiniband QDR
◯ SDPA クラスタ
CPU : Intel Xeon 5460 3.16GHz
全部で 16 ノード x 8 コア の中で 8 ノード x 8 コアだけを使用
ネットワークは Myrinet-10G
◯問題 nug16a_r2.dat-s
OPT クラスタ
Cholesky : 1155.73秒
Total : 1334.38秒
SDPA クラスタ
Cholesky : 1705.93秒
Total : 2104.04秒
---------------------------------------------------------------------------------------------------------------------------
○OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.6 for x86_64
○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.6 for x86_64