投稿中の論文の修正に関して幾つか再実験が必要なので、少しだけ SDPARA(SDPA) に関する比較実験を行なった。
○ソフトウェア SDPARA 7.3.3 と SDPA 7.4β
○問題 Be.1S.SV.pqgt1t2p.dat-s
まずは OPT クラスタ計算機(16 ノード x 12 コア = 192コア)で実験を行う。192 コア搭載なので他と比較して速いのは当然。
○実行時間 : 2m49s
○ OPT クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.6 for x86_64
次に2世代前のクラスタ計算機(32コア)で実験を行なう。意外と速いという印象。中古で少し古いマシンを集めてクラスタ計算機にしてもそこそこの性能は出せそうな感じはする。
○実行時間: 12m47s
○ POWER クラスタ
4 Nodes, 8 CPUs, 32 CPU コア;
CPU : Intel Xeon E5345 2.33GHz (quad cores) x 2 / node
Memory : 16GB / node
HDD : 2TB(RAID 5) / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.6 for x86_64
次は AMD Opteron(Magny-Cours)マシン2台を GbE で繋いだ変則的なミニクラスタ計算機で実験を行う。MPI のオーバヘッドを考えると1台で SDPA を動作させる方が速い。
○実行時間:12m27s (SDPARA : 2台 96コア)
○実行時間:15m32s (SDPARA : 1台 48コア)
○実行時間:11m53s (SDPA : 1台 48コア)
○Magny-Cours 計算サーバ : (4 CPU x 12 コア = 48 コア)
CPU : AMD Opteron 6174 (2.20GHz / 12MB L3) x 4個
メモリ : 256GB (16 x 16GB / 1066MHz)
OS : Fedora 15 for x86_64
最後は AMD Opteron (Istanbul)マシン1台(24コア)での SDPA の実行。
○実行時間:18m1s
○Istanbul計算サーバ (4 CPU x 6 コア = 24 コア)
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 15 for x86_64