大規模最適化問題、グラフ探索、機械学習やデジタルツインなど

旧名:最適化問題に対する超高速&安定計算

Sandy Bridge と SDPA その2

esc16b_r2.dat-s の mDIM は 27376 なので、この SDP を解くと1反復において 27376 x 27376 行列の Cholesky 分解を1回行う必要がある。この場合では計算サーバ2のSandy Bridge (Core i7-2600K;3.4GHz)は、計算サーバ3の Nehalem(Corei7-965;3.2GHz)の2倍近い計算速度になっている。

○ソフトウェア SDPA 7.3.3 + Intel MKL 10.3

○問題:esc16b_r2.dat-s
計算サーバ1: 1919.2秒 (Cholesky 分解 : 1559.3秒)
計算サーバ2: 2616.9秒 (Cholesky 分解 : 2018.3秒)
計算サーバ3: 4399.4秒 (Cholesky 分解 : 3784.7秒)
参考
クラスタ計算機(SDPARA 7.3.2):318.8秒 (Cholesky 分解 : 280.1秒)

○計算サーバ1 (2 CPU x 6 コア = 12 コア)
CPU : Intel Xeon 5670 (2.93GHz / 12MB L3) x 2
Memory : 128GB (16 x 8GB)
OS : CentOS 5.6 for x86_64

○計算サーバ2 (1 CPU x 4 コア = 4 コア)
CPU : Intel Corei7 2600K (3.40GHz / 8MB L3) x 2
Memory : 8GB (4 x 2GB)
OS : Fedora 14 for x86_64

○計算サーバ3 (1 CPU x 4 コア = 4 コア)
CPU : Intel Corei7 965 (3.20GHz / 8MB L3) x 1
Memory : 12GB (6 x 2GB)
OS : CentOS 5.6 for x86_64

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64