やっと以下の実行が終了した。実行時間は予想通りにほぼ8日だった。このペースだと1年でも45問程度しか解くことが出来ない。
76554 (= mDIM)
22 (= nBLOCK)
18 18 18 18 153 153 324 153 153 324 648 324 324 816 2754 2754 816 8604 8604 2754 2754 -694 (= bLOCKsTRUCT)
mu thetaP thetaD objP objD alphaP alphaD beta
0 1.0e+04 1.0e+00 1.0e+00 +0.00e+00 -7.81e+05 8.4e-01 1.0e+00 2.00e-01
1 2.2e+03 1.6e-01 2.5e-14 -3.58e+01 -1.16e+06 8.2e-01 8.2e-01 2.00e-01
2 5.7e+02 2.9e-02 3.9e-14 -7.39e+01 -1.49e+06 7.4e-01 7.4e-01 2.00e-01
3 2.1e+02 7.5e-03 5.4e-14 -7.22e+01 -1.73e+06 4.6e-01 1.1e+00 2.00e-01
4 1.3e+02 4.0e-03 6.4e-14 -7.11e+01 -1.54e+06 8.6e-01 1.8e+00 2.00e-01
中略
41 6.3e-09 2.6e-10 1.2e-11 -1.18e+02 -1.18e+02 9.1e-01 7.2e-01 1.00e-01
42 2.2e-09 2.6e-10 4.1e-12 -1.18e+02 -1.18e+02 9.2e-01 8.5e-01 1.00e-01
43 5.1e-10 2.6e-10 1.1e-11 -1.18e+02 -1.18e+02 9.2e-01 8.5e-01 1.00e-01
phase.value = pdOPT
Iteration = 43
mu = +5.1185051550432392e-10
relative gap = +7.3134022716840409e-08
gap = +8.6053522068141319e-06
digits = +7.1358805376700047e+00
objValPrimal = -1.1766550741315348e+02
objValDual = -1.1766551601850568e+02
p.feas.error = +4.9856249369481486e-08
d.feas.error = +3.9714237232146843e-08
total time = 689534.728013
Make bMat の実行時間が非常に大きな割合を占めているので、CPUコア数を増やすことによって性能の向上が期待できるが、反対に現状ではアクセラレータ等での加速は期待できない。
Make bMat time = 673636.311352, 97.699023
Cholesky bMat = 6178.079665, 0.896021
Total = 689534.728013, 100.004807
○ OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.7 for x86_64