TSUBAME 2.0 での大規模実験に備えて、さらに大きな問題を用意した。制約数は 1484406 となっているので、Cholesky 分解には 1.0903e+18 FLOP を要する(つまりエクサFLOP級の問題)。2180秒以下で解ければ 500TFlops を越える計算となる。
◯問題名 : sko42.dat-s (QAP に対する DNN 緩和問題)
mDIM = 1484406
nBLOCK = 2
bLOCKsTRUCT = -1777522 1682
◯東工大 TSUBAME 2.0
HP Proliant SL390s G7 1408台
HP Proliant SL390s G7
CPU: Intel Xeon 2.93GHz 6コア×2ソケット = 12コア(Hyperthreading時 = 24コア)
GPU: NVIDIA Tesla M2050 3GPU
Memory: 54GB (一部は96GB)
SSD: 120GB (一部は240GB)
ネットワーク: QDR InfiniBand x 2 = 80Gbps
◯1ノードあたりの性能(倍精度)
CPU 140GF(2.93GHz) + GPU 1545GF = 1685GF
CPU 153GF(3.2GHz : TB) + GPU 1545GF = 1698G