前回の続きでスレッド数の変化による実行時間を測定してみた。現在でもいろいろ調べているので、また報告していく。
◯実行結果
2スレッド : 10331.28s
4スレッド : 8118.21s
8スレッド : 7402.06s
16スレッド : 7392.43s
32スレッド : 8437.92s
◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3
◯問題
* SDPA sparse format data
* mDim = 25724, nBlock = 37
* size of bVect = 1 * 25724
* size of sparseMatrix = 471309 * 5
25724
37
-5460 -24289 363 323 323 323 323 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78