大規模最適化問題、グラフ探索、機械学習やデジタルツインなど

旧名:最適化問題に対する超高速&安定計算

CUDA 11.6 と SDPARA

CUDA 11.6 + Intel Compiler (MKL) 2021.5.0 を用いて SDPARA 7.6.1 を実行。
性能は以前よりもかなり下がっています。。。

[gpdpotrf] ### END n=152928, nb=2048, 1x2 procs, ver 50: 337.021sec --> 3537.391GFlops ###

参考:以前の性能
[gpdpotrf] ### END n=152928, nb=2048, 1x2 procs, ver 50: 236.982sec --> 5030.656GFlops ###

◯サーバ
CPU : Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz x 2
メモリ : 512GB
GPU : NVIDIA Tesla P100 x 2
OS : CentOS 7.9