大規模最適化問題、グラフ探索、機械学習やデジタルツインなど

旧名:最適化問題に対する超高速&安定計算

2012-08-01から1ヶ月間の記事一覧

Gurobi と CPLEX と電力性能

Gurobi と CPLEX で以下のように実行時間と電力量などの測定を行った。もちろん電力量は実行時間に比例するのだが、家庭用の料金プランでは 1kWhにつき 17円87銭(東京電力)となっている。 ◯問題 net12.mps Gurobi 5.0.1 実行時間:237.90s 有効電力量(kWh)…

Graph500 電力測定中 その3

以下の計算サーバ1と2ですが、大きな GPU を外して小さな GPU を取り替えました。 以下のように性能(median_TEPS)はかなり向上しています。もちろん電力性能も向上です。 ◯前回 計算サーバ1:5.529 GTEPS 計算サーバ2:2.615 GTEPS ◯今回 計算サーバ1:…

Atom と Graph500

以下の Atom 搭載のマシンで Graph500 の測定を行っていますが、電力性能が良くても(0.8A)、やはり TEPS 値が悪いようです。median_TEPS で 0.152 GTEPS しか程度しかありません。さすがにこのマシンは Green Graph500 には使えないでしょう。 CPU : Intel A…

SDPA と CSDP と DSDP

ISMP2012 で幾つか SDP ソフトウェアの実験に関する研究を見掛けたので、自分で追試を行ってみた。SDPA はマルチスレッド計算用に最適化されているので、1スレッドで比較するのはあまりフェアではないと思えます。 SDP ソフトウェア ◯ SDPA 7.4.0 ◯ CSDP 6.…

ISMP 2012 と 2015

先週は以下の ISMP 2012 に参加して研究発表や打ち合わせ等を行いました。発表件数が前回よりも増えて新記録になったようです。 The 21st International Symposium on Mathematical Programming (ISMP) will take place in Berlin, Germany, August 19 - 24,…

日本オペレーションズ・リサーチ学会 2012年秋季研究発表会

日本オペレーションズ・リサーチ学会 2012年秋季研究発表会が以下の日程で開催されます。すでに発表申し込みは終わっております。個人的には様々な都合上、参加できないのですが、宣伝まで。 2012年秋季研究発表会 日 程 2012年9月12日(水)、13日(木) 場 所 …

通信と計算のオーバーラップ

◯ SDPARA 7.5.0-G 実行時における通信と計算のオーバーラップの効果: Version 2 と 3 の比較 (TSUBAME 2.0) ◯ 通信と計算のオーバーラップ Version 2 ◯ 通信と計算のオーバーラップ Version 3

Excelで学ぶOR:PDF版書籍データ

Excelで学ぶORのPDF版書籍データが以下のように発売となりました。 Excelを使いながらORの具体例、数値例を学ぶ!! ORとはオペレーションズリサーチ(Operations Research)のことで数学・統計モデルを使って諸問題を解決していく手法です。本書では、第1部…

GPUとDGEMM

昨年の SC11 で発表された以下の GPU 用の dgemm 関数を用いて、各 GPU の dgemm 性能を測定した。 Fast Implementation of DGEMM on Fermi GPU ◯ Tesla C2075 : 360GFlops 程度の性能が出ている。cublas では 315GFlops 程度 # Running on 'Tesla C2075' # …

SDPA-DD 7.1.8 と GPU その2

以下の計算サーバ1と2は Tesla が C2075 と C2070 と異なるだけで、他は全く同じ仕様となっている。C2075 と C2070 の性能はほぼ同じと思っていたのだが、意外と C2070 の方が速かったりする。 ◯問題 mcp1000-10.dat-s 計算サーバ1:4m43s 計算サーバ2:…

研究室

研究室に入ったらこんな風になっていたそうです。この部屋ではなくて、上の階の工事ためにこうなったのらしいのですが。。。

SDPA-DD 7.1.8 と GPU

SDPA-DD (4倍精度演算 + GPU) の最新版 7.1.8 を用いて、簡単な数値実験を行った。以下のように CPU や GPU が異なる雑多な環境下での数値実験となっている。実行時間は Elapsed Time(経過時間)を採用する。計算サーバ3には Tesla C2075 が4枚搭載されて…

SDPA と様々な BLAS その11

以下のような異常が発生していたのですが、正常に戻りました。原因は CPU でもメモリでもマザーボードでもなくて、LVM によるパーティション構成にある可能性が大です。 SSD + HDD によって、1つのパーティションを構成していましたが、極端にアクセス速度…

SDPARA 7.5.0-G と電力性能 その3

正常に動作している GPU C2075 x 4 台搭載のマシンと異常が発生している GPU C2070 x 4台搭載のマシンの GPU を交換して実行を行ってみた。 ◯ GPU 交換中 結論としては GPU を交換しても、やはり異常が発生するので、今回のトラブルの原因は GPU でなく、マ…

SDPA と様々な BLAS その10

下記の計算サーバ1に異常が発生して性能が低下中(原因は不明だがメモリ関係が原因か?)。GPU 計算サーバだけでなく、こちらも修理が必要かもしれない。 ○問題1:theta6.dat-s 計算サーバ1: 6.45秒(正常時) 計算サーバ1: 15.29秒 (現在) 計算サーバ…

ポスドク研究員募集

ポスドク研究員募集:興味のある方は NII の宇野先生まで(uno@nii.ac.jp)問い合わせください。ちなみに宇野先生と私は研究室(博士課程)の同期になります。 ■ 期間 ■ 2012年9月1日から2014年3月31日まで ※ 雇用開始を遅らせることは可能です ※ 途中での異動…

SDPARA 7.5.0-G と電力性能 その2

Tesla C2070 を4台搭載した計算サーバを購入した。しかし、ある程度高い負荷を掛けて実験を行うと、画面やキーボード等の反応が無くなり(外部からの ssh も不可)、数分後に自動的に再起動が始まる。マザーボード、電源それに GPU 等の異常が疑われる。 ◯ T…

SDPARA 7.5.0-G と電力性能

SDPARA 7.5.0-G と以下の GPU 計算サーバを用いて電力性能の測定を行った。GPU 計算サーバは以下の B-5 と B-6 に該当する(電源は2系統)。やはり 4GPU での計算部分では 10 A を大きく越えている。 ◯ GPU を使わない部分(ELEMENTS)では、3.9 A + 3.4 A = 7…

Tesla C2070 と C2075

Tesla C2070 と C2075 は以下のように Memory Clock rate が少し異なるだけで後はほぼ同じような製品。 Device 0: "Tesla C2070" CUDA Driver Version: 4.2 CUDA Capability Major/Minor version number: 2.0 Total amount of global memory: 5375 MBytes (5…

Graph500 電力測定中 その2

前回の続き。Intel Xeon E5-2690 2.90GHz x 2 CPU (HT On 32コア)で、Scale25 で約 5.53GTEPS なので、電力性能は11GTEPS/kW を越えていると推測される。 ◯ HT On にして、32コアで測定中。 ◯ Scale25 での実験結果 ◯ 計算サーバ1 min_time: 8.8606357574…

Graph500 電力測定中

ソフトウェアの電力測定用に以下の電源制御装置の購入を行った。以下の Graph500 の実行では計算サーバ1と2で電力消費量に2倍程度の差があるが、性能値の差はほぼ2倍程度となっている。 リモート電源制御装置 マルチコントロールコンセント RC3008 ◯ソフ…

作業内容

研究室での作業内容(8月9日)について。旧式になったクラスタの撤去と同時に GPU 搭載の計算サーバは増強する予定。さらに現在リモート電源制御装置マルチコントロールコンセントRC3008の発注が完了している。 1: POWERクラスタ(2007年):撤去 2: SDPA ク…

Gurobi Optimizerソリューション セミナー2012

以下の日程で Gurobi Optimizerソリューション セミナー2012 が開催されます。詳しくは以下のページを参照下さい。 Gurobi Optimizerソリューション セミナー2012 開催日程 平成24年10月4日(木) 受付開始 9時10分~ 開催時間 9時40分 ~ 17時40分 (受付開始…

SC12 : Technical Paper 採択論文

SC12 の採択論文(Technical Paper)について: Title: High-Performance General Solver for Extremely Large-Scale Semidefinite Programming Problems Authors: Katsuki Fujisawa, Toshio Endo, Hitoshi Sato, Makoto Yamashita, Satoshi Matsuoka, Maho Na…

RAMP2012 での講演

RAMP2012 でのプログラムが公開されています。1日目の午後に以下の内容で講演を行います。 大規模半正定値計画問題に対する高速計算 – ポストペタスパコン上での最適化ソフトウェア – 章構成 1.最適化問題とソフト ウェアに関する最新の傾向について 2.半正…

SDPA と様々な BLAS その9

SandyBridge-EP のサーバが2台となったので(計算サーバ1:E5-2690 2.9GHz, 計算サーバ2: E5-2650 2.0GHz)、SDPA 7.4.0 を用いて性能差を見る実験を行ってみた。Cholesky 分解がボトルネックとなる問題3では、両者の性能比はクロック周波数(2.9/2.0 = 1.4…

RAMP シンポジウム 2012

RAMP シンポジウム 2012 日程 2012年9月27日(木)・28日(金) 会場 東北大学片平キャンパスさくらホール ◯すでに参加申し込みが始まっております。 http://www.orsj.or.jp/ramp/2012/register.html シンポジウム参加費 一般 学生 事前振込(9月14日まで) ¥5,…

SCIP version 3.0.0 released

SCIP version 3.0.0 がリリースされました。SCIP の並列版 FiberSCIP, ParaSCIP なども含まれています。CP や MIP だけでなく MINLP(混合非線形整数問題)等も解くことが可能です。 ParaSCIP:大規模分散メモリ並列計算環境上で動作させることを意図して開発…

GTC Japan 2012 のポスターファイル

以下は 7/26 に開催された GTC Japan 2012 のポスターファイルです。当 CREST の4チームの研究が含まれておりますが、左上の Graph500 は世界4位(初のGPU大規模実装)、右下の SDP は問題規模で世界記録(SC12 での Technical Paper として採択) となります。…

SDPARA 7.5.0-G と 7.4.0

以下の SDPARA 7.5.0-G(CPU + GPU) と 7.4.0(CPU) に関する簡単な実験について。 1: C1060 は倍精度演算性能が低いので、1台では CPU よりもむしろ遅い 2: C2075 x 8台では高速だが、本来の性能(2TFlops弱)が出せるのはかなり大きめのデータから ○問題 tai…