大規模最適化問題、グラフ探索、機械学習やデジタルツインなど

旧名:最適化問題に対する超高速&安定計算

2012-09-01から1ヶ月間の記事一覧

スケジューリング学会シンポジウム:大規模災害からの避難計画

スケジューリング学会シンポジウム(2012年9月29、30日:成蹊大学)で以下の特別セッションを行います。JST CREST でのグラフ探索プロジェクトとも関連性の高い内容です。 大規模災害からの避難計画【9:00~11:00】 OS3-1 大地震時における広域避難…

次回:第25回 RAMP シンポジウム

まだ本決定ではありませんが、次回(第25回)シンポジウムの予定です。 場所:鹿児島大学稲森会館 日時:2013年10月(未定) プログラム及びオーガナイザー:未定

3GTEPS の制限:その2

昨日は 3GTEPS の壁という話をしたが、さすがに以下のマシン(AMD Opteron 6174 x 4)では 3GTEPS を軽く超える。その値は 5.84GTEPS になっている。 ---------------------------------------------------------------------- Parallel Breadth-First Search …

3GTEPS の壁

以下の Intel Xeon X5690 3.47GHz x 2 マシン(メモリ192GB)だが、median_TEPS で 3G を超えていない。他のサーバでも 3G を超えることは出来ていない。ちなみに1ノードで 3G を超えているのは Intel Xeon Westmere-EX 2.4GHz x 4 マシンと Xeon Sandybridg…

第24回 RAMP シンポジウム 前日

いよいよ RAMP シンポジウムが明日に迫ってきました。当日参加も大歓迎ですので是非ご参加ください。 ---------------------------------------------------------------------------- RAMPシンポジウムは,日本オペレーションズ・リサーチ学会の数理計画研…

10GTEPS 越え

ついに1ノードで 10GTEPS(median_TEPS)を越えるようになった。実行は 80 コア(HT) で Scale は 26 となっている。 ---------------------------------------------------------------------- Parallel Breadth-First Search for Graph500 Benchmark version …

Graph500 解説記事

Graph500 に関する日本語の解説記事は以下が一番早いかどうかはわからないが、相当早い段階で書かれたことは間違いない。今見ても結構詳しく書かれていると感じる。 藤澤克樹, 安井雄一郎, 高宮安仁, 佐藤仁, 最適化分野におけるクラウド技術の利用, オペレ…

IBM Blue Gene/Q

IBM の Blue Gene/Q は各 CPU からラックまでが以下のような構成になっている。 http://news.mynavi.jp/articles/2011/12/13/blugeneq/index.html IBM BG/Q(Sequoiaのピーク性能):4 FPU x 2演算(FMA) x 16コア x 1.6GHz (ここまで 1CPU = 204.8GFlops) x 32…

2012年度 第1回 ORセミナー 『Excelで学ぶOR』

昨日以下のORセミナーを開催しました。一部の中身については少し難しいところがあったかもしれません。来年度のセミナー実施については未定です。その他の気付いた点ですが、 ◯ Windows の Excel 2010 及び 2007 では普通に Excel での実行は可 ◯ Mac の Exc…

Graph500 と 4th List の更新

Graph500 4th List が更新されている。 ◯Convey 抜いて正式に1ノード性能で世界一(25th rank : 8.15GTEPS) ◯TSUBAME 2.0 も GPU と CPU で2個ベスト10にエントリー。 なお SC12(11月)から、正式に Green Graph500 が開始される予定。

Graph500 とGreen Graph500 に関する話題

◯Green Graph500 の参照実装と ISC12 での発表スライド公開中 green.graph500.org 参照実装は基本的に Graph500 と同じ。時間測定用に BFS 64 回の部分だけ指定時間だけ繰り返すことができる。 ◯IBM BG/Q(Sequoia) : Graph500 ベンチマークで Scale 39(0.5兆…

JST ポストペタ CREST 講演会

以下の日時で JST ポストペタ CREST 主催の講演会を開催します。講演内容は第3回 KSMAP 研究会と同じものになります。京都で参加できない方はこちらにご参加ください。講師の日程上の都合によりまして、9月26日と10月1日の2回分けて開催します。 ◯JS…

「OR横断若手の会 (通称 KSMAP)」の第3回研究会開催

以下の日時で「OR横断若手の会 (通称 KSMAP)」の第3回研究会開催が開催されます。Ted Ralphs 氏とThorsten Koch 氏については RAMP シンポジウム でも発表されますが、これに加えて10月1日午後に中央大学(東京)でも講演予定です。また Stefan Vigerske…

SDPARA-G 用の新クラスタ その2

以下の新クラスタ(4台)についての SDPARA-G の結果。そんなに性能値は悪くはないのかもしれないが、もっと性能を上げていきたいところ。 ◯Cholesky 分解: 行列サイズ = 286552 ブロックサイズ = 1024 実行時間 = 2746.040017秒 性能値 = 2856.157914GFlo…

Graph500 電力測定中 その6

Graph500 の電力測定を行っているのだが、GTEPS/kW の指標で比較すると Android タブレット(携帯電話も) >> MacBook Air >> 計算サーバ(SandyBridge-EP等) >> スパコン となっている。電力測定の方法も異なってくるので、厳密な比較は難しいのだが Tegra3 …

タブレットデバイス Xperia(TM) Tablet S

富士通の携帯電話 ARROWS X も CPU は Tegra 3 を搭載しているが、こちらはクロック周波数は 1.5GHz となっている。搭載メモリも 1GB なので、携帯電話とは言っても相当高いスペックを持っていることがわかる。ただし、Graph500 などのグラフ探索を目的とす…

第24回 RAMP シンポジウム 事前登録締切まもなく終了

以下の第24回 RAMP シンポジウムですが、事前登録締切まもなく(9月14日)終了となります。参加予定の方はお忘れのないようにお願いします。 ------------------------------------------------------------------------------- RAMPシンポジウムは,日…

SDPARA-G 用の新クラスタ

SDPARA-G 用の新クラスタが完成した。以下の 4台、8 CPU(Intel Xeon X5690)、16 GPU(Tesla C2075 x 8枚 + C2070 x 8枚)という構成になっている。SDPARA-G の性能についてはまた後日掲載する予定。 ◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(4台) CPU…

AMD 系 CPU と Graph500 測定値

以下の AMD 系 CPU 搭載の計算サーバを用いて Graph500 測定を行った。グラフのサイズは Scale 24 とする。 ○計算サーバ1 CPU : AMD Opteron 2356 2.3GHz x 2 (2CPU x 4 コア = 8 コア) Memory : 32GB OS : CentOS 6.3 for X86_64 median_TEPS: 1.065332441…

全米道路ネットワークでの最短路計算の消費電力

以下の計算サーバの SCALE 21 (点数 2,097,152 ≒2^21 、 枝数 67,105,930 ≒2^26 ) グラフでの BFS 性能から考えると、全米道路ネットワークの最短路計算(任意の始点と終点を選ぶ)に要する電力量はわずか 3W 程度。特に SandyBridge-EP マシンは非常に GTEP…

Android タブレット

某測定用のマシンとして、以下の2台の Android タブレットを用意しました。性能(速さ)はそこそこ出るようですが、非常に省電力な仕様なので、どういう結果になるのか興味があるところです。 ◯ SONY Tablet S シリーズ SGPT112JP/S CPU : NVIDIA Tegra 2 …

2012年度 第1回 ORセミナー 『Excelで学ぶOR』

以下の OR セミナーの講師を担当することになっておりますが、セミナーのテキストについてはすでに7日に提出しました(3人分)。全部で 157ページ(3人分)ありますので、時間内に全てを説明できないと思いますが、出きるだけ多くの内容に触れたいと考えて…

Gurobi Optimizerソリューション セミナー2012 受付中

以下の Gurobi Optimizerソリューション セミナー2012 で”高速化と省電力技術で今後大きく変化する最適化ソフトウェア”というタイトルで講演させていただく予定です。すでに発表資料については提出済みです。参加者数についても順調に増えているようなので、…

Gurobi と CPLEX と電力性能 その4

電力測定の最後として、大型計算サーバや省電力PCでもなく、普通のデスクトップを用いて測定を行った。 ◯問題 net12.mps Gurobi 5.0.1 実行時間:363.43s 有効電力量(kWh):0.02 皮相電力量(kVAh):0.03 CO2排出量(kg):0.01 CPLEX 12.4.0.0 実行時間:786.0…

Gurobi と CPLEX と電力性能 その3

今回は省電力PCとして、Intel Atom を用いてみた。Intel SandyBridge-EP や Intel Westmere-EX の結果と比較すると問題を解くための総電力量では必ずしも Atom が有利ではないことがわかる。 ◯問題 net12.mps Gurobi 5.0.1 実行時間:2014.16s 有効電力量(kW…

Graph500 電力測定中 その5

前回の続き。すでに Westmere-EX 40 コアマシンでは 10G median_TEPS を越えている。 ◯計算サーバ1 SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz : 8 Core 20M L3 cache x 2 Memory DDR 3 1600 ECC REG 256GB (16GB x 16) OS : CentOS 6.3 generatio…

Gurobi と CPLEX と電力性能 その2

Gurobi と CPLEX で今度は Westmere-EX x 4 CPU マシンで実行時間と電力量などの測定を行った。SandyBridge-EP x 2 CPU の結果と比較していただきたい。 ◯問題 net12.mps Gurobi 5.0.1 実行時間:91.20s 有効電力量(kWh):0.02 皮相電力量(kVAh):0.02 CO2排…

6CPU + 12GPU v.s. 32CPU

以下の DNN 緩和問題に対して GPU 計算サーバ(6CPU + 12GPU) 3 台と OPT クラスタ(32CPU) の比較実験を行った。GPU計算サーバが3台あると、OPT クラスタに対して性能面でかなり有利になる。 ◯QAPLIB (tai27a.dat-s) の DNN 緩和問題 mDIM = 247131 nBLOCK =…

intel_iommu=on

CentOS 6.3 では、インストール時にアプリケーションの選択によっては、カーネルパラメータに以下のオプションが追加される。 intel_iommu=on この場合では、SDPARA のように CUDA を利用して GPU を多数回利用するアプリケーションでは DMA 関係のエラーが…

Graph500 電力測定中 その4

最新の結果です。 ◯計算サーバ1 SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz : 8 Core 20M L3 cache x 2 Memory DDR 3 1600 ECC REG 256GB (16GB x 16) OS : CentOS 6.3 median_TEPS 値:最大電流は 4.3A程度 ◯ gcc 4.4.6 scale 24 : 6.57G scale 2…