2012-06-01から1ヶ月間の記事一覧
今年の夏の電力供給は関東は関西ほど切迫していないように言われるが、東京湾岸の火力発電所に事故等が発生すれば一気に逼迫することは確実な状況となっている。 TSUBAMEの夏期縮退運転(ピークシフト)について(6/29更新) 縮退運転期間 7/5(木)~9/28(金) 当…
明日(30日)からつくば合宿が開始されます。発表と宿泊以外の事前登録は不要です。プログラム等も以下のホームページから公表されています。 最適化の理論と応用 -- 未来を担う若手研究者の集い2012 -- 開催日 : 2012年6月30日(土), 7月1日(日) 会 場 : …
東工大の授業 GPU コンピューティングの講義ノートが公開されています。初心者から上級者まで GPU の学習に使うのも良いと思いますし、趣味のコンピューティングの参考に使うのも良いと思います。特に第9回はまだ情報が少ない OpenACC についての講義でこの…
Green Graph500 のホームページと及び現在の submission rules のドキュメント 以下は ISC12 Graph500 BoF セッションでの Green Graph500 の紹介:
昨日の続きで、全体時間ではなく具体的な中身(ボトルネックとなる二つの部分)の比較を行う。CHOLESKY の部分は基本的に 7.3.6 と 7.4.0 で違いが無いので、性能的にもほぼ同じ。ELEMENTS の部分は疎な SCM の場合のマルチスレッド化が比較的良く成功してい…
SDPA 7.4.0 と 7.3.6 の比較で今回は SCM が疎になる場合におけるマルチスレッドの特性や有効性を調べてみた。スレッド数を1から16まで変更しながら、とりあえず今回は全体の実行時間を測定して比較を行った。 ◯ SDPA 7.3.6 (LP64) ◯ SDPA 7.4.0 (ILP64) …
次回の Graph500 から登場予定の新カーネル Single Source Shortest Paths(SSSP) について。 公式のホームページにはまだ何も出ていないが、非公式な情報はいろいろ伝えられている。枝に重みが付き、厳密な最短路(近似という意味ではなく)を(一つ)求めて…
以下のワークショップに参加する予定ですが、すでに事前登録期間は終わっています。空きがあるようであれば、まだ参加できるかもしれません。 PCクラスタワークショップ in 柏 主催 PCクラスタコンソーシアム 共催 東京大学 情報基盤センター 会場 東京大学 …
結果から見ればハードウェア性能の差などから IBM BG/Q 完勝となった The 4th Graph500 ですが、日本勢(JST CREST ポストペタ Graph チーム) が 3, 4, 34(1ノード)位にとなり、第2勢力としての日本のプレゼンスを示すことには成功したと思います。特に世界初…
The 4th Graph500 List 今回は当 CREST チームで 東工大スパコン TSUBAME2.0(TSUBAMEグランドチャレンジ 平成24年度春期を利用)と東大スパコン FX10 (2012年度 FX10 スーパーコンピュータシステム大規模 HPC チャレンジを利用)を用いて Graph500 用のソフト…
ISC12における SDPARA に関する展示内容です。
ISC12 で発表となった The 4th Graph500 List。一部に間違い等があり、TSUBMAE2.0 (CPU版)が 10位となる予定。 国別の参加エントリー数 ○当CREST における結果 TSUBAME2.0 (GPU版):世界4位 東大 FX10 : 世界3位 BoF 3: Fourth Graph500 List June 19, 2012,…
現在、ドイツのハンブルグで開催されている ISC 12 に参加しています。Graph500 関係の発表もありますが(IBM BG/Q あたりがどれだけのTEPS 値を出すかに注目)、東工大(Tokyo Institute of Technology)のブースで SDPARA に関する研究展示も行う予定です。 名…
例年イノベーション・ジャパンに参加しておりましたが、今年は残念ながら RAMP シンポジウムと完全に重なってしまったので、イノベーション・ジャパン 2012 への参加は見送りました。 ------------------------------------------------------------------ R…
今年も7月に東京ミッドタウンホール&カンファレンスで GTC Japan 2012 が 7/26 に開催されます。現在、事前登録の受付中です。ポスター発表も受け付けています。 タイトル: GTC Japan 2012 主催: エヌビディア ジャパン 会期: 2012年7月26日(木)10:00開…
サーバ用 Tesla のラインナップ http://www.nvidia.co.jp/object/tesla-servers-jp.html Tesla M2075 と Tesla M2070 の違いと言えば前者の方が消費電力が少ないと言われている。また上記のリンクを見るとわかるように、以下の四つの指標から判断すれば Tesl…
ISC12 での Graph 500 関係のセッションは 19 日の午前中に集中している。というわけなので、4回目の Graph500 リストは現地時間で 19 日の午前 11:30 から発表となる。 Graph500 – Philosophy, Challenges & the State of the List June 19, 2012, 9:30 AM …
前にも述べたように sink 上に流れ込む流量の総量に上限があると The Universally Quickest Flow が存在しない。 ◯Universally Quickest Flow:どの時点てもそれまでの避難完了人数が最大となる実行可能な動的フロー The Universally Quickest Flow が存在し…
Multiple precision LAPACK and BLAS のホームページ MPACK の 0.7.0 が RC2 まで来ていますので、おそらくもう少しで正式なリリースになると思います。現時点でも Linux 系(例えば CentOS 5, 6, Fedora 16 等)で gcc を用いる場合では特に異常は発見されて…
SOTA つくば合宿のプログラムが発表されています。講演以外の通常参加は事前登録も必要ありませんので、当日会場までお越し下さい。 最適化の理論と応用 -- 未来を担う若手研究者の集い2012 -- 開催日 : 2012年6月30日(土), 7月1日(日) 会 場 : 筑波大学 筑…
Title: 内点法アルゴリズムの並列計算による超大規模半正定値計画問題の解決 Solving extremely large-scale semidefinite optimization problems via parallel computation of the interior-point method Abstract: 半正定値計画問題(SDP)は組合せ最適化, …
前回の続きで、SDPA 7.3.6 と 7.4.0 の比較。今回は SCM が疎になる場合の比較になる。7.4.0 では SCM が疎になる場合に様々な計算の工夫が施してあり、以下のように計算速度にはかなりの差がある。 ◯ SDPA 7.3.6 (LP64) ◯ SDPA 7.4.0 (ILP64) ◯問題 1YGPn00…
SDPA-DD で用いている MPACK 関数について。倍精度演算の場合では dgemm と先頭に d が付くようになっているが、MPACK では Rgemm のように R が先頭についている。ちなみに Rgemm についてはすでに GPU 化されている。 ◯SDPA-DD で用いられる MPACK 関数(Rg…
RAMPシンポジウムは,日本オペレーションズ・リサーチ学会の数理計画研究部会 (RAMP: Research Association of Mathematical Programming) によって 年一度開催される,最適化・数理計画に関するシンポジウムです. 本年度のシンポジウムは東北大学(宮城県…
SDPARA 7.3.2, 7.3.3 (OPT クラスタ) と SDPARA 7.5.0-G (GPU 計算サーバ)の比較実験。7.5.0-G の性能の良さが目立つ結果となっている。 ○esc32a_r2.dat-s : QAPLIB esc32a に対する DNN 緩和問題 実行時間 ○SDPARA 7.3.2 : 22336.48秒 (OPT クラスタ) ELEME…
SDPA のホームページから SDPA の最新版 7.3.6 をダウンロードする。ホームページの指示通りに make していくと意外とこれが難しい。私自身は慣れているので、いろいろな方法で make 可能だが、初めてだと結構大変なようだ。現在ホームページから入手できな…
TSUBAME2.0 の計算ノードが搭載されているラック。普段は全面のドアで密封されている(騒音と空調のため)。この写真はドアを開けたもので、良く見ると Infiniband のケーブルが1本外れて垂れている。その代わりにこのラックの外から1本ケーブルが入ってき…
以下のような大きな問題が送られてきた。mDIM が大きいということは GPU 計算の効果が大きいように見えるのだが、それ以前に bLOCKsTRUCT の値も大きめなので、ELEMENTS の部分の計算割合が高く、現時点での実装では CPU コア数が多い方が有利となる。 17054…
現在、正式なホームページは作成中だそうです。以下のOR学会の RAMP ホームページです。近日中に更新される予定ですので以下のリンクもご覧下さい。 日本OR学会 RAMP シンポジウムホームページ 日時 : 2012年9月27日(木),28日(金) 会場 : 東北大学 実…
以下の比較だが、CPU 192 コアに CPU 32 コア + GPU 8 枚で勝てるようになった。GPU 計算の CHOLESKY ばかりに注目がいくが、ELEMENTS の部分もやはりボトルネックの一つで、こちらは CPU コアが多くないと速く計算することは難しい。 ◯問題 tai26a.dat-s ◯…