2011-04-01から1ヶ月間の記事一覧
MPI 並列で SDP と言えば PDSDP が実は一番初めに出来たソフトウェアである。PDSDP と PCSDP は開発者がすでに民間企業に移ってしまって後継者?がいないという状況になっている。 ○問題1:Be.1S.SV.pqgt1t2p.dat-s SDPARA 7.3.3 : 173.45秒 SDPARA 7.3.2 :…
計算機や通信技術はその登場以来、常に進化を遂げていることは良く知られている。例えば、最適化に関係が深いキーワードには、マルチコア・プロセッサ、GPU コンピューティング、スーパーコンピュータ、クラウド・コンピューティングなどがあり、インターネ…
PCSDP の方は開発も終了しているようなので、最新版の SDPARA と比較するのは妥当ではないかもしれないが、新クラスタ計算機での比較実験を行なった。新クラスタ計算機上での PCSDP の作成は初めて。 ○問題1:Be.1S.SV.pqgt1t2p.dat-s SDPARA 7.3.3 : 173.4…
第23回RAMPシンポジウムは当初東北大学で開催予定でしたが、東日本大震災の関係で開催場所が関西大学へと変更になりました。 第23回RAMPシンポジウム 2011年10月24日(月)・25日(火) 関西大学千里山キャンパス100周年記念館(大阪府吹田市) 日本オペレーショ…
前回の実験が終わった瞬間に Gurobi 4.5.0 がリリースされたので再実験を行なった。 ○問題 rol3000.mps (MPILIB2003) 以下の計算サーバでスレッド数を1から48まで変化させて実験を行なった。初期解を与えない通常の場合(ログファイル)と最適解を初期解と…
前回の数値実験に追加を行なった。問題1と3は Cholesky分解 つまり BLAS の性能に依存し、問題2は反対に BLAS に依存する部分は少ない。 ○問題1:theta6.dat-s SDPA 7.3.3 + GotoBLAS2 for Sandy Bridge : 9.089秒 SDPA 7.3.3 + GotoBLAS2 1.13(Nehalem)…
Gurobi 4.0.1 を用いて、まず問題を解いて最適解を得てから MIP start(mst) ファイルを作る。 m = read('roll3000.mps') m.optimize() m.write('roll3000.mst') その後で以下のように、mst ファイルを用いて最適解から探索を開始する。 m = read('roll3000.m…
以下の内容の解説記事が某学会誌の6月号に掲載される予定となりました。6ページぐらいですので、そんなに量はありませんが可能なかぎり詳しく解説してあります。 ○最先端理論(Algorithm Theory) + 大規模実データ(Practice) + 最新計算技術(Computation) ○…
これまで以下の内容で日本のいろいろな場所で講演を行なった。1990年代ではある理論がソフトウェアの実装に向いているのか、またその時代の計算新技術と組み合わせることによって大規模な問題を解くことができるようになるのかについては、時間をかけてじっ…
Gurobi 4.0.1 を用いて以下の問題を解く際にスレッド数を1から48まで変えながら実行してみた。スレッド数が1変わっただけで実行時間も大きく変動し、スレッド数が多い方が良いとは限らない。 ○問題 rol3000.mps (MPILIB2003) スレッド数:実行時間(秒) 1…
某整数計画ソルバーの実験結果。計算過程が異なるので単純に比較は出来ないが、計算サーバ2の方がスレッド数は少なくても実行時間は小さい。 ○問題 mod011.mps ○計算サーバ1: Solving Time (sec) : 450.2000 Solving Nodes : 1392 ○計算サーバ2: Solvin…
代表的な整数計画ソルバーである CPLEX と Gurobi を用いてSandy Bridge と Nehalem上で比較実験を行った。SDPA のような顕著な性能向上はなくクロック周波数相当の性能向上のみが見られる。 1: CPLEX 12.2.0.2 ○問題1:roll3000.mps 計算サーバ1:31.52秒…
Gurobi では特にユーザーが設定しなくても、計算機内の CPU コア数を検知して並列計算を行なうようになっているが、以下のように m.setParam('Threads', 1)とすると並列計算のスレッド数を 1 に変更することができる(この計算サーバの場合では初期値は 48)。…
ATLASも最新版では AVX 命令対応になっているようなので、これを用いて Intel MKL との性能差を調べた。BLAS への依存度が少ない問題2では同等の結果になっているが、その他の問題では Intel MKL との差が大きい。 ○問題1:theta6.dat-s SDPA 7.3.3 + Inte…
esc16b_r2.dat-s の mDIM は 27376 なので、この SDP を解くと1反復において 27376 x 27376 行列の Cholesky 分解を1回行う必要がある。この場合では計算サーバ2のSandy Bridge (Core i7-2600K;3.4GHz)は、計算サーバ3の Nehalem(Corei7-965;3.2GHz)の2…
以下の計算サーバ2は Intel Sandy Bridge 搭載なので OS 等の条件は異なるが、コンパイラを全て Intel Compiler の最新版に合わせて SDPA の実験を行った。クロック周波数やコア数などを考慮しても、Sandy Bridge は異様に速い。SDP 計算に対する相性が良い…
研究成果の概要: 主要な最適化問題(半正定値計画問題, 最短路問題, 混合整数計画問題)に対応し、最適化ソルバーやパラメータの自動設定機能を持つ高機能かつ高性能の最適化オンライン・ソルバーを構築して、インターネットから広く利用できるように公開を行…
DIMACS の NY データで TEPS 値を測定したところ、最新の方法では 2G (2.0x10^9) TEPS を越えている(48コア使用で)。NY データは現在のアルゴリズムと計算機の能力から考えると非常に小さい問題なので、非常に大きなデータでは TEPS 値はこの値よりもは…
SuperServer 7046GT-TRF-FC405 はNvidia Fermi C2050 GPU Cards を4枚搭載したモデルになっている。以下の基本構成で見積りを取ってみると約 187 万円になった。 CPU : Intel Xeon X5650 2.66GHz x 2個 メモリ : 96GB HDD : 2TB SATA 7200rpm 価格:187万円…
研究室のサーバを CentOS 5.5 から 5.6 にアップグレードしてみたが、httpd 関係のバグがあるらしく httpd が動作しなくなった。いろいろと調べてみたところ解決策としてこちらに書いてある方法を採用した。 こちらでは password.conf を使用していないので…
久々に以下のクラスタ計算機を稼働させて実験を行なっている。クラスタ上で SDPARA を動作させると以下のように SDPA との性能差が大きい。SDPARA を使っていると、もうクラスタ計算機無しの生活には戻れなくなる。 ○問題1:Be.1S.SV.pqgt1t2p.dat-s SDPA 7…
計画停電はしばらく実施されないようなので、以下の新クラスタ計算機を再稼働させた。他のクラスタ計算機は停止したままなので、電力ベースでは3月11日以前の3~4割程度の使用量になる。ただし、以下のクラスタ計算機の性能が良いので性能面では5割を…
SCOPE つくば合宿の詳細になります。詳しくはこちらのホームページをご覧下さい。 開催日 : 2011年5月28日(土), 29日(日) 会 場 : 筑波大学 筑波キャンパス 春日地区 講堂 参加費 : 無料(ただし, 宿泊, 懇親会への参加は有料) 事前登録 : 不要(ただし, 筑…
最適化分野で最も注目されている数理計画問題の一つである半正定値計画問題(SDP)においては疎性の追求、前処理さらに並列計算によって、計算量やデータ量を劇的にスケールダウンさせることに成功した。 以下のSDPの定式化の場合: n = 行列の大きさ, m = 制約…
某学会誌6月号に掲載予定の原稿について 概要 最適化問題に対するクラウド・コンピューティングの適用には様々な方法が提案されている。 例えば大規模最適化問題に対して数値実験等を行うために, 必要なときに, 必要な量だけ計算機資 源をインターネット上…
以前、全米データ(2400万点, 5800万枝)でも 1.8GTEPS の速度を達成することが出来れば全対全最短路の計算が約 9 日で終わることになると書いたのだが、実際には全米(24M点,58M枝)で部分的に実験すると以下の Magny-Cours 48 コアで 434 MTEPS だったので、全…
Intel® C++ and Fortran Composer XE for Linux つまり Intel® C++ and Fortran Compiler Professional Edition for Linux に関する話題だが、最近もマイナーバージョンアップ(インテルによると)されて、最新バージョンは 2011.3.174 になっている。どこが…
Stanford Large Network Dataset Collection というサイトがあって、以下のような様々な Social network, Web graph, Road network などのグラフデータが入手可能となっている。我々のような研究者から見ると宝の山に見える。グラフのサイズとしては小から中…
以前からこちらのブログでも連絡させていただいておりますが、SOA、SAOP、SAOR、S@COそしてSCOPEの歴代の若手研究者の研究会で JORSJ の特集号を作ることになりました。スケジュールはかなり早めになっていまして、7月に論文投稿締切り、今年中には論文誌を…
1: Gurobi www.gurobi.com 2: IBM CPLEX www.cplex.com 3: FICO XPress-MP www.fico.com/en/Products/DMTools/Pages/FICO-Xpress-Optimization-Suite.aspx 4: Lindo www.lindo.com 5: Minto coral.ie.lehigh.edu/~minto 6: SCIP scip.zib.de 7: CBC projects…