2012-01-01から1年間の記事一覧
以下のフロンティア法の並列&高速実装について、当 CREST チームでも連携を計画しています。単純なフロンティア法の実装だけでなく、ZDD(BDD)本体の操作関数等についても同様に実装を考えていく必要があります。 ------------------------- フロンティア法…
以下の日程で第138回 ハイパフォーマンスコンピューティング研究発表会が開催されます。HPC の世界でもグラフ処理等が含まれるようになりました。当 CREST もビッグデータやグラフ処理などで発表を行う予定です。 ◆第138回 ハイパフォーマンスコンピューティ…
以下の停電&ネットワーク停止は無事に終了して、サーバ等も全て復帰しました。 【ネットワーク停止について】 停止期間 : 12月25日(月)15:00 ~ 12月27日(水)14:00(予定) 【停電について】 停電日時 : 12月26日(火)8:0…
昨日の続きで、今回は Graph500 ベンチマークによる比較。SDPA では計算サーバ1と2では約2倍の性能差があったが、Graph500 では僅差となっている。 ○計算サーバ1 (1 CPU x 4 コア = 4 コア) CPU : Intel Core i7 2600 (3.40GHz / 8MB L3) Memory : 16GB …
◯ソフトウェア SDPA 7.4.0 + OpenBLAS 0.2.4 現在、停電のため研究室の全サーバが停止しているので、自宅のマシンで比較実験を行った。 ◯ソフトウェア SDPA 7.4.0 + OpenBLAS 0.2.4 ----------------------------------------------------------------------…
1:次世代ポストペタスパコンでの解決すべき課題 ○並列数の爆発的増大、不均質化、高密度化 ○記憶装置の多階層化・大容量化 ○アルゴリズム的、システム的に様々な解決すべき課題と困難が存在 2:大規模グラフ解析及び数理最適化システム ○緊急に取り組むべ…
以下の停電&ネットワーク停止はいよいよ本日からとなりました。メールサーバも Web サーバも全て停止します。 【ネットワーク停止について】 停止期間 : 12月25日(月)15:00 ~ 12月27日(水)14:00(予定) 【停電について】 停電日時…
SDPA の話題:SCM が Sparse な場合での、bMat の計算と bMat の Cholesky 分解では基本的にマルチスレッド計算の効果は出にくいとされているが、以下のように問題の規模がある程度大きいと効果が出てくることになる。この辺の工夫はまだ改善の余地が大きい…
Nexus 7 と Kindle Fire HD の両方を購入してみた。 明らかに Kindle Fire HD の方が優れているのは、以下のステレオスピーカーだけで、あとは総合的に見ると Nexus 7 の方が優れている。 ◯音響が悪いと、せっかくのHDコンテンツの楽しみも台無しに。Kindle …
2月2日(土)に「第8回戦略的高性能計算システム開発に関するワークショップ」が開催される予定です。システムソフトウェア分野の日米協力について議論が行われます。 第8回戦略的高性能計算システム開発に関するワークショップ 日時:2013年2月2日 (土) 10:00…
MPICH 3.0 がリリースされた。3.0 では MPI-3 (SC12で紹介されていた) がフルサポートされている。いろいろなマシンで試しているが、前のバージョン等との比較実験はまた後日行う予定となっている。 MPICH 3.0 released A new stable release of MPICH, 3.0,…
以下の SandyBridge-EP 32 コアマシンでの Graph500 の実行。median_TEPS 値自体は Intel Westmere-EX 40 コアマシンとあまり変わらないが、こちらの方が性能が安定している。 ---------------------------------------------------------------------- Para…
SDPA を用いた OpenBLAS と Intel MKL の比較について。MKL が性能面で上回る問題が増えている。 ◯ソフトウェア SDPA 7.4.0 + OpenBLAS 0.2.4 (or Intel MKL 13.0.1) ◯問題1:mcp2000-10.dat-s OpenBLAS 0.2.4 : 25.927s Intel MKL 13.0.1 : 22.445s ◯問題…
静音クーラーラックだそうです。詳しい仕組みは知らないのですが、前方のラックのドアを締めても冷却性が維持されるらしいです(部屋自体が涼しければOK)。それでも内部が暑くなる場合では、専用のエアコンを付けることもできるとか。現在、騒音が激しいサー…
3台のマシンの性能比較。比較的小さな問題なので、コア数が多くてもそれを使い切るのは難しい。 ◯ソフトウェア SDPA 7.4.0 + OpenBLAS 0.2.4 ---------------------------------------------------------------------------- ○問題1:theta6.dat-s gcc 4.4…
stream ベンチにはいろいろな評価があるのだが、これでメモリバンド幅を測定してみた(メモリバンド幅なので、Fusion-IO は無関係)。32コアで測定。今までいろいろばマシンで測定した中では最高の値が出ている。 ------------------------------------------…
結局 SSD は 600GB x 3 台が RAID で1ドライブとなっていた。Fusion-IO ドライブのフォーマットはこちらで行った。 Filesystem 1K-ブロック 使用 使用可 使用% マウント位置 /dev/sda2 103212320 14998432 82971008 16% / tmpfs 264639164 0 264639164 0% /…
今日、納品の予定。SSD は今日の時点では1台しか付いていないらしい。 Case+M/B Intel Lizard Head Pass Quad Xeon Server x 1 CPU Intel Xeon E5-4640 Xeon (8-core 2.40GHz 16MB cacheTDP:95w) x 4 Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16G…
12,13日と北大湊ERATOオフィス訪問中です(HOKKE-20にも参加中です)。12日はこちらのチームからの発表。13日はZDD 関係の講演と議論になります。 かなりの積雪がありまして、12月としてはこちらでも珍しいそうです。
以下の ERATOセミナー本日となりました。我々メンバーは北大で発表しますが、予定では東京、大阪、九州への TV 会議中継もあるそうです。 --------------------------------------------------------------------------------------------------------------…
AMD Opteron (Istanbul x 4way) マシンでの Graph500 結果。4-way で CPU 24 コアもありながら Median TEPS 値はたったの 1.898 である。これは以下のように CPU affinity が 1x24 になっていることにも原因がある。これを BIOS で 4x6 に変えれば性能が上が…
TSUBAME 2.0 に Intel Compiler と mvapich2 の新バージョンがインストールされている。 Intel Compiler : icc version 13.0.0 (gcc version 4.3.0 compatibility) mvapich2 : 1.8.1 これらを使うためには、以下のように環境変数を設定する必要がある。 expo…
Graph500 用プログラムの最新結果。以下の80コアマシン(HT)で最速の10GTEPS越え。というわけなので、SandyBridge の 4-way マシンにも期待。 ---------------------------------------------------------------------- Parallel Breadth-First Search f…
以下の論文が Optimization: A Journal of Mathematical Programming and Operations Research に掲載されました。足掛け4年で大変長かったです。初めに実験したときは SDPARA 7.3.1 を使いましたので(現在の最新版は 7.5.0-G)。 Convex optimization appr…
以下のように gcc 速い > Intel icc 遅い SandyBridge-EP 16 コアマシン 速い > Westmere-EX 40 コアマシン 遅い という関係になっている。というわけなので SandyBridge-EP 32 コアマシン(4-way)は性能的には期待できそうだ。 ◯ソフトウェア SDPA 7.4.0 + O…
現在5問解き終わっているが、各問題を解くときには以下のような実行時間の構成となっている。全体の実行時間(Main Loop)と ELEMENTS (SCM の計算:以下では Make bMat time) 及び CHOLESKY(SCM の Cholesky 分解:以下では Cholesky bMat) は以下の通りで、や…
毎年恒例ですが、年末に全館停電と電気関係の点検があります。それに伴いまして以下の日時は全てのサーバ等が停止します。27日の14時という復旧時間はあくまでも目安ですので、何かトラブルがあればさらに復旧は遅れます。 2012年12月25日(火)16:00 ~ 2012…
来週末までには以下のマシンが納入されるようです。学内で様々な問題があって発注等が遅れました。初めの価格よりは大分下がりましたが、かなり価格は高めになってます(特に Fusion-IO)。 Case+M/B Intel Lizard Head Pass Quad Xeon Server x 1 CPU Intel …
すでに本日となりましたが、ビジュアリゼーションカンファレンスが開催されます。すでに当日ということなので参加お申し込みの受付は終了しています。 日時 2012年12月3日(月)10:00~17:00 会場 タイム24ビル (東京都江東区青海)[アクセス] 主催 一般社…
Intel Compiler 13.0.1 に関して、以下の環境下での SDPARA 7.5.0 及び SDPARA 7.5.0-G の動作確認ができました。現在は TSUBAME 2.0 での動作確認を行います。 ◯コンパイラ:icc version 13.0.1 (Intel MKL ライブラリを含む) ◯ライブラリ: NVIDIA : CUDA …