nBody ベンチマークプログラムの改造?

以前このブログ記事でご紹介させて頂きました、N体シミュレーションを使ったベンチマークソフトですが、作者の方から連絡を頂きまして複数GPU(主にAMD製と2世代以上前のnVidia製)を搭載したPCでベンチマークスコアが正しく表示されないケースが有る事に気付きまして、デバッグとプログラム修正を提案させて頂きましたところ、お手伝いする事になりました。

とりあえず、問題だった複数GPUでのスコアですが、同種のGPUに限っては何とか解決出来まして、ついでに画面左上にカーネルの種類と測定したデバイスの情報、右下に私のハンドルネームとブログURLを表示させて頂きました。
n-Body_HD7970-2GPU-d.jpg

元のプログラムがきれいに書いてありましたので、ピンポイントで数行追加/修正すれば同種のGPUでの複数GPUの件は解決でした。
異種混合複数GPUへの対応は、テスト中です。

ところで、こんな感じでパラメタを変えると簡単に 4TFLOPS を超えるスコアが出る訳ですが、
N-Body-Tahiti-2GPU-b32-local.jpg
※コマンドラインオプション "-kernel local -b 32" で起動

GPUを2枚増やしてOverClockすれば個人のPCで 10 TFLOPS を簡単に超えられそうですね。
10 TFLOPS と言えば、10,000,000,000,000 FLOPS ですから、実に1秒間に10兆回の浮動少数点演算をした事に成ります・・・
現時点で世界最速スパコンの「京」は10PFLOPS=1京FLOPSらしいですから、ちょうど1/1000の性能という事に成り、数字のみで単純比較は出来ませんが、金額や消費電力や占有面積などを考えると、なかなか凄い性能が出てますね。
もしLINPACKを実行したら、どの程度のスコアに成るんでしょう・・・
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR