GTX 680 の結果から Tesla K20 と GTX 780 の演算性能を予想

GTX680(GK104)を買うつもりは無かったのですが、アーキテクチャを見ていましたら単精度浮動少数演算がそっくりでしたので、ベンチマークすれば Tesla K20 や GTX 780 の演算性能が予想出来ると思い衝動買いしてしまいました。倍制度浮動少数は単精度の結果を1/3するだけなので簡単に予想出来ます。

購入したGTX680はクロック等がリファレンス設定の製品です。
OpenCL-Bench-2-GPU-A.png
結果、GTX680(GK104)は演算向けの設計ではないので一部を除いて Radeon HD7970(Tahiti) の方が圧倒的に高性能なのですが、GTX780と Tesla K20 の予想スコアは意図してスコアを操作した訳ではないのですが Radeon HD7970(Tahiti) と非常に拮抗している予想結果に成りました。但し同じ性能を遅れて出荷したのでは問題だと思いますので、もう少し高クロック設定で出荷に成るかもしれません。
クロック設定はチップ(GPU+DRAM)の消費電力とVRMの変換効率から300W枠内(歴代シングルGPU品は250W枠内)で決定すると思います。

以下、今回のベンチマークレギュレーションです。

OS:
 Windows 7 Pro/Enterprise/Ultimate 64Bit

ドライバ/ランタイム:
 Cataryst 12.8(HD4xxxのみ12.6)
 GeForce 306.23
 Quadro/Tesla 305.93
 Intel OpenCL runtime 2012 (SSE4.1搭載CPU)
 ※AMD製CPUはCataryst付属の最新AMD APPを利用
 ※上記に関わらずSSE4.1非搭載CPUはCataryst付属の最新AMD APPを利用

ベンチソフト:詳しくはこちらを参照下さい。
 LuxMark 2.0 64Bit 但し、題材をLuxBall HDR(Ver1.0と同じ題材)に変更して実行
 RatGPU 0.5.5b 64Bit
 nBody_CL(改)
 nQueen CL
 Sandra 2012 SP5c

ところで、Kepler世代のGPGPUでは、今までGPU内部でハード的に処理していたものを部分的にドライバ(つまりCPU)で処理する事でGPU側の負担をある程度削減していますので、CPUの性能次第でスコアも少し変化する可能性が有ります。
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR