OpenCLベンチ #4

以前の記事で紹介しましたOpenCLの各種ベンチマークに付いて、測定条件などを可能な限り統一してIntel OpenCL SDK Alpha版などの実装系も盛り込み、比較表を充実させてみました。

測定条件

OS
 基本的に Windows7 64/32 SP1 を利用
 ライセンスの関係で11号機と12号機の32Bit環境のみVista32を利用
 ドライバの互換性問題で6号機のみXPを利用

nVidia GPUドライバ
 266.58

AMD/ATI GPUドライバ
 Catalyst 11.3
 ATI Stream SDK 2.3
 但し7号機はAGP-HotFix 11.1を利用しました。
 また、PCI版HD4350は製造元の配布するドライバでしか動作しませんでした。

AMD CPUで利用するOpenCLランタイム
 ATI Stream SDK 2.3
 AMD Accelerated Parallel Processing SDK 2.4(比較用)

Intel CPUで利用するOpenCLランタイム
 ATI Stream SDK 2.3
 AMD Accelerated Parallel Processing SDK 2.4(比較用)
 Intel OpenCL SDK Alpha 1.1.0.10515
 ※Intelの実装はCore2世代以降にしかインストール出来ず14号機は駄目でした。
 ※AMDの実装はSSE2に対応したCPUであればインストール&実行が出来ます。

GPUの結果一覧(赤字が最高値)
oclb-gpu5.jpg
2011/04/26:GTX580のデータ追加

CPUの結果一覧(赤字が最高値)
ocl-cpu5.png

予断ですが・・・

筆者がGTX580を今まで入手しなかった最大の理由はGPGPUの機能がスポイルされている為で、GF110のTeslaが未だ登場していない為でもあります。(2011/04/26、結局はGTX580を1個だけですが買ってしまいましたorz)
とは言え、筆者の様に趣味でやろうというのにTeslaではまさに宝の持ち腐れ(現時点でもそうかもしれませんがw)ですが、それでも、GTX580は倍精度浮動少数の性能がTeslaの半分しか出ないとか、GTX580は演算誤差が意図的に大きくされていて科学技術演算では使い物にならず、逆にTeslaは高度な演算向けにチューニングされている(そういう意味ではGTX285と旧世代Teslaも同じですが)や、他にTeslaはECC搭載で信頼性も高いといった情報を目にする度に、GTX580がどうしても子供向けの玩具に見えてきてしまうという事情が有ります。まぁ実際ゲーム向けですから玩具といえばそうなんでしょうが・・・

では、同じGPUコアのQuadroとTeslaではどうかと言いますと、演算性能自体に差は無い様です。両者ともECCも利用可能です。
値段的にも同程度ですので、QuadroとTeslaなら、OpenGLも使えるQuadroの方が良いじゃないか?と思いがちですが、Teslaは戻り方向のDMAが搭載されているという大きな違いが有る様です。つまりGeForceやQuadroは描画主体な為にDMAが1つしか搭載されておらず、演算結果をCPUに戻す必要の有るGPGPUに特化したTeslaはDMAを2つ搭載しているという事で、DMAを2個搭載するという事は、簡単に言うと双方向データ転送帯域が約倍に成ると言う事です。

つまり、まとめますと、
GeForce = 倍精度演算性能が本来の半分、演算誤差大、DMAは1個、DirectX
Quadro = 倍精度演算性能は本来の性能、演算誤差小、DMAは1個、OpenGL
Testa  = 倍精度演算性能は本来の性能、演算誤差小、DMAは2個
いい商売してますなぁ・・・

という事で、趣味なのでGTX580で良いかなぁ・・・けどGF110のQuadroが近日発売になったらまた迷いますが・・・
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR