Quadro 4000 の実力と、Tesla C2090 の予測と、AMD APP SDK 2.5 RC2

15号機用に買ったQuadro4000が到着した事と、AMD APP SDKの最新版 2.5(RC2) が出た事と併せて、GPGPU性能(OpenCL)の比較表を更新しました。

比較には、以前の記事で紹介しましたOpenCLベンチマークを利用しています。

画像をクリックすると拡大します。(最高値を示した欄を赤くしてあります)
OpenCL_BenchResult_GPU-AR-6.png
画像をクリックすると拡大します。(最高値を示した欄を赤くしてあります)


 まず、懸案だった GTX580 の倍精度浮動少数点演算性能ですが、今回Quadro4000の結果を見て、やはり意図的にスポイルされている事を示唆する結果となりました。
 Quadro 4000 は GTX480/580 と同アーキテクチャ/同一コアで、コア数半分、クロックが60%に落とされた製品ですが、上記の表の通り、倍精度浮動少数点演算以外の項目は全てコア数比/クロック比通りの値が出ているのに対し、倍精度浮動少数点演算のみGTX580とQuadro4000がほぼ同一の結果に成っています。これをコア数/クロックともにフルスペックまで向上した場合の予測結果(Tesla C2090の予測値)はCaymanを上回るものに成ります。

 次に、Caymanですが、出荷当初のドライバでは1世代前のCypressに劣る結果が多かったのですが、ドライバが枯れてきた結果として性能が向上してきた様です。とは言え最新ドライバでCypressは未計測なので未だ断言できませんが・・・
 Cayman + APP SDK 2.5 での DirectConpute の結果が異常に高いのは目を疑いましたが、何度計測してもこの程度の結果に成ります。LuxMarkでも倍近くの向上が有るのに驚きです。但し浮動少数点演算の単精度の結果が悪くなったのは残念です。とは言え未だRC2ですから今後が楽しみです。

 今筆者が興味が有るのは、FireProシリーズのGPGPU性能がRadeonHDに対して、どの様に違うのか?という点と、ECC対応に付いてです。
 それと、今回残念だったのは、Quadro4000の演算誤差が許容範囲外だった事です。単にベンチマーク側の問題という可能性も有り得ますが・・・
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR