Tesla C2070 の実力

Tesla C2070 が到着したので、まずは、いつものベンチで比較です。
OpenCL_BenchResult_GPU-AR-6-4.png

上の表をかいつまんで(各世代のハイエンドコアのみを選択)グラフ化したのが、コレです。
(Directcompute&OpenCL Benchmark 0.45の結果は除外しています。)
OpenCL_GPGPUT.png
総合的な絶対速度では、やはりGTX580が上でした。
Core i7 vs XEON と同様に、値段と速度は必ずしも一致しないという事ですね。

そして、Cayman と Cypress のランタイムを APP SDK 2.5 にすると、この様になります。
OpenCL_GPGPU-2.png

GTX580は不動の1番ですが、Tesla C2070 の位置付けが変わりました。
今回の記事は Tesla C2070 に付いて書いてる訳ですが、Cypressに若干負けてしまい、Caymanにも負けそうな感じです・・・

試しに基準をXEON E5450から、GPGPUの平均値に変えてグラフ化しますと、
OpenCL_GPGPU-AV100BASE.png

更に、まとめていたSandraの結果を細分化して、除外してあったDirectCompute&OpenCL0.45のOpenCLの測定値を追加してグラフ化しますと、
OpenCL_GPGPU-AV100BASE-DCOP.png

GTX 580 は癖があるものの基準を変えても不動の1番ですね。
Tesla C2070 と Radeon HD 5870/6970 の順位は微妙で、基準を変えると簡単に逆転・・・
(忘れていたのですが、Radeon HD 6970 には標準装備としてROM切り替えのディップスイッチが有るという事を思い出しました。後ほどROMを切り替えて計測した値を追記し、グラフ化したいと思います。スイッチで切り替わるROMは書き換え可能な物と、デフォルト固定という違いしかなく、オーバークロックは筆者のポリシーに反しますのでROM改造でオーバークロックするのは止めておきます)

そして更に数字のマジックですが、GTX580を基準にグラフを再構築しますと、この様に差がグンと縮まります。
GTX580BASE_GPGPU.png


とは言え、先ほども書きましたが、Tesla C2070 には速度だけでは測れない重要な機能が盛り込まれています。

その一つがコレ、Tesla C2070 では、サーバ/ワークステーションのメインメモリでは一般的なECCの機能が利用出来る様になっています。
TeslaECC.png
冒頭の表を見て頂けると判るのですが、ECCを利用しますと極僅かですが速度低下がみられます。

それと、Tesla C2070 は負荷に連動するかの様にファンが高回転に成りまして、ベンチマーク中は爆音・・・というかサーバールームに居る時の音がします。なんだか懐かしい感じがしました。GTX580は温度に連動してファン回転数が上昇している様で、かつ騒音を気にしてか?控えめな回転ですが、Tesla C2070 のファンは、ベンチ実行で即MAX回転しはじめます。GF100ベースと言う事も関係しているのかもしれませんが、Tesla C2070 のファン回転はGPUの冷却を最優先し、高温時に発生する可能性のあるハード的な演算ミスや半導体の劣化を防止し、正確性や耐久性を重視しているのだと思われます。

そして、こちらは個々のコア単体でのクロックあたり性能比較です。
OpenCL_GPGPUT_ONECORE.png

nVidia製品は、コアクロックとシェーダークロックが異なり、CUDA-Core自体に供給されるクロックはシェーダークロックですから、シェーダークロックを基準にしてグラフを修正すると、この様になります。
OpenCL_GPGPUT2_ONECORE.png

やはりというか当然ですが、GF100ベースのTesla C2070 と GF110 ベースの GTX580 では、CUDAコア単体の性能で見ると、全くと言って良いほど同一の結果・傾向です。強いて書くとするならばGTX580はGF100->GF110での僅かな改良によると思われRatGPUのスコアが若干上がっている様ですが、対してTesla C2070は倍精度浮動少数点のリミッターが解除されている為、相殺されて全体として同程度のスコアになっているのだと思います。

最後に、コストパフォーマンスを比較してみたいと思います。
OpenCL_GPGPU-CostP.png
民生品と業務用の購入代金ベースでのコストパフォーマンス比較は、まぁ、こんなもんでしょうね。

価格性能比が世代を追って向上している事と、そこから派生するミドル~ローエンド品の低価格&高性能化が達成されているであろう事が容易に想像できます。

業務用パーツの価格に現れないメリットの一つとして、長期間の供給が挙げられると思います。民生品は発売から1年経たずに在庫限りで供給停止されたりしますが、業務用は保守(修理)用として長期に渡り継続して供給される為、万が一壊れても、ソフトウエアやデータをそのままに部品交換のみで長期継続利用出来ますが、民生品は壊れたら全てが終了(製作したソフトや、溜まったデータが全て使えない)という事も有り得ます・・・

さて、くどいようですが、Tesla C2070 の記事なので、最後に・・・
Tesla C2070 は、OpenCLにおいて、XEON E5450 の 約5倍のコストパフォーマンスと言えそうです。


 
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR