2014 ハイエンドGPUまとめ

Radeon HD 7970 (Tahiti XT) を手にしてから概ね2年くらい活動していませんでしたが、その間にハイエンドGPUがどうなっていたかを少し調べてみました。

2014HIGHENDGPGPU4.png
※Hawaii XTのR9-290Xは1/8ではなく1/4で倍精度1.4TFLOPSかもしれません、フルスペック(FirePro)は1/2で2TFLOPS以上です。
※GTX 780 Tiの単・倍比は1/10ではなく1/24で倍精度0.2TFLOPSかもしれません。
※GTX Titan Blackの単・倍比は1/4ではなく1/3で倍精度1.7TFLOPSかもしれません。

2年前の様に、自分でハイエンドグラボやTeslaやQuadroなどを2~3台づつ購入して複数のベンチマークで計測して・・・という様な作業を今はしていない為、この表に書いてある内容は自分で実際に確かめた値ではありません。従ってソース元に間違いがある場合、そのまま間違いを転載している可能性があります。 この表に書いてあり筆者が実物を持っていて実測可能なGPUは冒頭にも書きましたがRadeon HD 7970 (Tahiti XT) のみです。

結論から言うと、浦島太郎の様な状態になっているかと思いきや、2年間、両社ともリネームを繰り返している様で、あまり変化が無くホッとした半面、進展がない事に不安でもあります。GPGPUの演算性能で言えば Radeon R9-290X の圧倒的な性能と控えめな価格が光り輝いて見えますGeForce同様に倍精度演算の性能を落としている様で非常に残念です。

それと、市場(つまり消費者)が日本から支那(China)へ移っているのをヒシヒシと感じました。日本はハイエンドよりもモバイルでスタイリッシュに・・・という方向に向かっている様で、逆に、華僑などはデータマイニングとかビットキャッシュ集めとかにRadeonを大量投入している様でハイエンドGPU市場の一角を形成しているのではないかと思います。

て事で倍精度演算はコスパで言うとR9-290辺り、接地面積というか密度的にはR9-295Xでしょうか。読者の方に教えて頂きましたが、どうやらRadeonもGeForce同様に差別化を始めた様でR9-290Xは倍精度が1/2ではなく1/8に性能ダウンさせられている様です・・・て知らなかったのは筆者だけかもしれず2年にわたるブランクの影響がこんな所に出てきました。といいますか私が思い描いていたR9-290Xの魅力が一気にげんなりです。せめて1/3とか頑張っても1/4くらいには留めて欲しかったですね。これじゃTahitiの方が性能高いですよ?つまりTahitiが買いかも?R9-280などはどうなんでしょうね?TITANの様な倍精度有効バージョンがHawaiiにも登場すると願いたいです。

Quadro K6000 は恐らく倍精度演算を1/4以下にしていると思われ、たぶん描画性能にフォーカスする為に消費電力の高いnVidiaの倍精度演算機ですから、その部分だけ性能を少し落とす設定にしたのでしょう。どこかにSandora2013のCUDAかOpenCLスコアが有ればはっきりしそうです。Fermi世代のQuadroにはTITAN同様に倍精度演算ONの設定と描画重視の設定とがありますがKepler世代はどうなんでしょうね?

GTX TITAN は TESLA と同じ演算性能だと思っていましたが倍精度の性能を 1/4 にパワーダウンしてある様で少し残念です。もしくはGK110が1/4でGK110Bが1/3なのか?それとも倍精度演算をONにした時だけクロックダウンするのでしたか?<-調べてから書けよと自分でツッコミ

TESLA K80 は明らかに Hawaii (具体的には FirePro W9100/S9100) に対抗する為に急遽製造された事が判ります。仕様的に無理があるし発売と同時に K40 を価格改定するらしいですし、フルスペックは未だ出せない様ですし・・・

筆者的な注目は、なんと言っても GK210 のフルスペック版 GTX TITAN とでもいう製品が登場するか?という事と GM210 の登場時期です。それにR9-290Xの倍精度有効化版Radeonですね。 GK110 と GK210 は G80 に対する G92b の様なものだろうと思います。しかし GK210 を出荷してしまうと GM210 があまり光らないのかもしれず、けれども GM210 がなかなか完成しないので AMD への対抗措置として GK210 を温存しているのか?もしくは単に工場の稼働率とか歩留まりとかスケジュール的な問題なのかもですが・・・

PEZY-SC Quad も気になります。

余談ですが・・・
最近、筆者は中国地方へ毎月の様に行くのですが中華人民共和国や中華民国の事を中国と呼ぶ事に抵抗を感じる様になりました。中国と言えば元々は日本国の特定地域を指す呼称です。中華人民共和国や中華民国は日本に占領され中国地方の一部に統合されたのでしょうか?そんな事はありませんよね。日本に元々ある中国に統合された訳ではないのですから中国という呼称に抵抗感があります。それに海外の人は皆様がChinaと呼びますがカタカナ風に書くとシナと呼んでいます。つまり支那です。戦前も支那でした。もし支那という呼称を侮蔑と思うなら、中国というほうが支那よりも更に侮蔑・・・というか日本の1地域を呼称する中国という地方に統合されてしまったかの様な、中国という呼び方のほうがよっぽど侮蔑していると思うのです。もし敬意を込めて呼ぶのであれば大中華・・・けどまぁ大って付けると大日本帝国の様に周辺諸国を占領・統合してゆく今の時代にはそぐわない極悪非道の帝国主義を連想してしまうでしょうから、大を付けづに中華という華々しい呼称にするのが良いと思うのです。
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

No title

K6200って出るんでしょうね。
おひょひょひょひょ。

軽自動車が変えますね。

No title

https://en.wikipedia.org/wiki/AMD_Radeon_Rx_200_Series
こちらを見ると290Xの倍精度は1/8の704TFLOPSようですが、
1/2に制限を解除する方法があるのでしょうか。

Re: No title

> K6200って出るんでしょうね。

タイミングとか工場のキャパとかによるんでしょうね・・・

Re: No title

> https://en.wikipedia.org/wiki/AMD_Radeon_Rx_200_Series
> こちらを見ると290Xの倍精度は1/8の704TFLOPSようですが、
> 1/2に制限を解除する方法があるのでしょうか。

すみません、4亀に掲載されてた発表時?のスライド資料かなにかに記載されていた数字をそのまま書いてしまいました。いつの間にか1/8に性能ダウンさせられていたのですね・・・

No title

中華人民共和国ですが、経済力を背景に帝国主義的な
発想を全開しそうな勢いですよ。
本質的に、この国は朱子学や羈縻政策を持ち、ある意味
日本以上に差別的な思想感かもしれんと思うのです。

No title

ところで、SLIの意義って今となっては何なんでしょう?
私個人はシングルディスプレイでadobeソフトをフレーム
レンダリングで高速化を目的にしているのですが、こういう
使い方は一般的ではないと思うのですよ。

一般的には
1.Telsaを使って並列処理を高速化する。
2.Mosaicを使ってマルチディスプレイをシンクロして表示する

というようになっているのではないかと思うのです。

Re: No title

> ところで、SLIの意義って今となっては何なんでしょう?

やっぱりMosaicですね。
特にマルチディスプレイの私にとっては・・・
あとまぁ、現時点では4KのディスプレイなんかもMosaicしてないと制限される様です。

No title

Kの就かないQuadroって4Kに対応していないのでしょうね?
解像度では不可能ですが、SLIなら可能なのかな?

Re: No title

> Kの就かないQuadroって4Kに対応していないのでしょうね?
> 解像度では不可能ですが、SLIなら可能なのかな?

確か、以前から4Kに対応していたと思います。写真などを扱う場面で重要なのでは?と思っていましたが、私自身は4Kは未だ必要性を感じてませので、あまり覚えてないです。HD解像度で満足してますし、4枚あれば充分です。

4Kディスプレイ50~60インチを横に3枚並べて全視界立体モニタが出来たら楽しそうと思う反面、づっとそれは疲れると思うのですよね

No title

ここで書くことでは無いかもしれませんが

DualなOpteronが完全に壊れました。これを機にマザーを
取っ替えようとDualで、SLIが可能なATXのマザーってOpteronは
おろか、Xeonにも無いことが解って、UPだけどC606のマザーに
取り替えました。
(とは言ってもQuadroSLIはダメですが)

メモコン内蔵のCPUになり、pin数が増えたのでATXでは
収まらなくなったのでしょう。

企業のみならず、個人でも昔のように、データ管理をワーク
ステーションでなく、サーバ管理となると多少高くても、メーカー製を買った方が都合が良いのかもしれません。

Re: No title

> メモコン内蔵のCPUになり、pin数が増えたのでATXでは
> 収まらなくなったのでしょう。

物理形状としてはGPU双発でもATXに収める事は一応出来てる様です

Z10PA-D8C
http://www.asus.com/Commercial_Servers_Workstations/Z10PAD8C/

SLI認証を取得してないだけ・・・
てか、これWS用マザーとしてSLI認証付けて売ればよいのにと思いますけどね

> 企業のみならず、個人でも昔のように、データ管理をワーク
> ステーションでなく、サーバ管理となると

私はクラウドとローカルストレージを使い分けてます。

自宅の個人サーバはLinuxを入れたノートPCです。

ノートPCを個人サーバにする利点は、UPS付きと同じで停電に強い事と、省電力、緊急時に簡単に持ち出せる等々個人でサーバを作るのに適した機器だからです。もちろん大容量データをノートPCで管理するのは難しいですが、そういった普段アクセスしないアーカイブ的な大容量データはUSB3.0接続のHDDにしています。

No title

GM200が出たので見直したら倍精度で気なる所があります。

https://en.wikipedia.org/wiki/GeForce_700_series
GTX 780 Tiは1/24の0.21TFLOPS、Titan Blackは1/3の1.7TFLOPSとなっており、4gamerで

>DPをフルスピードモードにした状態では,GPU Boost 2.0が無効化され,GPUコアクロックが836MHzで固定されていたからである。
http://www.4gamer.net/games/204/G020420/20130220002/

>倍精度を要求するアプリは,一般的にワークロードの負荷が大きく,温度と電力によって動作クロックが制限される。
http://www.4gamer.net/games/204/G020420/20140429001/

このことからGPU Boostが有効になる単精度と、GPU Boostが無効になる倍精度のため、この表のTTITAN BLACKの倍精度が1.3FLOPSで1/4なのは誤りだと思います。

Re: No title

> >倍精度を要求するアプリは,一般的にワークロードの負荷が大きく,温度と電力によって動作クロックが制限される。
> http://www.4gamer.net/games/204/G020420/20140429001/

これでしょう。
http://dualsocketworld.blog134.fc2.com/blog-entry-328.html

No title

>これでしょう。
>http://dualsocketworld.blog134.fc2.com/blog-entry-328.html

申し訳ございません。私の言いたい内容が混ざってうまく伝えられなかったようです。
単純に数字の表記ミスを後述のようにに直して欲しかっただけです。

GTX 780 Tiの単・倍比1/10 → 1/24、倍精度 0.5TFLOPS → 0.2TFLOPS
GTX Titan Blackの単・倍比1/4 → 1/3、倍精度 1.3TFLOPS → 1.7TFLOPS

Re: No title

ご指摘、ありがとう御座います。

> 単純に数字の表記ミスを後述のようにに直して欲しかっただけです。
>
> GTX 780 Tiの単・倍比1/10 → 1/24、倍精度 0.5TFLOPS → 0.2TFLOPS
> GTX Titan Blackの単・倍比1/4 → 1/3、倍精度 1.3TFLOPS → 1.7TFLOPS

貴方様が示しました数値は、wikiと4Gamerだと思いますが、この情報はnVidiaによる公式発表や実物の性能と同じでしょうか?

私も、いくつかのソースを元に表を書いていますが、私が元にしているソース自体が間違っている事が多々あります。
ドライバのバージョンや設定などで変わるかもしれません。実際、そういった経験も有ります。
推測値は色を変えて注釈付きで掲載する様にしていますが、色を変え忘れている事はあるかもしれません。

2年前までは、ハイエンドグラボを2~3個づつ私が自費購入してベンチマークなどして実証実験をしていたのですが、この記事に書いています通り、2年間ほどお休みしておりまして、今は実証実験などをしていません。

繰り返しになりますが、私の情報もメディアやWiki情報を元にしています。
しかし、私が転載する際にうつし間違えた可能性もありますし、逆も然り。
ドライバのバージョンが変わった事により、途中から変わった可能性もあるかもしれません。

何が真実なんでしょうね?
Wikiですか?それとも4Gamer?

やっぱりnVidiaの公式見解と実物による実測とを照らし合わせてみたいですね~

No title

>ドライバのバージョンが変わった事により、途中から変わった可能性もあるかもしれません。

>何が真実なんでしょうね?
>Wikiですか?それとも4Gamer?

>やっぱりnVidiaの公式見解と実物による実測とを照らし合わせてみたいですね~

そういうことでしたか。長々とお付き合いさせてすみませんでした。

Re: No title

> そういうことでしたか。長々とお付き合いさせてすみませんでした。

いえいえ

Wikiは以前から言われてますが、いまだに信頼性が高い情報だと思われガチですが、結構間違いが散見されます。
そう思いながらも参考にしますがね(藁

4Gamerは、私がゲーマーではない為にそもそもあまり見てませんが、あそこの記者はいつもゲーマー視点の独特な評価基準で記事書いてますから、いやそれ違うだろ!とツッコミ入れたくなる記載が多いです。まぁゲーマー向けのサイトなのでゲーマー視点で記事書くのは至極当然なんで、従って私はあんまり見てないのです。
プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR