PCI-Express 3.0 (Gen3) が今ひとつ不調な理由

結論から言うとIntelさんがコントロールしているみたいです。

昨年のIDF 2011 でPCI-SIGのチェアマンより発表が有りコンシューマ向けGen3は立ち上がらない宣言をしています。

PCI-SIGとはPCIやPCI-Express関連の規格を制定している団体です。

要約するとnVidiaとAMDがGen3世代でGPU用に電源強化をしたいとPCI-SIGに打診したところ断固拒否されてしまった様で、(記事を最後まで読んで頂けると判ると思いますが) つまり、これ以上強力なGPUはIntel(例えばXEON Phi)にとって脅威になる為、阻止したのだと思います。

メディアが報じない理由は単純明快で、メディアの客は視聴者や購読者ではなく広告主だという事にそろそろ気付くべきです。メディアの役割は視聴者や読者を広告主の印象が良くなる方向へ心理誘導する事=広告が全てな訳ですから、巨大広告主のイメージを悪くする報道は出来ません。

話がそれましたが、これにキレたnVidiaとAMDがGen3対応に消極的になっているというか、既に製品レベルに到達していて後は出荷タイミングを待つばかりだった次世代ハイエンドGPU(具体的にはGK100やTahiti)を電力制限された為に本来の性能で出荷する事が出来なくなってしまい、その結果Gen3対応の必要性がなくなってしまったのだと思います。

とあるスパコン技術者(ハードウエアアーキテクト)がIntelではなくnVidiaを選んだ理由を読んだ事が有りますが、その仕返しじゃないかと思うような水面下でのネチネチした戦いに思えます。つまりIntelさんを怒らせちゃったんじゃないかと?

ちなみにPCI-SIGは独立団体ですが、設立経緯からIntelが主導権を握っています。

nVidia の Kepler 世代で本来のハイエンドGPUである GK100 の発売が見送られた事や、その後に控えたシュリンク版の GK110 でさえ GeForce としての登場が危ぶまれているのは、この電力制限が大きな理由ではないかと思いますし、要求内容から推察すると最大性能を引き出すには恐らく350W~450Wくらいの消費電力に成るのだと思います。シュリンク版の GK110 は Tesla K20 として発売予定ですが、潜在性能が倍精度2TFLOPSであるにも関わらず、その半分の倍精度1TFLOPSの製品に成る予定なのは電力制限された為と考えるのが自然ではないでしょうか?
つまり、電源を制限されなければ350~450Wで2TFLOPS出せるけど、電源を300W(事実上250W程度)以下に制限されてしまったので1TFLOPSしか出せない、その結果 XEON Phi と横並び(しかもワット辺り性能では若干低い)性能しか出せないという状況を意図的に作り出されてしまったのではと思います。

先行発売された AMD Tahiti (Radeon HD7970) が倍精度1TFLOPSにギリギリ達しなかった(しかもOC耐性が非常に高く電源強化で簡単に1TFLOPSを超えられるが超える製品にはしなかった) 理由もここにありそうです。
AMD Tahiti (Radeon HD7970) の最大消費電力は250Wですが、事実上の上限である240VA規制のマージン(もしかしたら240VA規制 + 9.9W(3.3V) ≒ 250W なのかも?)まで使い切った250Wを最大値にしている事からも明らかです。

過去に250Wを超えるGPUが無かったかと言うと、歴代を見ても下記の通りキッチリ250Wを上限としています。
 GTX280(GT200) 236W
 GTX285(GT200b)204W
 GTX480(GF100) 250W
 GTX580(GF110) 244W
 GTX680(GK104) 195W
 HD5870(Cypress)188W
 HD6970(Cayman)250W
 HD7970(Tahiti)250W

但し2GPU搭載品は余裕で規格上限の300Wさえ超えてるのも有ります・・・
 GTX295(GT200b x2) 289W
 GTX590(GF110 x2) 365W
 GTX690(GK104 x2) 300W (実は375W品か?…後述します)
 HD5970(Cypress x2)294W
 HD6990(Cayman x2) 375W

Gen3規格の電力供給上限は下記の合計です(8Pin x2本は規格外で非公認です)。
 PCI-Express 6Pin Power 12V x 6.25A = 75W
 PCI-Express 8Pin Power 12V x 12.5A = 150W
 PCI-Express x16 Slot  12V x 5.5A = 66W
 PCI-Express x16 Slot  3.3V x 3A = 9.9W
 合計 300W

Gen3カード電力仕様(出典:PCI-SIG PCIe Electromechanical Updates)
 6-Pin 1本 = 最大150W (75W + 66W + 9.9W[3.3V])
 6-Pin 2本 = 最大225W (75W × 2 + 66W + 9.9W[3.3V])
 8-Pin 1本 = 最大225W (150W + 66W + 9.9W[3.3V])
 6 + 8 Pin = 最大300W (75W + 150W + 66W + 9.9W[3.3V])
 8-Pin 2本 = 未定義/非公認

Gen3カード物理仕様(出典:PCI-SIG PCIe Electromechanical Updates)
 ~150W = 最大幅1スロット
 150W~225W = 最大幅2スロット
 225W~300W = 最大幅3スロット

GTX690は仕様的には300Wですが8Pinコネクタが2本あります。変ですよね?
これはGTX690のGPU Boostにより8Pinコネクタを2本挿すと自動的にOverClockして300W枠を超えるという玉虫色仕様に起因している様です。つまりPCI-SIGによるGen3仕様通り6Pin+8Pinを挿すと300W枠をPowerTargetとして300W枠内で動作するけれどもユーザーが間違って8Pin×2本を挿してしまうとPowerTargetが375Wに変更されてしまいGPU Boostによって自動的にOverClockされてしまう=実は375Wの製品を300Wと言い張ってPCI-SIGの監視を潜り抜ける仕様だった様で、今後のハイエンドでは同様の手法が多く採用されると思われます。
もちろん個々のメーカによる味付け設定やドライバ次第な面もあるとは思いますが・・・

※:但し240VA規制により12Vが複数系統に別れている電源も多く、1系統で250Wを超える電源は最近まで極少数でした。その為に事実上は250Wを上限にしないと動作不良の原因に成りそうです。

※:2GPUのグラボは6Pinと8Pinの補助電源が一般的ですが、そういった製品では6Pinと8Pinが個別に個々のGPUに接続される仕組みが多い様で、12Vが別系統でも動作する可能性が有りそうです。つまり8Pin側がGPU1とFANやブリッジの電源に成り、6Pin側がGPU2の電源にと言う様に基板上で別配線に成っていて12Vが別系統でも問題なく動作する様に考慮されている製品が有る様です。しかし、この様な配慮が必ずされているといった保障は無く、1系統で300W以上を供給可能な電源を選択するに越したことは無いと思われます。

※:少し話が外れますが、6Pinコネクタ製造元のMolexが公開しているデータシートによりますと、1Pin辺り9~13A(Molex 39-01-2060 が 13A で 45559-0002 は 9A)までOKですから 12V × 13A ≒ 150W つまり±往復の 2Pin で 150W まで可能で 6Pin 有れば450W(9A品でも300W)まで本当は大丈夫なはずなんです。それを規格で75Wや150Wなどの上限設定して性能をコントロールしている訳です。下図を見ても判りますが6Pinと8Pinはともに+12Vの黄色ラインが3線ですからコネクタの物理的な上限は同じ容量です。

Gen3補助電源ピンアサイン(出典:PCI-SIG PCIe Electromechanical Updates)
PIN-PCIe12V.png
※規格上は8Pinの凹コネクタに6Pinの凸コネクタを挿す行為はOKの様で、その場合カード側で75W判定して適切に動作する様に4番ピンと6番ピンが定義されている様です。
※8Pinコネクタの型番は2008年3月時点のPCI Express 225W/300W High Power Card Electromechanical Specification Revision 1.0には記載が無く型番の代わりに図面で寸法と材質が細かく定義されていました。8Pinコネクタ形状と6Pin+2Pinコネクタ形状の図面が詳細に記されているのみで型番やメーカの指定はありません。今のところ個人で8Pinコネクタを入手する方法は既製品(電源、変換ケーブル、グラボ付属品等)を購入する以外に思い付きません[8-Pin PCI-Express Power Female Connector]で検索すると沢山ありました。外観が凸なのにFemaleなの?とも思いますが金属端子が凹形なので…紛らわしいですね。

冒頭の記事に書いてありましたが PCI-Expressの8Pin×2(375W)や8Pin×2+6Pin(450W)仕様はPCI-SIG的には非公認で「絶対に認めない」存在らしく、現存する製品の追認要求さえ却下された様ですから、HD7990がなかなか登場しない理由もこれかもしれませんね。ていうかコレですね。
規格外の製品を作ると、規格団体から注意勧告されたり最悪は排除されかねません。

GTX680のリファレンス基板は8Pin+6Pin×2仕様ですが、少しでも面積を削りたい中でこの違和感のある基板パターンが何かを物語っている様に思えてなりません。例えば8Pin×2+6Pinで400W仕様のGK100用に特注で大量にMolexに発注していた8Pin+6Pin立体コネクタの行き場が無くなってしまったから・・・とか。

しかし電力制限に対する納得のいく説明は無いでしょう。
取って付けた様な曖昧な理由ばかりで「メカニカル的な強度に無理が生じてくる」とか「システム内部への排熱が」の様に、もっともらしく聞こえても具体的な数値の提示が無く漠然と電力のみ300Wを上限にして一歩も譲らなのです。

話が若干それましたが、つまり倍精度1TFLOPS超えを1チップで始めて達成する歴史を刻むのは Intel であり XEON Phi でなければならないという政治的圧力の下に、PCI-SIGによる電力制限によってGPGPUの性能を制限するという姑息な手段で他社のハイエンドGPGPUを潰そうとした・・・というか実際にGK100は潰されたのではないかというのが筆者の予想です。

XEON Phi が 倍精度1TFLOPS を世界初達成として発表されたのが今年6月後半ですが、しかし XEON Phi の発表以前に HD7970 は 1TFLOPS を余裕で達成する余力を備えていましたが全く発表していませんしギリギリ到達しない「設定」でXEON Phi発表以前に既に発売されていました。しかも XEON Phi の発表直後に HD7970 GHzエディションとして再発売されて、ひっそりと倍精度1TFLOPSを僅かに超える「再設定」で再発売されました。発表と発売の違いからも判る様にAMDにはスケジュール的に余裕が有ります。
4年前の2008年に単精度1TFLOPSを始めて達成したのがHD4850でしたが、当時は大々的に1TFLOPS達成を前面に宣伝しまくっていたのが今回と対照的です。

GK100は2TFLOPSが脅威認定されて潰され、Tahitiは政治的談合でPhiに道を譲って難を逃れ発売に漕ぎ着けた・・・

コントロールされてなければ、3社が横並びの倍精度1TFLOPSに成る訳が無く、Intelの政治的圧力によって演出された談合的1TFLOPS制限と言えるのではないでしょうか?

Sandy-E の Core i7 が Gen2 のまま発売されたのが記憶に新しいですが、これとも関連しているかもしれません。

対して同じコアを使った Sandy-EP の XEON E5-2600 系は発売当初から Gen3 でしたが、こちらはコンシューマ向けではなくエンプラ向けでありInfinibandや40Gb-EthernetなどGen3を本来の意味で欲しているユーザからの要望が強いと思われます。PCI-SIG会長も「コンシューマ向けGen3は立ち上がらない」と云っている様にエンプラ向けGen3は粛々と立ち上げてゆくのだと思います。

PCI-SIG会長が「絶対にない」と言い切った規格上の電源強化は、今後のGPU発展の上での大きな足枷となりそうです。

そしてIntelはCPU内蔵GPUと、XEON Phiの両面から後付GPUの排除を粛々と進めてゆくのだと思います。

XEON Phi が XEON の CPUソケットに刺さる形で提供される方向だった事も、これらと合わせて考えると非常に整合性が取れた流れが見えてきます。つまりCPUソケットへの電源強化はOKだけれどもPCI-Express接続の電源強化はさせない = Intel XEON Phi の強化はOKで、nVidia Tesla の強化は駄目よと・・・

加えて IvyBridge で一定の効果を確認できた3D構造による省電力化でIntelに有利な舞台が出来上がったうえで他社(電力制限付き)との対決が待っています。

勝敗は戦いの前に決していると言われますが、逆を言えばそれだけGPGPUが脅威だという事です。
上から電力制限で最大性能を押さえつけ、下から省電力(XEON Phiは150Wで1TFLOPSらしい)で攻める。
戦いの王道としては間違いではないのですが潰されて世に登場出来なかったGPUが惜しまれます。

というか姑息な潰し合いでなく正面勝負してGK110/Tahitiのフルスペックを凌駕する製品を出して欲しかったというのが筆者の本音かもしれません。

AMDは既にIntelとは競争しない宣言をしている様ですが、Opteronのソケットに刺さるFirePROを作れば電力上限は自社内で自由に決める事が出来そうです。既にTrinity-APUをFirePRO内蔵Opteronとして発売する様な情報もありますが、Tahiti程の性能は出ないと思いますので XEON Phi と直接対決には成らないでしょう。しかし、その伏線をはる意図が含まれているであろう事は容易に想像できると思います。

ちなみにEPS電源の規格上は、CPU専用に240W×2系統を一纏めにして8PINコネクタとしていますので、CPU用の8Pin = 480W となり、1CPUソケット辺り 480W での設計が可能です。PCI-Express Gen3 の規格上限が 300W (事実上は240W前後) な事を考えると明らかにCPUソケットの方が有利です。(この240Wというのは240VA規制に由来しています)

とはいえ、実際の戦いはこれからです。
 Tahiti を使いECC対応で発売済の AMD FirePro S9000
 GK110 を使った潜在性能 2TFLOPS の nVidia Tesla K20
 Larrabee 系の多コアx86で1TFLOPSの Intel XEON Phi

ところで、ピーク性能に注目されがちですが、演算ロジックの都合やプログラミング技量により、演算の並列化が上手くいかない場合の性能として1演算単位(ベクタ)辺りの性能を知っておく事も大切と思い表にした物をこの記事の後半に掲載しました。
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR