出来過ぎたチップ

つい最近、出来過ぎたチップが登場しました。

その一つがKepler、もう一つがIvyBridgeです。

ここから妄想が入っていますので御注意下さい・・・

まずKeplerですが、知ってる人は知ってると思いますが、本来ミドルクラスとして設計された筈のGK104チップをGTX680やGTX690としてハイエンドの位置付けで発売しています。

nVidiaはいつもハイエンドから発売を始めるのですが、本来ハイエンドとして登場する筈だったGK100が据え置かれ未登場です。

恐らくGK104が出来過ぎた(AMDのTahitiをグラフック性能では上回った)為に、製造コストや消費電力の高いGK100を据え置きにしてGK104をハイエンドとして発売したのではないかと思う訳です。

いつものパターンとして、このまま進めると、恐らくGK100を改良したGK110を少し経ってから登場させると思われますが、このチップはGeForceには直ぐに採用されずQuadroやTESLAのみに採用という事も有り得るかもしれません。つまりGK100はハイエンド最速の予防線を兼ねつつQuadtoやTESLA用のES品的な位置付けで、GK110が次期Quadro及びTESLAに成るような、明確な差別化をするだけの余裕が産まれるほどにGK104が出来過ぎたチップだったのではないか?と思う訳です。これはGF100やGF110とGF104の差と等しく、GK100やGK110はGPGPU重視の設計、GK104はグラフィック性能重視の設計、という所からの推測です。

仮にGK110をGeForceカテゴリで出荷する場合、恐らくGTX780やGTX785やGTX790の様なネーミングに成るのではないかと想像します。それかGTX7xxはOEM限定モデルとしてすっ飛ばし、Win8に合わせてGTX8シリーズとして売るとか?

実はFermi世代でも同じ事が起きる可能性が有った訳ですが、GF104が出来過ぎとはいかなかった為に、やむなくGF100を発売したような気がします。GTX490はGF104を2個積んだ物だといった噂も流れました。遡ればFermiの前のTesla世代から同じです。

ともあれ、筆者的にはGK110製品の登場が待ち遠しいかぎりです。


続いてIvyBridgeですが、これも知ってる人は知ってると思いますが、空冷4~4.6GHz定格が達成出来る余裕があるにもかかわらず、製造時にコアとヒートスプレッダ間の熱伝導率を下げて発熱と耐性を2~3割程度悪くして発売している様なふしが有ります。実際、コアとヒートスプレッダ間のグリスを伝導率の良い物に変えると2~3割ほど性能が上げられる様です(参照)。

昔で言えばCeleron300Aの様な存在ですね。

今のグリス不良のIvyBridgeは恐らくマルチコア製品の為の温存だと思う訳です。
つまり、コア数が少ない品が高クロック動作可能だと、相対的に8コアや10コア品のクロックが伸びなくなってしまい、多コア品の価格設定が難しくなってしまうからではないかと思う訳です。

つまり、マルチスレッド性能で見た場合でも4.6GHz/4コアとくらべ3GHz/6コアや2.3GHz/8コアでは前者の方がキャッシュコヒーレンシの維持コストなどを減らせる点で高性能ですし、なによりシングルスレッドでは圧倒的な差が付きますから、相対的に多コア品の価格設定を下げなければいけなくなってしまいます。
恐らく4.6GHz/4コアと同等のマルチスレッド性能を多コア品で達成するには3~3.5GHz/8コアくらいが必要で、しかも、それだけではシングルスレッドでは圧倒的に不利ですから、4コア品の方が高性能という本末転倒の結果に成り、価格設定が出来なくなってしまう訳です

そこで、とりあえず4コア品の性能を抑える手段として熱伝導グリスを低性能品にして排熱効率を悪くし、低クロックでは消費電力が向上して今までより高性能だけれども、あたかも高クロックでは性能が出ない様な位置付けの製品に仕立てたのではないかと思う訳です。
 
ここでまた、Intelは岐路に立たされたのではないでしょうか?

つまり、クロックとコア数と製造コストのバランスをどのあたりでとるか?という点が今後は重要な課題になってくると思われます。そしてIvyBridge-EPで登場予定の発熱密度の高い10コア品よりも、高クロック動作が可能な6~8コア品或いは更に高クロック動作が可能な4コア品の方が総合的な性能が上だという結果が既に出ているのではないでしょうか?

この事は、Westmare-EPの後期品の中に、コア数を減らして4GHz以上にしたXEONOEM限定で流通しIntelのアーカイブでは存在しない事に成っている事とも関連していると思います。マルチスレッドのアプリケーションはプログラマの技量が問われるとともに、スレッドの細分化が不可能なケースも有りますので、あまりディープなマルチスレッド化をして多コアを使うより、スレッド数は少なめで、コア数も少なめにして高クロックの方が総合的な性能が高く、かつソフトを安く仕上げられるという結論に達した顧客が多く、それなりのボリュームの需要が有ったという事ではないでしょうか?
何よりXEONの場合、4コア品なら2Wayで8コア、4Wayで16コアに成りますから・・・

最近DDR4の具体化が急に進み始めた様に思う事とも関連しているとは思いますが、それとは別にクロックと発熱のバランスが3GHzで停滞した様に、ダイ辺りのコア数×クロックと発熱のバランスからコア数もいったん長期停滞するのかもしれません。

 

関連記事
スポンサーサイト

コメントの投稿

非公開コメント

No title

TahitiはGF110を全ての面で打倒するのが目的だったように思えます。GPGPUに振った結果ゲームでのワットパフォーマンスが微妙なのもGF100系に似ていますし。

当初から熱と消費電力がらみでポシャったという話が出ていたりGK104*2をTESLAに採用するといった話が出ているのでどうもGK100は出ないっぽいですね。
GK104は倍精度切捨て(等倍512SP?)なのでHPC用途ではどうなのでしょう?

Re: No title

> GK104は倍精度切捨て(等倍512SP?)なのでHPC用途ではどうなのでしょう?

GPGPUでも用途次第でしょうね。

数学的、理論的に考える場合と、実験的、統計的な考えでも違ってくると思います。

Fermi世代と同様にGK104はグラフィック重視に振った設計、GK100はGPGPU重視に振った設計と聞いてますので、GK104にはECCの様な機能は搭載されていない可能性が高いと思います。

逆にGK100やGK110はECCの様なHPC向けGPGPUでしか使われない機能を搭載してQuadroやTESLAのみに採用し、明らかな別物として価値を高めて売る様な戦略も有るのかも?と思う訳です。

ただし、それやっちゃうとGPUを演算に利用する事で安価にベクトル演算ユニットを製造販売するというビジネスモデルの根底から崩れてしまうので、Wildcatの様な末路に行き着いてしまうかもしれない危険な賭けです。
ですから、少なくともGK110はGeForceでも登場するのではないか?と思う訳です。
プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR