来年からのOpenCL(GPGPU)

えっと、こんな感じだと思います。

クリックすると拡大します。
OpenCL-1.jpg
13号機の実測ではGPU⇔MEMの帯域が54GB/s、CPU⇔MEMの帯域が24GB/sですから、HOST⇔DEVICE間の3.5GB/sは一桁低い値で、致命的なボトルネックとさえ言えます。

と来年から始まると書きましたが、SSEを使った実装は既にありますが演算能力としてはGPGPUに敵いませんし、Cellを使った実装ではOpenCL策定時から既にそうなっていた訳ですが、自作PCで扱う範疇でもなく、また一般的でも無いと思います。

来年からの数年間、この分野での本命はFUSIONであると思うのですが・・・
(私が見落としているのか?HPC向けのFUSION-APUの実態像が未だ見えてきません。)
登場するか否かは別として、HyperTransport接続のGPU、つまりCPUソケットに搭載可能なGPUが登場し、マルチソケットマザーでNUMA的なCPUとGPUのフレキシブルな構成が可能だと思う訳です。

こうなるともう、ボトルネックがしばらくは解消出来ないnVidiaにとっては、とにかくCUDAを推進しつつARMのパフォーマンスが向上するのを待つ(もしくは自ら参加してARMを強化する)しか将来的に苦しくなってきますね。
ECC対応のQuadroやTESLAはGPU1枚が50万くらいするんですよォ~
ゲーム用GPUで安価に底辺を広げつつ、頂点からはガッポリって感じですねェ~

台湾サイドからリークされてくるAVXのパフォーマンスが実際にはどの程度なのかも気に成りますね。

あとは、メニィコア化により、数年後にはデュアルソケットでの自作PCは厳しくなるかもしれません。
その場合、このブログの趨勢が我ながら気に成るところですw

ところで、筆者が所有する自作PCのうち、7号機以前のPCに付いては純粋な趣味として旧式PCでのOpenCLを時代に逆行しながらAGPやPCIなどのインターフェースを使ってボトルネックを強化しているだけなんですがwまぁ趣味ですから冷めた目で見てやって下さいw
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR