Broadwell-EP の演算性能


 この表を更新するのは3年半ぶりですから、学生なら卒業という事でしょうか・・・

OpenCL-Bench-2-LPK-D.png

 どうやら、Broadwell-EP は2ソケットで現行 XEON Phi (Knights Corner) の演算性能を追い越した事になる様です。しかし、それにも増してPEZY-SCの凄さが目立ちますね、しかし AMD Fiji の倍精度対応版 FirePro が登場したら PEZY-SC に肉薄しそうなスペックを示しているのも注目に値すると思います。商業的には成功していそうなCUDAやXEON Phiが性能では一歩遅れている感があり、技術的な優劣が必ずしもマーケティングの優劣には直結しない例でしょうね・・・Polarisでは現行品を抜けそうですがマーケティング的にどうでしょう・・・

 近々登場予定の次期XEON Phi (Knights Landing) のスペックも予想してみましたが、こちらも次世代(未発売)でありながらPEZY-SCの半分程度の性能です。ここまで優劣に差が有ると、何らかの妨害工作を仕掛けそうな予感がしますね・・・既に実行中か?

 上の表にはワークステーション向けXEONとしては珍しく105Wに抑えた12コア定格3GHz品かつNonTurboでの性能を掲載しましたが、ハイエンド品は22コアの様ですから、ターボクロック次第では単機で現行XEON Phiに肉薄する演算性能=倍精度1TFLOPSかもしれません ( 計算上は 8FLOPS × 22Core × 3GHz ÷ 0.5Cycle = 1,056 GFLOPS で概ね XEON Phi に単機で並びますから、XEON E5-2699 v4 のAVXターボクロック次第です ) し、少なくとも2ソケットでは1TFlopsを超えていて、メモリも1CPUあたり1.5TBまで対応する様ですから、個人PCもテラスケール時代に突入ですね。

 ところで、LINPACKの替わりになるベンチマークとして注目されつつあるHPCGをLinux上で実行出来る XEON向けバイナリ(ソース付き)CUDA向けバイナリ(ソース無し) が入手可能です(残念ながらAMDプロセッサ向けバイナリは未だ見付けていません)。
 
 その他、参考リンク
 ・CPU で LINPACK を試す方法
 ・GPGPU で LINPACK を試す方法
 ・OpenCLベンチマーク

 
 
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR