SuperPI 20年の推移

追記:ハイエンド品の絶対値推移を掲載。

 筆者が所有する4号機~20号機に搭載されたXEONやOpteronなどを実測した結果を元にしていますが、モバイル系CPUの値に付いてはネット上から拾ってきた情報を適宜流用させて頂きました。デスクトップ向けCPUの値は含んでいません。

Super-PI速度推移05-2


 下のグラフは1GHzあたりの演算速度です。

 例えば近年の Intel は1GHzあたり概ね37秒ですから、これをクロックで割り算するとSuperPI 104万桁の速度が求められます。具体的な例として5GHzであれば 37秒 ÷ 5GHz = 7.4秒 です(当然ですが誤差や他の要因でピッタリ7.4秒には成らない事が多いと思います)。

Super-PI速度推移04-2

 グラフから判る通り、アーキテクチャでは2004年、絶対性能(ハイエンド品の定格動作)では2006年にIntelがAMDを追い抜きました。逆に言えば、それまではAMDの方が早かった事に成ります。にも関わらずPentium4の方が売れていた理由は当時の消費者がクロックが高い事が絶対性能で優位と信じていた為と思われます。

 SuperPIは概ねキャッシュベンチですが(テンポラリファイルが作成される為、ファイルI/Oも若干関係しているかもしれません)、当然、キャッシュの限界速度まで使い切るx87演算性能も同時に備えていなければキャッシュベンチには成りません。加えて104万桁演算で利用される8MBを効率よくキャッシュに収容出来るかどうか?も大きく関係しています。従って8MB以上のキャッシュを演算機と同じダイ上に搭載しているCPUに有利ですし、そのキャッシュ速度に概ね律速します。

 IntelのCPUは2009年に発売されたNehalem-EPで8MBのLLCをシングルダイ上に搭載して以降(XEON-MPではNetburst世代のPotomac以降は8MB共有キャッシュを搭載したCPUが有りますが、これらを除く)、長期(概ね8年間)に渡り全く変化が無い(つまり同じ構造のキャッシュを使い続けている、これ以上は向上の余地が無い)事が残念です。長期停滞にもかかわらず他社とは倍近い差が開いたまま誰もIntelに追い付けないのも残念・・・NEC(Renesas)がV30以降もx86の開発を継続していたら・・・と考えると、これまた残念です。V30以降もx86を製造していたら、そもそもRenesasは誕生しなかったかもしれません(たらればですが)。

 余談ですが Intel と AMD は両社ともフェアチャイルド・セミコンダクターからのスピンアウトで、創業者どうしの出自が同じ会社、Intel創業者の方が7~8年ほど先輩にあたります。

 AMDはシングルダイ上に8MBのキャッシュを初めて搭載したのが2011年発売のBulldozerですから、K10まではキャッシュ容量面で不利でした。これは微細化でIntelに遅れていた事が主な要因です。逆にBulldozerで搭載した8MBキャッシュは、高クロック指向のBulldozer向けにクロック耐性を高める為ではないかと思いますが、CPUクロックが3GHz程度ではメインメモリよりもキャッシュの方が遅いという衝撃的に遅いキャッシュを搭載している為、Bulldozerはクロックあたりの速度が遅くて当然です。昨年登場したExcavatorでクロック辺りの速度が急に伸びてK10を抜いた(こちらのサイトを参照しました)様ですが、恐らくBulldozer(Steamroller)の構造を元に低クロック向けに設定変更した際にキャッシュのレイテンシサイクルを減らしたのではないか?それが主な原因ではないかと思いますが真相を知りたいです。L2は2MBの様ですが、L3に関する詳細が不明です。もっとも、メインメモリより遅いL3を捨てた事でSuperPIの速度が向上した可能性すら有りますからL3は無いのかもしれません。他にもL1の倍増など各種のキャッシュ構造の見直しや分岐予測の改善もされている様ですが、そういった細かな改良はSuperPIには殆ど影響しないと思います。デュアルソケット対応の4000番台以上のOpteronはPiledriverで世代交代が停止している為、Steamroller以降は筆者の視界の外でしたが、K10を超えて進化しているならSocketG34のOpteronにもExcavatorのラインナップを追加して欲しいものです。仮に2016年後半に登場すると言われているZenがExcavatorの1.4倍速に成るとすればGHzあたり48秒、3GHzで16秒、4GHzで12秒ですが、もしZenが8MB以上の高速キャッシュを搭載しているなら話は別です。SkylakeにSuperPIで追い付く為にはExcavatorの1.7倍速程度が必要ですが、高速キャッシュを8MB以上搭載しているならばIPCが1.4倍速でもSkylakeに追い付く可能性が有ります。しかし絶対性能は当然ながらクロック耐性次第です。

 ATOMの結果をグラフに追加で描画して驚愕しました。一昨年Avotonデュアルマザーを記事に書きました時に薄々気付いてはいましたが、ここまでスコアが伸びていたとは驚きです。AMDがExcavatorの設定を突如軌道修正して省電力と低クロックに最適化した理由も Silvermont の脅威に押されて対応した側面が有るのではないかという気がしてなりません(猫系APUと同じ味付けにしたのかも?)、両社ともARMに押された側面もあるかもしれません。InOrder型で512KBしかキャッシュを搭載していなかった初期のATOMに比べ、OutOfOrderかつ2MBのキャッシュを搭載したSilvermont以降のATOMは全く異なる性質のCPUです。SilvermontはK10のカタログスペックに近いですし、実際にグラフ上もK10と拮抗していますが、もちろん消費電力は後発のSilvermontの方が低いです。もっと言えばSilvermontはATOM系アーキテクチャの系統ではなく、実はCoreDuo(Yonah)をシュリンクしただけじゃないか?と思う様なスコアですがアーキテクチャに関するブロック図を見ると全くの別物です。この様にATOMブランドから乖離した性能の為か、製品名にもPentiumやCeleronを冠した物が登場し始めている様で、アーキテクチャと商品ブランド名が混沌として良く判らない物になっています。とういうか実際にCoreDuoを微細化すればATOMっぽい製品が出来そうだと思いますが、どうなんでしょう・・・

 VIA は昨年(2015年3Q)出荷開始した28nm版で演算機自体を高速化した様ですが、SuperPIに影響を与える様な個所ではないと思いますので、共有キャッシュ容量が 2M -> 4M に増量した事が高速化した主な原因かもしれません(共有キャッシュである事はCoreinfoで確認)。 逆に L1キャッシュは 64K -> 32K に半減した様です。キャッシュを増量しても未だ8MBの半分の4MBしか搭載していない事が104万桁が他社製に比べて遅い原因だと思いますが、それに加えてメインメモリもシングルチャネルでメモリ帯域を細くして省電力化している為、これも影響していると思います。後ほど4MBの共有キャッシュに収まる52万桁で測定して検証してみようと思います。

 参考までにy-cruncherの推移です。

y-cruncher速度推移02

 こちらはSSE3以降のSIMDを使った多コアCPU向けにチューニングされている並列演算ベンチです(SSE3を搭載していないCPUでも バージョン v0.5.5.9180 x86版 を利用して同一アルゴリズムで計算できます)。桁数が2桁多い為キャッシュベンチというよりもメモリ帯域ベンチに近いと思います。

 こちらも2011年以降伸び悩んでいますが、唯一、2014年に登場したHaswell-EPのみがAVX2とFMA3を使う事で5秒の壁を破りました。次に壁を破るのはSkylake-EPで有効化されるAVX-512と6ch-DDR4の組み合わせか?或いは新アーキテクチャのAMD Zenか・・・
   
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR