DualSocketTheWorld 的な SuperPI年表

掲題の通りです。
ブログの趣旨としてDualSocket(2Way)のCPUにフォーカスした年表です。

IPC(Instructions Per Clock cycle)とイコールではありませんが、それに似た基準として1GHz換算した場合のSuperPIの演算速度を表にしてみました。

20120506135357f3f_2014120908550163d.png

(表の数字を動作クロックで割ると実際の秒数に成ると思います、Turboや省電力設定では動作中にクロック変動するのでご注意下さい。SuperPI自体が少数点以下を省略している為、あまり正確ではありません。TurboをOFFにして計測回数を重ね精度を上げて時々表の数字を更新しています。英語版を使って正確な値を出し直すかも?)

表を作ったきっかけは、同一クロックのPentiumIII-S(P6)よりもAthronMP(K7)の方が早かったのに、その後、両社とも同じアーキテクチャをベースに発展させたにも関わらず、どこで逆転されたのか?をつかもうと思った事です。

BaniasとDothanはDualSocket(2Way)構成のラインナップが無い製品ですが、それに続くYonahはSossamanという開発コード名のDP-XEONが存在します(参照1 参照2 参照3)。

つまり、DualSocketしか眼中に無い筆者にとって全くの盲点だったBaniasとDothanで急激にIPC(というかSuperPIの処理効率)が改善し、ここが逆転ポイントに成っていた訳で、それが故に筆者が不思議に感じていた訳です。そしてYonahで引き離されました・・・

BaniasとDothanは前世代のAMDをIPCで少し上回る事を目標にしている様に見えます。この時、表舞台ではNetBurstで戦わせて、モバイルカテゴリに伏兵を置いていたともとれます。2000~2003年前後はIntelにとって危機的な意識をもって開発が行われたであろう事が容易に想像出来ます。逆にAMDは、この頃から設計技術(アーキテクチャ)より製造技術(シュリンクと歩留まり)で苦労しはじめ、相対的にペースが鈍化してゆきます。これが原因でK8で3年、K10で4~5年遅れた様です。

その後の歴史に付いては、Intelがコツコツと少しづつ改善しているのに対し、AMDは殆ど横這い状態なのが良く判ります。Intelの場合は技術的な面より、もしかしたらマーケティング的な要求(つまりパイ焼きを早くせよとの営業サイドから技術者に対する圧力)の結果なのかもしれないと勘ぐってしまいます。もしくは技術者が自ら目標にしている面もあるかもしれません。なぜなら新しいCPUを発売する前には必ずSuperPIの速度がリークされているからで、つまり、それだけ注目されている値だからです。AMDの場合はサーバ需要に主眼を置いた事でシングルスレッド性能の向上よりもコア数の増加とマルチスレッドの効率化に注力した面が有ります。

ここで注意しなければいけない事が有りますが、SuperPIは20年前の80386や80486向けの32Bitアプリだという事です。ターゲットOSはWindows95より更に古いWindows3.1+Win32sです。当時はメインメモリが8MBや16MBしかなく、つまり、メモリスワップが前提でハードディスクの速度が要求されるソフトでした。104万桁の演算には40時間といった日を跨ぐ様な長時間が必要だったのです(スコアがミリ秒ではなく秒単位なのもその為です)。それが時代と供にメインメモリに収まる様に成り、近年ではL2キャッシュに全て収まる様に成りました。その結果、メモリベンチやキャッシュベンチとも評される事が有り、実際にそういった側面(具体的にはL2容量倍増で30%高速化など)が有ります。

余談はさておき、つまりPentium以降に追加されたSSE等の拡張命令やマルチコアには非対応ですしAMD64やIA64の様な64Bitのみならず当時はアウトオブオーダーですらありませんから、最新技術で最適化すればSuperPIの何十倍も高速な円周率計算アプリが出来る事は容易に想像出来ます。

逆に言うと、この表の数字は20年前の80486や初代Pentium(P5)向けにチューニングが施されたインオーダーのシングルスレッドアプリを新しいCPUとメモリで動作させた場合にどれだけ速くなったか?を比べる事しか出来ません。

IntelのCPUが2003年以降も年々改善してきたのが営業側からの圧力なのか、技術側が自ら立てた目標なのか、もしくは経営サイドからの社の方針なのかは判りませんが、それも限界が近付いたと見えて2009年以降は横這いですね。それともIntelも方針転換したのだろうか?
3D構造でも壁は破れなかった様ですし、今後はどうなるのでしょうね?


関連記事
スポンサーサイト

コメントの投稿

非公開コメント

No title

初めてコメントさせて頂きます。
私も大した事ないですが自作PCを使用したり適当に楽しんでおる者なのですが、過去の日記にあったASUSのワークステーション用のマザーボードがある事すら知りませんでした。
知識とお金が必要そうですが、非常に興味を持ちました!
Quadroを購入しようかと検討中でいろいろと調べているうちに辿り着きました。
デュアルソケット、いいですね~

Re: No title

akiさん、初めまして。
コメント、有難う御座います。

ASUSのワークステーションマザーは、akiさんにはちょうど良いかもしれません。
但し、このマザーではQuadroでのSLIが出来ませんので、その点だけはご注意下さい。

No title

Dothanって高クロック品は発熱がひどいイメージが強かったんですけど速かったんですね…

Linux上でΠ焼きするとAMDの方が速いってのを聞いた事がありますがこの表では最適化でひっくり返せるようには見えませんね

Re: No title

お久しぶりです。

> Dothanって高クロック品は発熱がひどいイメージが強かったんですけど

Dothanはモバイル故に低クロック動作を前提にしていますから、L1/L2キャッシュの動作倍率等が低くコアクロックに近い速度な訳ですが、その状態で高クロック化すると発熱が多くなるのは仕方の無い事かもしれません。

高速動作するCPUのキャッシュは概ねレイテンシや倍率が多くとってあります。その最たる物がBulldozerで、BulldozerのL3は、コアが3GHz程度までは、なんとメインメモリより遅いんです!

> Linux上でΠ焼きするとAMDの方が速いってのを聞いた事がありますが

最適化は、びっくりする位に違いが出ますから、ある時点では真実なのかもしれません。

過去にサーバーアプリをチューニングした経験から云いますと、少しの修正と最適化で10倍早く成る様な事は普通に有り得ます。1000倍速くなった経験はありませんが、数百倍程度のチューニング経験も有ります。真実は、やってみないと判りませんし、やってみても、それ以上の最適化手法が後に見付かる事さえ有り得ます。

それにSuperPIは80386時代のソフトなので、当然の様にSSEやAVXの様な拡張命令は使われていませんし、マルチコアにも対応していません。最適化とは、これら拡張命令を使うようにしたり、シングルスレッドアプリをマルチコアで早く動く様に変更する物ですから、80386時代のアプリを最適化して早く成るのは当然の事でもあります。

回答に成ってない回答ですが、一言で言えば「その可能性は有る」といったところでしょうか・・・

追伸

Linux用のバイナリも有るみたいですね
ftp://pi.super-computing.org/

こちらを使って比較すると、また違った結果に成ると思います。

金田研のHPには、「Opteron Linux OS 用等の各種スカラープロセッサー専用 super_pi プログラムの配布を計画している。」と書いてありますので、もしかしたら最適化されたSuperPIが公開されるかも?

No title

自分自身が年寄りの領域に入りつつあるせいかもしれませんが
学生の時に、バイト先でFACOM9450のエミュレータの5インチフロッピを
差して、汎用機に接続していた頃と異なり、オフコンとパソコンと
ワークステーションの区別が出来なくなったように思えます。

そういう意味では、この15年でwintelはあまたの独自OSと多様な
プロセッサを駆逐してしまった感があり、面白味に欠ける面が
感じます。

Re: No title

> オフコンとパソコンとワークステーションの区別が出来なくなったように思えます。

そうですね・・・
唯一、MacProがワークステーション的存在の最後の生き残りかもしれません。

> そういう意味では、この15年でwintelはあまたの独自OSと多様な
> プロセッサを駆逐してしまった感があり、

ちょっと話の分野が異なりますが、ビル氏はロックフェラーの系統にあたり、成功は当初より約束されていたとも言われていますしね。先ほど書いたMacProを作っているAppleにしてもMSの資本が入っている事を考えると・・・

Intelプロセッサは、この記事の表でも明確ですが、2006年のYonah以降、他社の追従を許さない圧倒的な性能を手に入れ、それで他社はモチベーションを削がれてしまった感もありますね。

もしこれにV30以降もx86でNECが参戦していたら?と考えると、対等以上に戦えたのではないか?と言う気がしてなりません。

しかし、時代は高性能から小型低消費電力へとフォーカスを移し、ARMプロセッサ+スマートフォンやタブレットが主流の場を勝ち取ろうとしています。

次期Windows8では、この分野への宣戦布告な訳ですが、これが関ヶ原になるかもしれませんね。
http://dualsocketworld.blog134.fc2.com/blog-entry-302.html

そして最後の合戦を前にして、カリスマが世を去りました。
http://dualsocketworld.blog134.fc2.com/blog-entry-254.html

何か、作られた舞台の様な気がするのは私だけでしょうか?
プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR