Zen は NUMA か?

AMD Zen は NUMA ではないか?といった情報がネットで出始めていますが、ダイレイアウト的に言ってそうなんだろうと筆者は思っています。
 ->デュアルソケット・ザ・ワールドの目次は こちら へ。

K8(2003年)以降、NUMAが当然の環境で育った筆者は、RyzenやNaplesが単体でNUMAだったとしても特に驚きは無いのですが、XeonやOpteronと同様にZenでのチューニングは必然的に Node InterleavingAffinity Policy が肝になってくると思うのです。

オーバークロックやレイテンシ設定の様な判り易いチューニング(というより規定外動作)よりも、こういったチューニングの方が楽しいですよね?(筆者だけかもしれませんが)

キャッシュ構造に視点を置いてCoreinfoを参照すれば概ね物理構造が把握出来ると思いますが、BIOS/UEFIで先述のNode Interleaving相当の機能が設定されている場合はSMP(Symmetric Multiprocessing)的な振る舞いをする為、実態がつかみ辛いかもしれません。と言う事でNaples登場まで待とうか悩んでいましたがRyzenも購入して検証してみたくなってきました。

たぶん、第一世代のZenは4コア1モジュールにDRAM I/F 1本がセットになった“モジュール”をダイ上の高速インターコネクトで接続したNUMAなのだと思います。この手法はAMDがSocket G34のOpteron6xxxシリーズで採用したソケット内NUMAと同様の考え方なので、それ自体は既存の手法と言えます(コンシューマ機では初かもしれません)。

Ryzen は 8コア(2モジュール)ですから、DRAM I/F は2本
Naples は 32コア(8モジュール)ですから、DRAM I/F は 8本

という事も必然の帰結と言えます。

あてずっぽうで書いていますが、購入してBIOS/UEFIの設定を弄りながらCoreinfoやy-cruncherで効果を測定してみれば良く判るのではないかと思います。

CPUがメモリに対して太い帯域を必要とするのは主にAVXやFMAの連続実行時だと思うのですが、Zenは演算機がコア辺り128Bit×4機の様なのでDDR4世代では4コアまでは1チャネルで賄えると判断したのではないかと思うのです(後ほど暇があれば計算してみます)。これを4コア以上ではスケールアウト的にNUMAで並列化してゆく事で多コア化と歩留まり対策を効率よく実現できる(実際にはインターコネクトが複雑になりますが)と考えたのではないかと思うのです。

となるとNaplesのインターコネクトが、どういう方式なのか興味が出てきますね。クロスバーやメッシュやリング或いはこれらの複合など色々な方法が有ると思いますが、ダイ上の密結合とMCMやソケット間では方式が異なるかもしれず・・・
 

Naples で組めるのはいつか?

AMD Naples + AMD Vega10 で組むのを楽しみにしている筆者です。
 ->デュアルソケット・ザ・ワールドの目次は こちら へ。

3月2日(日本は3月3日?)の0時から AMD Zen の販売開始が決定しているらしいですね。

K8や初代XEONの頃、初物はデュアルソケットから(マルチソケットでもシングルソケットでもなくデュアルが初物)でしたが、今回の Zen はシングルソケットから販売をスタートするらしく、Zenの初物をシングルで試しに組むか?それとも Naples が発売される4月以降まで待つか・・・で悩みます。

いづれにしろ筆者は3月2日時点では海外に居まして、翌週に帰国を予定しておりますので、シングルで組むにしても少し遅れて組む事になります。

下のグラフと表は Naples の演算速度を筆者の妄想的予想で描いたものです。
AMDは過去6年間に渡り停滞しておりましたので、本当に楽しみにしております。

ycruncher22years.png

y-cruncher-ALL4.png
プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR