Windows 7 で NUMA が認識されない件

先日の LINPACK を Bulldozer で何とかピーク性能の近似値が出せないかと設定を色々試していたのですが、起動時に NUMA NODE を指定しようとしたところ、何故かNUMAとして認識されておらずOSが認識しているノードが1つしか無い事に気付きました。
ちなみにBulldozer系CPUではFMA(SSE5)を使う様にリコンパイルしないと最大性能が出せない様です。しかしこれはAVX用に再コンパイルする事と労力的には等価です。そしてFMA(SSE5)を使う様にリコンパイルすればAVX同様に倍速化します。

話をNUMAに戻しますが、他のPCも調べてみたのですが、システムプロパティでは2CPUとして認識されているにも関わらず、タスクマネージャでは単一のノードとして扱われている物と、ちゃんとNUMA認識されているものが有ります。

筆者所有のNUMA機は AMD K8/K10/Bull、Intel Westmare-EP/SandyBeidge-EPの合計5機で NUMA のアーキテクチャを概ね網羅している筈です。そのうち K10 と Bulldozer が NUMA 認識していません。この二つに共通する事は?と考えますと、両方とも同一世代に G34 ソケットが存在し2ダイを1CPUに封じ込めた Magny-Cours と Interlagos の存在が有ります。Magny-Cours と Interlagos は共に 1CPU でありながら構造的にはNUMAノードが2つあり、4チャネルのメモリを2チャネル分割してそれぞれのダイが制御する様に成っているはずですが、この複雑さが何か影響して誤認識の要因に成っているのでは?と予想しています。何かパッチが出ていないかMSDNで探してみようと思います。→MSDNには見あたらなかったのでサポートを使ってみました。

Microsoftが公開している Coreinfo というツールがWindows上でCPUがどの様に認識されているのか調べるのに役立ちそうです。
実行してみましたら

 Logical Processor to Socket Map:
 ********-------- Socket 0
 --------******** Socket 1

 Logical Processor to NUMA Node Map:
 **************** NUMA Node 0

つまりソケットが異なる2CPUとしては認識されているけれどもNUMAではないSMPとして認識されている様です。

NUMAが正しく認識されている場合は、この様な表示になります。

 Logical Processor to Socket Map:
 ******------ Socket 0
 ------****** Socket 1

 Logical Processor to NUMA Node Map:
 ******------ NUMA Node 0
 ------****** NUMA Node 1
 Calculating Cross-NUMA Node Access Cost...
 Approximate Cross-NUMA Node Access Cost (relative to fastest):
    00 01
 00: 1.0 1.3
 01: 1.4 1.1


以下、タスクマネージャでの状況です。

19号機:認識NG
Opteron 4280 NUMA

17号機:認識OK
XEON E5-2603 NUMA2

15号機:認識NG
Opteron 2439 SE

13号機:認識OK
XEON X5670 NUMA

11号機:認識OK
Opteron 290 NUMA
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR