ついにソケット版XEON Phiが来た!


Super K1SPE (ATX / PCIe x16 + x16 + x4)
K1SPE.jpg


こちらが対応CPUです。

基板はATXサイズですが電源が12V-8Pinを2本備えたEPS系電源になりますので御注意下さい。

LGA3647です。
メモリはデュアルとかトリプルとかじゃなく6chです。
コア数は最大72コア・・・

クルクルと言われ続けて、ようやく来ましたね。いつ発売なのでしょう?
ベアボーンはこちらです。

Skylake-EPとソケット互換になるのか?
これのDhualSocket版が登場するか?
気になる所です・・・

自作erとしては、これであえてSuperPIを実行してみたくなりますよね!?

 
スポンサーサイト

Skylakeにバグが発見された

 Intelの最新CPUであるSkylake世代のCPUにシステムがフリーズしてしまうバグが発見された様です。(上記のリンク先は、現在アクセスが集中している為か、なかなか閲覧できません。その場合はこちらを参照してみて下さい)

 事の発端は、SkylakeでPCを組み立てた(もしくは既製品を購入した)人々がPrime95で負荷試験を行い、購入したばかりのPCがフリーズしてしまうという深刻な事態に遭遇、その報告が多くの人々からIntelに寄せられ、明るみになったのではないかと思われ、冒頭のリンクも、そういった報告の一つではないか?と思います。

 Intel自身は問題を認識したうえで対策版BIOSが完成するまで事の重大性から公開を控えていた可能性があると思います。もしそうでなければ、発覚から原因特定と対策方針発表までが早すぎると思うのです。

 筆者もPCを組み立てた際にはPrime95で負荷試験をしていますので、もし筆者がSkylakeを手にしていたら、もっと早くブログで掲載していたかもしれませんが、Skylake世代のデュアルソケット向けとなるSkylake-EPに限っては未発売ですから、今回は、筆者には直接の影響がありませんし、筆者が手にする頃にはバグ修正済みの物を手にするハズです。しかし、既にコンシューマ向けには多くの数が出回っていると思いますので、社会的な影響は、それなりに有るんでしょうね・・・

 具体的に、どの様なケースでSkylakeがフリーズするのか明らかにされていませんが、すくなくともPrime95で特定のパラメータ ( Advanced -> Test -> Exponent to test -> 14942209 ) を入力して負荷テストを実行すると数分~数時間程度でシステムがフリーズしてしまう事が判っている様です。しかし、Prime95に限らず、原因となる命令セットをPrime95と似た状況下で利用すればフリーズするのでしょうから、エクセルの様な表計算ソフトなどを利用中にOSまるごとフリーズしてしまう様な事も起きるのではないかと思いますが、今まではバグの存在が一般には認知されていませんでしたし、情報統制されマスコミ発表もしていませんでしたから、このバグが原因でフリーズしても、一般の人々は、なぜフリーズしたのか判らず、自分の操作が間違ったのかとあきらめていた人達も多かったのではないか?とも思います。

 Intel側の発表としては、既に原因を特定し、対策方針も決まった様ですが、バグを回避するにはBIOS/UEFIの更新が必要で、かつ、対策版BIOS/UEFIは未完成の様ですから、今後、対策版のBIOS/UEFIがPCメーカー各社・マザーボードメーカー各社から公開されるまで待たなければならず、現時点ではSkylakeユーザーは問題を抱えたまま利用しなければなりませんし、BIOS/UEFIを更新するスキルが無い一般の人達は、対策版が公開された後も問題を抱えたまま使い続ける事になるのでしょう・・・

 Skylakeは、輸送時の振動などでCPUが曲って壊れてしまう問題(CPU本体が薄く作られている為、剛性不足で曲って壊れてしまう現象)も最近になって認知される様になりましたが、Skylake-EPは、こういった問題は全て改善・対策された物にしてもらいたいと思います。
 
※追記:「バグ」という用語に付いて・・・
 「バグ」という用語は、コンピュータ・ソフトウエアの不具合を指す用語として一般に使われています。
 対して、IntelのCPUの不具合を表したドキュメントには、「バグ」ではなく「エラッタ(errata)」と言う用語が使われています。
 この「エラッタ」という用語は半導体部品(ハードウエア)の不具合を表現する際に一般的に使われる用語でもあり(その一覧にはソフト的な不具合が含まれる事も有り)ますが、今回のケースは半導体回路の不具合というよりも、半導体回路をコントロールしているMicrocodeのソフトウエア面の問題である可能性もあり、外部からは判断しかねますが、とりあえずMicrocodeのソフトウエア修正で回避出来る事が判明しており、その対策版は徐々に提供され始めています。
 一方で、冒頭に掲載しましたリンク先では、問題提起の初期から〝bug″という表現が使われています。
 これらを鑑み、この記事では最初に問題提起した際のバグという用語を利用して記載していますが、エラッタに読み替えて頂いても構いません。

Vortex86 DX3 が面白ろそう!?


 VIAでは無い、ましてIntelやAMDでもないx86(IA32)互換CPUの最新作、今年発売っぽいです。

 スペックは 1GHz / 2Core / DDR3 / GPU内蔵(HD解像度) / H.264デコーダ内蔵

 こちらの動画筆者が見付けた時点で再生回数3回)でイメージがつかめるかもしれませんが開始後18秒辺りに見慣れたATXマザーらしき板(PBE-1000)への合体変身シーンが有ります。

 全ての機能をCPUに内蔵し、動画にも映ってますがISAバスも装備してガラパゴス的進化を遂げながらレガシーデバイスの救世主としてUSB排除に大活躍しそう(後述)な雰囲気が充満してますね。

 CPUのアーキテクチャは Super Socket7 時代の Rise mP6 を起源とする MMX Pentium 互換プロセッサで、左記の記事には掲載されていませんが1999年当時のハイエンド品は MMX-Pentium 比で 366MHz 相当、実質 2.5 x 100MHz = 250MHz ( 1Core 2.0V ) で、15年の歳月を経て1GHz/2Core(単純計算で8倍)に性能UPしています。

 しかも超低消費電力でヒートシンク無しファンレス常時稼働が可能、動作条件が-20℃~+70℃(オプションで-40℃~+85℃まで対応)、LED電球程度の消費電力ですから、SSDと組み合わせれば完全無音で常時稼働しても電気代10円くらい!?ディスプレイより消費電力低そうですよね!?

  類似の製品として ZF Micro Solutions の ZFx86 という製品があり、こちらは 486 互換 100MHz稼働 TDP1W以下で主なターゲットは産業PCの代替・交換用です。つまり、工場の生産ラインをコントロールしていた1990年代のPCが故障した場合、交換部品が既に無い為、その代わりとして導入する為の物で、ISAスロットを多数備える事が重要だったりします。

 話を Vortex86 DX3 に戻しますが、これってデュアルソケットじゃなく、SoCとして2CPUがパッケージ封入されているのですよねェ~それだけが残念(筆者的に残念というだけで、一般の人にとっては普通の2コア品です)

 Socket7時代のアーキテクチャを継承した(従ってP6以降の命令セットは装備していない様でWin8は多分ムリ)物らしいので、もしかしたらFSBをノースと共有するMCMによる2CPU構造がパッケージに封入されているのかもしれず、パッケージ内部に微細なデュアルソケットが再現されているとしたら面白そうかも?(筆者的に面白いというだけで、一般の人にとっては普通の2コア品です)といった妄想をしてます。けどCPUとGPUがノースを経由せずに直結しているブロックダイアグラムが有りますので、そこの所がどうなってるか興味あります。CPUとGPUはUMA(Uniform Memory Access)つまりCPUとGPUがメインメモリに対して均一平等なアクセスをする様です。という事は2個のCPUとGPUとノースがFSBで接続され物理メモリアドレス0xA000から始まるフレームバッファはフラットかもしれませんね?

ECCが無い・・・
 今気付いたのですが、ECCが無いですこれ。サーバにするのは厳しい事と、常時稼働と言えども定期的な(可能であれば毎日)再起動によってメモリをリフレッシュする必要が有りそうです。

セキュリティ面はどうでしょうか
1:ME-HECI
 ME-HECIはIntel製のCoreMA世代以降のCPU又はSocket775/771以降のMCHに内蔵されています。セキュリティソフトでは回避不可能な遠隔操作型の非常に危険な脆弱性と成り得る存在で、ネット越しにいつでもどこからでも攻撃できますが、Vortex86 DX3 はIntelの製品でもCoreMAでもない為、ME-HECIに対する攻撃の対象外です。
 ARMは類似の機能であるTrustZoneをARM11から導入し、AMDは昨年頃からx86のSoCにARMを組み込んでTrustZoneを統合しています。SoCではないAMD FXやOpteron或いはK10以前の既存製品には統合されていないと思いますし、TrustZoneは今の所は脆弱性が見付かっていません。とは言え今後の製品には統合されるかもしれませんし、ソーシャルハックによるTrustZone乗っ取りが行われればME-HECI同様の最も危険な存在に成り得ます。
 Vortex86はSocket7世代のアーキテクチャを継承してきたCPUですから、類似の事(セキュアにしようとして逆に強力なバックドアを埋め込む様な危険行為)は無さそうで、リーフレットにも、それらしき記載は見当たりません。
2:SMM
 SMM Rootkitは386SL/80486(又はPentiumII)からNehalem世代までのIntel製CPUで確認されている構造的な脆弱性を突いた仕組みで、潜伏後にはセキュリティソフトで発見不可能なBIOS/Firmware浸食型の脆弱性ですが、互換プロセッサ( AMD / VIA / Vortex86 )では類似の脆弱性が見付かっていませんのでIntel製品固有の脆弱性の様です。起動時にBIOSでMCHのD_LCKビットをセットすれば回避出来る様ですが、その対策が施されたBIOSが無ければ脆弱性が残っています。Intel製品は多く普及している為に発見され易い側面が有り、他社製品では類似の脆弱性が発見されていないというだけでSMMを搭載した全てのCPU(つまりオリジナルの80386以外のx86)で類似の脆弱性が発見される可能性は捨てきれません。
3:USB
 BadUSBはセキュリティソフトでは回避不可能なソーシャルハック型の脆弱性で、米国がイランの核施設を攻撃する際にシーメンス製遠心分離機のファームウエアを書き換えて回転数を変更するアプリを埋め込む用途に使われた事で有名です。遠心分離機に限らず何でも出来てしまいますからとても危険ですが、USBを使わなければどうと言う事は無いです。しかしUSBを使いたい場合はメーカー問わず全ての機器で回避策を考えねばなりません。
 Vortex86 DX3 でも USB を使う場合に問題が発生する可能性がありますが、レガシーI/F( PS/2 RS232C パラレル )などを統合している Vortex86 DX3 ならUSBを全く使わない運用が可能ですから、USB信号線のハードワイヤーを完全に切断した状態(要改造)でPCとしての運用も可能です。これによりUSB扇風機やUSB充電器を安全に利用する事が出来るでしょう()
4:MicroCode
 Microcode Manipulation はMicrocodeの入れ替え機能を搭載しているIntel製(PentiumPro以降の全て)とAMD製(たぶんK7以降)及びVIA製(Nano、C7)で発生しうるセキュリティソフトでは回避不可能な脆弱性ですが、Vortex86 はMicoroCodeを入れ替える機能が無いSocket7時代のアーキテクチャですから、恐らくMicrocode Manipulationに対する脆弱性も無いものと思われます。

複雑な構造に対するアンチテーゼと成り得るか?
 Intelはムーア氏の法則に従って2年で2倍の集積を達成し続けてきましたが、それにより2年で2倍の複雑さを取り込みました。
 OSもそうですが、複雑に成れば成る程にバグやセキュリティホールを抱える可能性も同様に増加し、2年で2倍の集積密度は同時に瑕疵も累乗的に増加して行く可能性を内包していると思います。
 これに対し、Vortex86は15年前のアーキテクチャを職人の如く磨きあげる事でSoCによる集積密度の向上は有ってもシステム全体としての複雑さの変化は非常にスローであり、枯れたシステムとして逆に堅牢性を手にしているという考え方も有るのではないか?と思うのです。
 筆者が使う立場で考えますと、残念なのはECCを搭載していない事ですが、それ以外に付いては今の所は非常に興味を持って注目しています。


Micron Technology MTSAM64GZ は自作向けマザーボード初のNUMAではないか!?


 冒頭に謝罪文を掲載しておきますが、この記事は15年前の話を最新記事として書いていますので御注意下さい。

 読者の方から、Micronが昔デュアルマザーを出していたと教えて頂きましてググりました所、特徴の有るチップセット名を見た瞬間に思い出しました。筆者の記憶の片隅にもSAMURAIという名のチップセットを2個搭載したマザーボードに強く惹かれた記憶が有りました、、、ん!?ノースブリッジが2個!?じゃあNUMAじゃないか!!!

そこで、時系列を辿ってみます・・・

1999年:
 ・Micron Technology MTSAM64GZ Grizzly (SAMURAI64M2ノース2基搭載)
  2基のノースブリッジそれぞれに4本のメモリスロットが接続されている為、物理構造はNUMAで間違い無い又は共有型FSBと思われますが、先程入手したPDFマニュアルにはブロックダイアグラムが掲載されていません。しかし共有型FSBとすれば4デバイスでFSBを共有する為、3デバイス(2CPU+ノース)までしか想定されていないSlot1では不安定に成るかもしれません。
  写真を見るとIO-APICが1個しか搭載されていませんが、P6バス(Pentium3世代までのFSB)はAPIC信号を流しません(NetBurstでFSBにAPICが統合されるまでは独立したAPICバスが有った)のでAPICバスはNUMA/SMPに関わらず共有型のバス形式を採用していると思います。

2000年:
 ・5月 IBM NUMA-Q 2000 ( Pentiumiii XEON でのNUMA機 ) 発売
 ・8月 ACPI Spec Rev2.0発表(x64対応及びSRAT:Static Resource Affinity Table)
  ACPI 2.0 にてNUMAをBIOSやOSで対応可能とする為の規格化が提示された。

2002年:
 ・ACPI Spec Rev2.0a発表(SRATのエラッタ修正)
  SRATの具体的な定義が行われ、実装可能なレベルの規格が完成した。

2003年:
 ・AMD Opteron(Socket 940)発売、x86/64 PC初のNUMA 最大8ノード対応
 ・Linux Kernel 2.6 にてNUMA対応

2004年:
 ・ACPI Spec Rev3.0発表(NUMA Distancing = SLIT の追加)
  NUMAノード間の距離を定義する事でアクセスレイテンシを判断可能に

2005年:
 ・AMD Dual-Core Opteron 発売、単一ノード内に複数コアを持つ複雑な構成に

2008年:
 ・Intel Nehalem-EP(Socket 1366)発売、Intel初のNUMA
  既にIntelのCPUを使ったNUMA機は存在したがIntel自身はSMPにこだわり続けた。

2009年:
 ・Windows7/Server2008R2にてNUMA対応
  NUMA用API公開、タスクマネージャにてNUMA対応
  STARTコマンドでアプリ起動する際にNUMAノードを指定可能に

 この様に、BIOSレベルでのNUMA対応が規格化されたのが2000年~2002年にかけてで、同時並行して開発されたであろうAMD Opteronが翌年登場し、同年の年末には Linux Kernel 2.6 にてOSを含めたNUMA対応が開始されました。

 つまり、SAMURAI64M2が登場した1999年当時は基本ソフト側が未だNUMAには対応していなかった事に成りますので、不均衡なメモリアクセスに対してOS側やアプリが為す術は無く、MicronがBIOSに独自のNode Interleaving を施す様な対応をしていない限りは、ソフト側から見ると不可解なメモリ速度の変動が観測されたかもしれません。逆に、MicronがBIOSやノースブリッジに独自のNode Interleaving を施していたのであれば、実質的には4ch相当のメモリ帯域を有するSMP機と等価な動作をしていた可能性もあります。実際、このページの記載によりますと、それぞれのメモリバスに対してインターリーブして高速化していると書かれています。ノース間インターコネクトの帯域とレイテンシを知りたいですね。

 Slot1のFSBを4デバイス(2CPU+2ノース)で共有する想定は無いハズです。しかし、同じP6バスでもSocket8やSlot2では5デバイス(4CPU + ノース)で共有する前提で信号安定化の為に各種対策が施されているはず・・・と考えると対策さえしていれば4デバイスは可能か・・・

SMPの場合
GrizzlyBDG-SMP.png

NUMAの場合
GrizzlyBDG-NUMA.png

 こちらの記事によりますと、後継のSAMURAI-DDRの説明ではCPU毎にメモリ帯域を確保出来ると表現されていますので、その説明ならばやはりNUMAですね。

仮にカスケード接続されていた場合・・・
GrizzlyBDG-CASCADE.png

 仮にカスケードを想定して図にしてみましたが、これではCPU毎のメモリ帯域確保は出来ませんので、これじゃないですね

 このSAMURAI-DDRを使ったリファレンスマザー欲しいですね~なんといってもAGPスロット2本搭載ですよ!?Parhelia-512AGPを2枚挿せちゃいますよ!?(64bit-PCIで更に追加出来ますよ!?)

Radeon R9 nano !!!


な、なんですかこれ!?

今日発表!?

175Wで単精度8TFLOPS!倍精度は?

見れば見るほどPEZY-SCに迫る感じがヤバイ、Fijiを2個搭載したハイエンド品が出たら抜かれるって事は・・・こんな感じの事をしたら名実ともに完璧な政府基準スパコンが4Uラックマウント筺体1個に収まるって事ですかね!?いやもちろんこのグラボはコンシューマ向けでECC無いですしメモリ容量も4GBと少ないですが、Fiji版FireProが出たらヤバイですね・・・

まさに欲しいと思っていたものが来たのか!?
倍精度が気に成る・・・ TESLA K80 の演算性能をも凌ぎ圧倒する製品なのか!?

この消費電力の圧倒的な落ち方は、倍精度演算を完全OFFしてるとか? クロック変動を細かな回路モジュール単位で細分化したのか?


プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR