y-cruncher に Zen 対応版 v0.7.2.9468

新しいバージョン v0.7.2.9468 にZen対応の ZD1-Yukina が含まれています。
 ->デュアルソケット・ザ・ワールドの目次は こちら へ。

AMD Ryzen7 1700 定格で1億桁を測定しました。起動して 0 -> 1 -> 3 です。
Ryzen7-1700-yc.png

たぶん、KabyLake 4C/8T の同一クロック設定と比較して若干速い程度ではないでしょうか?

今後、バージョンUPを重ねて少しづつ高速化してゆくのでは?と思います。

参考までに、CoreMA XEON 物理8コア/Sandy XEON 物理8コアとの物理8コア3GHz SSE4.1 Ushioの条件統一で比較したグラフを掲載します。
8コア3GHz比較

Sandy-EP は こちら の手法でノード0限定物理8コア縛りで起動し8スレッド設定で計測した結果です。
筆者は予定していたHaswell-EP/Broadwell-EPをスキップしたので、この世代は計測出来ません。
スポンサーサイト

PEGY が OpenCL 対応

先ほどHPを閲覧させて頂きましたらPEZYのOpenCL対応 が実現している様で、嬉しくなりました。
 ->デュアルソケット・ザ・ワールドの目次は こちら へ。

2年前に要望的に書いたので、つまり当時のモヤモヤの半分が概ね実現されたのだと思いますが、しかしマーケティング不足な面が否めないと思うのです。社長が時々メディアに搭乗して頑張っている様子が伝わって来ますが、政府の後押しが不十分なのは非常に残念です。もう国産スパコンは全部PEZYで塗り替えろという法律作った方が良いんじゃね?とさえ言えますし、スパコン以外の分野でも利用出来る様に、例えばAmazonでローエンド品の入門キットを5万円くらいで売るとか、自作PCやクリエーター系のメディアで特集を組んでもらうとか、アニメの3D映像制作に協賛するとか、ディープラーニング機材を政府機関や大学に助成金使って納入するとか、そういったプロジェクトを文字通り並列実行できると良いのですが、それには組織体力が必要で、ベンチャー企業の悩みどころです。ですから政府の後押しが必要なんです。
 
市場原理という言葉をインテリは盲信したがりますが、市場原理と現実は乖離していて、実際には、メディアを制御出来る巨大資本が常に勝利してきた事を隠蔽する為の隠蓑が市場原理という仮想空間上の空想です。 ここで言う巨大資本とは、1部上場した企業といった意味ではなく、より巨大でグローバルな資本という意味で、例えばInte1やM$の株主一族の様なものを指しています。三井三菱住友などの財閥が解体された理由は、彼らに対抗出来る存在だったからに外なりません・・・
 


Broadwell-EP Turbo frequency

Broadwell-EP の ターボブーストは AVX と NonAVX で異なる(非同期)クロックですから、筆者が選択する可能性のある物をピックアップして調べてみました。
 ->デュアルソケット・ザ・ワールドの目次は こちら へ。


V4-TB.png

こちら↓は多コア品との比較です。上のグラフとは色が違いますので御注意下さい(そうやって混乱させる所が某社に・・・)。
V4-TBh2.png


伝統的に、Intelのハイエンド(筆者の中で)は3GHzで最多コアの品だと決めてきました。

IvyBridge-EPまでは、この法則で全コアTBも含めて考えると問題無く選定出来るのですが、Haswell-EP以降、この法則が崩れているのです。

恐らく Zen + GCN の脅威に対抗する為にMP用に設計した低クロック多コアの石をDP用に転化した為だと思うのですが、GPGPUの代りに強引にAVXを強化してバランスが崩れている側面も有ると思います。

有名大学の教授などもIntelやSIのセミナー洗脳を受けてAVX2やAVX512を自覚なしにステマして実態を見え難くしていると思うのです。

そこで、グラフの3GHzの所に赤線を引いて、最多コアはどれかと眺めているのですが・・・
 
ダイ・レイアウトやクロック設定から言って設計上のWS用ハイエンドは E5-2667 V4 だと思うのですが、マーケティング的な設定としては E5-2687W V4 がWS用ハイエンドに成っているのだと思います。そして筆者の基準から考えると E5-2697A V4 が最も近いのですが AVX の上限が 2.9GHz ですし、ダイ上の8コアが死んでいるのかと思うと、どれもが選択から除外されてしまうのです。
 
AMDがK8を出した頃、Intelは焦って新商品を無理矢理連発して微妙な製品ばかりが登場してはすぐに消えて行きましたが、その頃に雰囲気が似ているのです。当時の筆者は、しばらくIntelを買いませんでしたが、今回もそうなるかもしれません。

一言でいえば(筆者の気分的にですが)『アタリショックの再来』に近いのです。ガツンとくる強烈なインパクトの有る設定で出荷して欲しいですね。
 
 

Areca RAID カードに至る筆者の遍歴と岐路

筆者のRAID自作歴とも・・・
 ->デュアルソケット・ザ・ワールドの目次は こちら へどうぞ。

1号機4号機 (1999年~2001年頃)
 Promise FastTrak66(33だったかもしれない) で RAID-0 を組んだのが自作初RAIDでした。
 HDDが1台壊れて全体のデータ救出が出来ないという痛い思いをした事が今でも強烈な体験として記憶に残っています。
 仕事のデータが消えてしまうのは業務に関わる大勢の人に迷惑を掛ける取り返しのつかない痛過ぎる経験なのです。

5号機7号機 (2001年~2003年頃)
 64Bit/66MHz のPCIスロットを搭載したマザーボードでは高速RAIDカードが欲しく成りました。
 RAID-0 でトラウマに近い強烈な負の体験をした筆者は、それ以降 RAID-5(後にRAID-6) が必須だと考える様になりました。
 当時の常識としてはAdaptec製のSCSI-RAIDに成るのですが、RAIDの復旧作業が難しい事に加えSCSI-HDDは爆熱・轟音・低容量で私の用途には向かないと判断し、行き着いた先がSATAが使える 3Ware Escalade 8500-8 *1 でした。
 3Ware Escalade 8500 は、とても使い易くてRAIDの復旧作業が簡単でしたので愛着を持って使っていましたが、RAID-5が若干遅い点には不満が残りました。しかし当時は RAID-5 では遅くなって当然、 Escalade の真骨頂は RAID-1 での高速化と考えていたのです。

8号機11号機 (2003年~2006年頃)
 PCI-X(64Bit/133MHz)スロットを搭載したマザーボードでは 3Ware Escalade 8500 が力不足と感じる様に成り、ネットで英語圏も含めてPCI-X対応品を探した結果、最初に購入したものが LSI-Logic SATA 150-6 でしたが、届いた物にはβ版のFirmwareが入っていて、正式版Firmwareが配布されるまでまともに動きませんで、かつ、RAIDの設定が難解で復旧作業も面倒(覚えるまでに数日を要し、急いでいる時の復旧作業にストレスを感じる事が容易に想像できました) かつWriteBackにはBBUが必須など、筆者には総じて使い辛く、次に試したのが Areca ARC-1120 でした。
 Areca ARC-1120 の恐らく初ロットを購入した為、当初の状況は LSI-Logic SATA 150-6 と似たりよったりでしたが、購入後に登場したFirmware更新で問題も解消し、このカードで筆者は初めて RAID-6 を知り、かつ、単機のHDDよりも高速なランダムアクセスが出来る RAID-6 に驚愕、これ以上の選択肢が有るのだろうか!?とArecaの虜になってゆくのです。

12号機15号機 ( 2008年~2011年頃 )
 マザーボードから PCI-X が消え、時代が PCI-Express x8 に変移しつつある事を感じた筆者は、 Areca 1231ML と Areca 1680ix12 を購入、4GBキャッシュをRAIDカードに搭載しつつ、前世代のARC-1120とのアレイ移行がモバイルラックによる抜き差しだけで簡単に出来る事や、RAID-6 + バックグランドスクラブによる堅牢性、ArecaによるIntel製SSD対応Firmwareのダウンロード提供で更なる高速化など、これ以上を望む必要性がなくなりつつありました。
 この頃には様々なRAIDカード(HigiPoint / LSI / Sil / Raidcore / チップセット内蔵 / etc...) を試してみましたが Areca を選択した事が間違いではなかった事を再認識する結果となり、これ以降、Areca 以外のRAIDには興味が無くなってゆきました。

16号機 (2012年初頭)
 16号機はマザーがECCに対応していない事や小型ITXである事などから RAID を組まず単機のSSD搭載にしていますので筆者の自作機では例外的存在になります。メモリにECCが無いので常用はしません、16号機は図画工作やプラモデルの延長です。

17号機20号機 ( 2012年~2015年頃 )
 ArecaはRAID用IOP(I/O Prosessor)としてARMアーキテクチャの Intel XScale を利用していましたが、Intelが、このXScaleを事業ごとMarvellに売却してしまった為に、次世代(PCIe 3.0 / 6G)製品で使うIOPの供給が断たれ、岐路に立たされました。
 その際に利用したコントローラが、競合会社のLSI(現:ブロードコム)製ROCだった事は驚愕でしたが、それよりも驚愕したのは初代の ARC-1120 で作成したアレイを LSI-ROC搭載 ARC-1882 にそのまま無造作に挿すだけで何ら支障なく使えた互換性の高さです。
 こちら↓は当時(2012年4月)に Areca ARC-1882i で組んで使い倒したものを5年後の今日(2017/02/05)測定した結果です。ホストは19号機から換装した20号機(Piledriver 2.8GHz)です。
 4K-Read では M.2 960 PRO にも勝ってますね(その他は惨敗です苦笑)。
20170205ARC1882iI530RAID6CDM521.png
20170205ARC1882iI530RAID6ATTO305.png


21号機以降 ( 2016年以降 )
 昨年(2016年)より海外生活(日本と海外を頻繁に往復)を続ける筆者ですが、その為も有り2016年は自作をしていません。Broadwell-EPで組むか?と迷いましたが結局組みませんでした。その僅かな期間に M.2 が主流になったのかもしれず若干取り残されつつあります。
 ですが、今年(2017年)は何と言っても待望の AMD Zen が登場しますので、何とかして自作しようと考えています。
 その前哨戦?として最近20号機に R9-nano CFX を構築しましたが、 Zen には Vega でしょうね。たぶん。
 そこに組み合わせるストレージは普通に考えると M.2 だと思うのですが、これ、壊れたらどうなるんでしょうかね?怖いです。PCは同一構成で2台ぶん買えば、壊れた時に即修理出来ますが、ストレージだけは内部データが壊れたら交換出来ないキモの部分であり、その為に筆者はRAID-6、それも単機より速度が速くなり過去機とのHotSwapも出来る Areca の RAID-6 に拘ってきたのです。 M.2時代でも Areca の RAID-6 が組めるといいな・・・
 
 と言う事で2017年に組む21号機をどうしようか・・・とネットを漁っていましたら代理店(キング・テックさん)のHPから ARC-1883ix のベンチマークデータがダウンロード出来ます。たぶん ATTO Disk Benchmark にとっては速過ぎて計測不能になってますからATTOは参考に成らない事が判ります。
 ↓はキング・テックさんから拝借したものです(スミマセン、お借りしました)。
ARC1883ixx2ARC4038x2MB998AJACDM5021GB.png

 結局、キングテックさんの↑のデータを見て概ね決めてしまいました。21号機は今のところ ARC-1883 で組もうと考えていて、どのモデルにするかは後ほど決めようと思います。
 
 
Windows7 で Windows Update がうまく出来ない場合の対処法
 
 

y-cruncher 0.7.1 で x86 版の復活と Skylake 対応、高速化などが行われた。

海外生活の続く筆者ですが、自作機3台(13号機17号機20号機)を海外拠点(コンセントが220Vの地域)に移設しActivePFC搭載電源の恩恵を受けています。
それと20号機にR9-nanoを1機追加してCFX構成にしました(元はHD7970-CFX)。そこでOpenCLベンチをガンガンに回しましたらOpenCLではR9-nanoの電力リミッターが効かないのか?突然PC本体ごとPOWERダウンしてくれました。R9-nano 1台構成やHD7970-CFX構成では大丈夫だったので・・・触ると火傷するほど熱くなっていました。その後、調べてみましたらディスプレイ/モニターを接続しない側がヤバイ状態に成る様でディスプレイ/モニターをとりあえず接続しておけば、この現象は発生しない様です。(どのGPUにも共通で言える事ですがGPGPUで高負荷を掛けて使う時にはGPU搭載ファンの回転をMAXに設定しておくか水冷化するのが良いと思います)。

と、近況報告はここまでにして、本日の本題です。

y-cruncher がバージョンUPしていたので試してみました。Skylake版の追加より筆者的にはx86版復活の方が有難いです^^。

ご存知無い方向けのy-cruncherの簡単な紹介としては、ギネス記録保持のマルチコア対応 円周率計算アプリ(ベンチ)です。

↓の一覧表は、筆者の自作機での1億桁計算結果(Broadwell-EPの結果だけはネットからの拾い物)です。デュアルソケットでは主にNUMAチューニングで速度が大きく変化し、タイマー選択によっても変化します。秒数は計測の都度変化するので数回実行した結果を四捨五入しています。その為、下表は参考値程度と考えて下さい。表はクリック/タッチ/タップすると拡大出来ます。
 
y-cruncher-ALL4.png


表の右端の列は、GFLOPS値 × 計算速度 ですが、これにより演算機の計算効率を見ようとしたのですが、GFLOPS値からではよく判らなくなってしまいました。FMAとMULやADDを単純にFLOPSで比較しては駄目だと改めて痛感ですね。今後はFMA搭載機が主流となるでしょう。演算機の指標がLINPACKからHPCG(LAPACK)へと移行した事が大きく関与している事も確かだと思います。

y-cruncher のバージョンアップ v0.6.8 -> v0.7.1 で 20号機で1秒、17号機では3秒ほど高速化していますが、逆に13号機では HTT-off で2秒、HTT-on では5秒近く遅くなりました(NUMA関連設定の影響かも?)。他の機体も計測し直せば速度改善(改悪)しているかもしれませんが、冒頭に記載しました通り、他の機体は日本に置き去りですので、次回の帰国まで再計測出来ませんOrz)
 
Windows7 で Windows Update がうまく出来ない場合の対処法
 
 
 
プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR