PEGY が OpenCL 対応

先ほどHPを閲覧させて頂きましたらPEZYのOpenCL対応 が実現している様で、嬉しくなりました。
 ->デュアルソケット・ザ・ワールドの目次は こちら へ。

2年前に要望的に書いたので、つまり当時のモヤモヤの半分が概ね実現されたのだと思いますが、しかしマーケティング不足な面が否めないと思うのです。社長が時々メディアに搭乗して頑張っている様子が伝わって来ますが、政府の後押しが不十分なのは非常に残念です。もう国産スパコンは全部PEZYで塗り替えろという法律作った方が良いんじゃね?とさえ言えますし、スパコン以外の分野でも利用出来る様に、例えばAmazonでローエンド品の入門キットを5万円くらいで売るとか、自作PCやクリエーター系のメディアで特集を組んでもらうとか、アニメの3D映像制作に協賛するとか、ディープラーニング機材を政府機関や大学に助成金使って納入するとか、そういったプロジェクトを文字通り並列実行できると良いのですが、それには組織体力が必要で、ベンチャー企業の悩みどころです。ですから政府の後押しが必要なんです。
 
市場原理という言葉をインテリは盲信したがりますが、市場原理と現実は乖離していて、実際には、メディアを制御出来る巨大資本が常に勝利してきた事を隠蔽する為の隠蓑が市場原理という仮想空間上の空想です。 ここで言う巨大資本とは、1部上場した企業といった意味ではなく、より巨大でグローバルな資本という意味で、例えばInte1やM$の株主一族の様なものを指しています。三井三菱住友などの財閥が解体された理由は、彼らに対抗出来る存在だったからに外なりません・・・
 


スポンサーサイト

Broadwell-EP Turbo frequency

Broadwell-EP の ターボブーストは AVX と NonAVX で異なる(非同期)クロックですから、筆者が選択する可能性のある物をピックアップして調べてみました。
 ->デュアルソケット・ザ・ワールドの目次は こちら へ。


V4-TB.png

こちら↓は多コア品との比較です。上のグラフとは色が違いますので御注意下さい(そうやって混乱させる所が某社に・・・)。
V4-TBh2.png


伝統的に、Intelのハイエンド(筆者の中で)は3GHzで最多コアの品だと決めてきました。

IvyBridge-EPまでは、この法則で全コアTBも含めて考えると問題無く選定出来るのですが、Haswell-EP以降、この法則が崩れているのです。

恐らく Zen + GCN の脅威に対抗する為にMP用に設計した低クロック多コアの石をDP用に転化した為だと思うのですが、GPGPUの代りに強引にAVXを強化してバランスが崩れている側面も有ると思います。

有名大学の教授などもIntelやSIのセミナー洗脳を受けてAVX2やAVX512を自覚なしにステマして実態を見え難くしていると思うのです。

そこで、グラフの3GHzの所に赤線を引いて、最多コアはどれかと眺めているのですが・・・
 
ダイ・レイアウトやクロック設定から言って設計上のWS用ハイエンドは E5-2667 V4 だと思うのですが、マーケティング的な設定としては E5-2687W V4 がWS用ハイエンドに成っているのだと思います。そして筆者の基準から考えると E5-2697A V4 が最も近いのですが AVX の上限が 2.9GHz ですし、ダイ上の8コアが死んでいるのかと思うと、どれもが選択から除外されてしまうのです。
 
AMDがK8を出した頃、Intelは焦って新商品を無理矢理連発して微妙な製品ばかりが登場してはすぐに消えて行きましたが、その頃に雰囲気が似ているのです。当時の筆者は、しばらくIntelを買いませんでしたが、今回もそうなるかもしれません。

一言でいえば(筆者の気分的にですが)『アタリショックの再来』に近いのです。ガツンとくる強烈なインパクトの有る設定で出荷して欲しいですね。
 
 

Areca RAID カードに至る筆者の遍歴と岐路

筆者のRAID自作歴とも・・・
 ->デュアルソケット・ザ・ワールドの目次は こちら へどうぞ。

1号機4号機 (1999年~2001年頃)
 Promise FastTrak66(33だったかもしれない) で RAID-0 を組んだのが自作初RAIDでした。
 HDDが1台壊れて全体のデータ救出が出来ないという痛い思いをした事が今でも強烈な体験として記憶に残っています。
 仕事のデータが消えてしまうのは業務に関わる大勢の人に迷惑を掛ける取り返しのつかない痛過ぎる経験なのです。

5号機7号機 (2001年~2003年頃)
 64Bit/66MHz のPCIスロットを搭載したマザーボードでは高速RAIDカードが欲しく成りました。
 RAID-0 でトラウマに近い強烈な負の体験をした筆者は、それ以降 RAID-5(後にRAID-6) が必須だと考える様になりました。
 当時の常識としてはAdaptec製のSCSI-RAIDに成るのですが、RAIDの復旧作業が難しい事に加えSCSI-HDDは爆熱・轟音・低容量で私の用途には向かないと判断し、行き着いた先がSATAが使える 3Ware Escalade 8500-8 *1 でした。
 3Ware Escalade 8500 は、とても使い易くてRAIDの復旧作業が簡単でしたので愛着を持って使っていましたが、RAID-5が若干遅い点には不満が残りました。しかし当時は RAID-5 では遅くなって当然、 Escalade の真骨頂は RAID-1 での高速化と考えていたのです。

8号機11号機 (2003年~2006年頃)
 PCI-X(64Bit/133MHz)スロットを搭載したマザーボードでは 3Ware Escalade 8500 が力不足と感じる様に成り、ネットで英語圏も含めてPCI-X対応品を探した結果、最初に購入したものが LSI-Logic SATA 150-6 でしたが、届いた物にはβ版のFirmwareが入っていて、正式版Firmwareが配布されるまでまともに動きませんで、かつ、RAIDの設定が難解で復旧作業も面倒(覚えるまでに数日を要し、急いでいる時の復旧作業にストレスを感じる事が容易に想像できました) かつWriteBackにはBBUが必須など、筆者には総じて使い辛く、次に試したのが Areca ARC-1120 でした。
 Areca ARC-1120 の恐らく初ロットを購入した為、当初の状況は LSI-Logic SATA 150-6 と似たりよったりでしたが、購入後に登場したFirmware更新で問題も解消し、このカードで筆者は初めて RAID-6 を知り、かつ、単機のHDDよりも高速なランダムアクセスが出来る RAID-6 に驚愕、これ以上の選択肢が有るのだろうか!?とArecaの虜になってゆくのです。

12号機15号機 ( 2008年~2011年頃 )
 マザーボードから PCI-X が消え、時代が PCI-Express x8 に変移しつつある事を感じた筆者は、 Areca 1231ML と Areca 1680ix12 を購入、4GBキャッシュをRAIDカードに搭載しつつ、前世代のARC-1120とのアレイ移行がモバイルラックによる抜き差しだけで簡単に出来る事や、RAID-6 + バックグランドスクラブによる堅牢性、ArecaによるIntel製SSD対応Firmwareのダウンロード提供で更なる高速化など、これ以上を望む必要性がなくなりつつありました。
 この頃には様々なRAIDカード(HigiPoint / LSI / Sil / Raidcore / チップセット内蔵 / etc...) を試してみましたが Areca を選択した事が間違いではなかった事を再認識する結果となり、これ以降、Areca 以外のRAIDには興味が無くなってゆきました。

16号機 (2012年初頭)
 16号機はマザーがECCに対応していない事や小型ITXである事などから RAID を組まず単機のSSD搭載にしていますので筆者の自作機では例外的存在になります。メモリにECCが無いので常用はしません、16号機は図画工作やプラモデルの延長です。

17号機20号機 ( 2012年~2015年頃 )
 ArecaはRAID用IOP(I/O Prosessor)としてARMアーキテクチャの Intel XScale を利用していましたが、Intelが、このXScaleを事業ごとMarvellに売却してしまった為に、次世代(PCIe 3.0 / 6G)製品で使うIOPの供給が断たれ、岐路に立たされました。
 その際に利用したコントローラが、競合会社のLSI(現:ブロードコム)製ROCだった事は驚愕でしたが、それよりも驚愕したのは初代の ARC-1120 で作成したアレイを LSI-ROC搭載 ARC-1882 にそのまま無造作に挿すだけで何ら支障なく使えた互換性の高さです。
 こちら↓は当時(2012年4月)に Areca ARC-1882i で組んで使い倒したものを5年後の今日(2017/02/05)測定した結果です。ホストは19号機から換装した20号機(Piledriver 2.8GHz)です。
 4K-Read では M.2 960 PRO にも勝ってますね(その他は惨敗です苦笑)。
20170205ARC1882iI530RAID6CDM521.png
20170205ARC1882iI530RAID6ATTO305.png


21号機以降 ( 2016年以降 )
 昨年(2016年)より海外生活(日本と海外を頻繁に往復)を続ける筆者ですが、その為も有り2016年は自作をしていません。Broadwell-EPで組むか?と迷いましたが結局組みませんでした。その僅かな期間に M.2 が主流になったのかもしれず若干取り残されつつあります。
 ですが、今年(2017年)は何と言っても待望の AMD Zen が登場しますので、何とかして自作しようと考えています。
 その前哨戦?として最近20号機に R9-nano CFX を構築しましたが、 Zen には Vega でしょうね。たぶん。
 そこに組み合わせるストレージは普通に考えると M.2 だと思うのですが、これ、壊れたらどうなるんでしょうかね?怖いです。PCは同一構成で2台ぶん買えば、壊れた時に即修理出来ますが、ストレージだけは内部データが壊れたら交換出来ないキモの部分であり、その為に筆者はRAID-6、それも単機より速度が速くなり過去機とのHotSwapも出来る Areca の RAID-6 に拘ってきたのです。 M.2時代でも Areca の RAID-6 が組めるといいな・・・
 
 と言う事で2017年に組む21号機をどうしようか・・・とネットを漁っていましたら代理店(キング・テックさん)のHPから ARC-1883ix のベンチマークデータがダウンロード出来ます。たぶん ATTO Disk Benchmark にとっては速過ぎて計測不能になってますからATTOは参考に成らない事が判ります。
 ↓はキング・テックさんから拝借したものです(スミマセン、お借りしました)。
ARC1883ixx2ARC4038x2MB998AJACDM5021GB.png

 結局、キングテックさんの↑のデータを見て概ね決めてしまいました。21号機は今のところ ARC-1883 で組もうと考えていて、どのモデルにするかは後ほど決めようと思います。
 
 
Windows7 で Windows Update がうまく出来ない場合の対処法
 
 

ついにソケット版XEON Phiが来た!


Super K1SPE (ATX / PCIe x16 + x16 + x4)
K1SPE.jpg


こちらが対応CPUです。

基板はATXサイズですが電源が12V-8Pinを2本備えたEPS系電源になりますので御注意下さい。

LGA3647です。
メモリはデュアルとかトリプルとかじゃなく6chです。
コア数は最大72コア・・・

クルクルと言われ続けて、ようやく来ましたね。いつ発売なのでしょう?
ベアボーンはこちらです。

Skylake-EPとソケット互換になるのか?
これのDhualSocket版が登場するか?
気になる所です・・・

自作erとしては、これであえてSuperPIを実行してみたくなりますよね!?

 

カタログスペックから選ぶPC電源


 80Plus認証を取得したPC電源リストの中から、カタログスペック(性能)のみで選別したリストです。耐久性や故障率などは未調査ですが概ね良好と思われる物を選んでいます。

 筆者が自分で買う場合にどれにしようか?と考えて選んだリストでもありますが、電源購入では毎回の事ですが国産ニプロンを選ぶか?それとも他の電源から選ぶか?で悩み、とりあえず最初にニプロンのカタログから合致する物を探して、希望に合致するスペックが無ければ他から探すパターンが多いです。今までは Seasonic の 80Plus Platinum SS-1000XP (終息) を選ぶ事が多かったですが、現行品からリストを作ると Super Flower が圧倒的に多いです。自作用で Super Flower はあまり聞かないかもしれませんがメーカー製PCやサーバに採用されている事が多いメーカーです。

選別基準:
 ・80Plus Titanium 認証取得
 ・同じ出力で効率が最も高いもの
 ・AC100V(50-60Hz)対応を明記しているもの
 ・販売終息品は除外
 ・AC波形が綺麗なもの

POWERCHOICE6.png

 力率と効率の違いに付いてはこちらの記事を参照下さい。

 参考として picoPSU-160-XT を掲載しています(この品は多くの偽物が出回っているので御注意下さい)、表中では10%負荷時のACアダプタの力率を25%として掲載していますが力率25%は推測値です。データシートに10%の計測値が掲載されていなかった為、負荷25%で力率48%(0.485)の記載を元に筆者が推測したのですから、本当はもう少し良い値かもしれません。

 ブレーカ欄は、皮相電力を元にブレーカのアンペアを概算したもので、どのコンセントに挿すか?を考える際に参考にする為に設けました。UPSを選定する際にも皮相電力やブレーカのアンペアは必要になる情報です。

 リストにして判ったのですが、500W品の100%出力時の損失と、1000W品の50%出力時の損失を比較すると、やはり高出力品を選択して50%くらいで利用するのが(発熱が少なく、その為ファン回転を抑え静音に出来るので)良さそうです。50%負荷時の12V出力のワット数を基準に電源を選択するのが手っ取り早いと思います(CPUとGPUのTDP合計を電源の12V50%出力に合わせると最も効率よく低発熱で静音に成ると思います)。

 筆者は、概ね下記の様な構成が多いです。
  CPU 100W × 2個 定格
  GPU 250W × 2個 ダウンクロック
 GPUをダウンクロックしている為、最大負荷を掛けても概ね500~600Wで、電源は冒頭に書きましたSeasonic 1000W品を搭載した機体が多いです。

 普段GPUをダウンクロックしているのは90℃を超える様な使い方は短命に成りますので負荷を掛けても70℃以下に成る様に設定している為で、ちょうどR9-FuryXを買ってR9-nanoの様な設定に変更して利用していると思えば御理解頂けるのではないかと思います。R9-nano登場以前は、こういった使い方はなかなか理解してもらえません(ミドルレンジのGPUを買ってオーバークロックした方が安くて性能も良いという意見が多い)でしたし、筆者自身も以前はこんな事をしていましたが、この後、GTX580が登場した際に3枚購入しまして、そのうち2枚を13号機に搭載してダウンクロックして利用しています。

 表中のAC波形は筆者個人の主観によるランク付けで、波形が綺麗な物(つまりノイズが少なく力率が高い物)をAランクからFランクまでランク付けしてDランク以下を選択から削除しました。
 概ね、下記の様な基準です。
 Aランク:電流の波形が概ね電圧波形に近い綺麗な正弦波
 Bランク:若干位相がズレているけれども、それ以外はAランクと同じ
 Cランク:小刻みなブレや歪みが有る
 Dランク:かなりよれている
 Eランク:大きくよれている
 Fランク:酷くよれている

 Aランクの例としては FSP Technology の FSP400-60AGTAA です。これはLenovoのOEM品として採用されている品ですが単品販売されているか?不明(未調査)です。Lenovoの保守パーツとして(従ってLenovoのパーツ番号で)流通している可能性はあると思います。

 Bランクの例はAndyson International の AD-700yyZZZ です。綺麗な波形ですが、若干位相がズレています。とは言え一般的なPC電源と比べると超優秀で、ニプロン電源Seasonic電源の多くはこれに似ていますが位相のズレがもう少し多い印象があります(それでもDランク以下の物と比べたら優秀です)。位相のズレは雷サージ保護回路に起因する物かもしれず、特にニプロンは0A出力対応に加え保護回路が凄く、各種保安基準や検査に合格させた物が多いので、その影響ではないか?と。その意味ではAランクの綺麗過ぎる電源には雷サージ保護は付いてないかも?しれません。

 Cランクの例は Enhance Electronics の ATX-1850 です。この品は玄人志向のOEM品 ( KRPW-TI500W/94+ ) に採用されていると思われ、国内でも比較的容易に入手出来ます。この品も 80Plus Titanium認証取得品ですから、普通に考えれば超優秀な電源です。SUPER FLOWER製電源の多くも似た印象の物や、もう少し小刻みに歪む物が多いですが SUPER FLOWERは効率が非常に(圧倒的に)高い=発熱が非常に少ないのが特徴と言えそうです。SUPER FLOWER でも1600Wのハイエンド品は筆者基準でAランクで、この品はEVGAが SuperNOVA 1600 T2 という型番で $400 くらいでOEM販売していますが AC115V仕様でしたのでリストには掲載していません。

 Dランク以下は、あえてここでは掲載しません。あくまで筆者の主観ですから御了承下さい。負荷変動時にどの様な変化をするか?など興味はありますが、それを知る為には入手して自分でテストしないとですね(そういったデータを自社Webサイトで公開している例もあります)。

 低出力品でありながら波形が物凄く綺麗な電源は、概ね大手のメーカーPCに搭載する為のOEM品である事が多く、そういった品は外見に拘りが無く安っぽく見えます。逆に外見が綺麗に塗装されていて自作用として単品購入出来る電源は波形が汚い物が多いです。表には掲載されていない200~350Wの良質な電源を探そうとするとOEM品ばかりで自作用としては販売されていないものばかりで、そういった品はオークション等で状態の良い物が出るのを待つしかないかもしれません。例えば2011年製の Delta DPS-300ADV などは非常に魅力的に見えるのですが、これと同等スペックの現行モデルで単品販売されている物は探しても見当たりませんでした。

筆者自作機の12V概算最大消費電力推移

POWERTRANSITION.png
ネトバ + VLIW の組み合わせが急速な消費電力増大に繋がった様です。AMD Zenで組む機体も700W前後に成るか?それとも・・・

00号機①:50W
 CPU Pentium w/MMX 233MHz TDP17W / MaximumPower22W ×2
 GPU GeForce 6200A PCI ×1 (12Vは最大6W)
 合計 22W x 2 + 6W = 50W

00号機②:26W
 CPU K6III+ @600MHz MaximumPower20W ×1
 GPU GeForce 8400GS PCI ×1 (12Vは最大6W)
 合計 20W + 6W = 26W

04号機:82W
 CPU PentiumIII-S @1GHz MaximumPower32W ×2
 GPU Parhelia 50W以下(うち12Vは最大12W) ×2
 合計 32W x 2 + 12W + 6W = 82W

05号機:340W
 CPU Athlon MP 2800+ MaximumPower60W ×2 (但し片側VRMは5V入力)
 GPU GTS250 GreenEdition + PCI下駄 140W ×2
 合計 60W + 140W x 2 = 340W

06号機:68W
 CPU PentiumIII-S 1.4GHz MaximumPower32W ×2
 GPU GeForce8600GT PCI 55W以下(うち12Vは最大6W) ×1
 合計 32W x 2 + 6W = 68W

07号機:254W
 CPU XEON MP 3GHz TDP85W / MaximumPower97W ×2
 GPU HD4670 TDP60W(MAX) ×1
 合計 97W x 2 + 60W = 254W

09号機:202W
 CPU Opteron 290 TDP95W ×2
 GPU Quadro NVS 280 12W ×1
 合計 95W x 2 + 12W = 202W

10号機:658W
 CPU XEON 5050 TDP95W / MaximumPower139W ×2
 GPU HD4890 TDP190W(MAX) ×2
 合計 139W x 2 + 190W x 2 = 658W

11号機:472W
 CPU Opteron 290 TDP95W ×2
 GPU 9800GTX+ 141W ×2
 合計 95W x 2 + 141W x 2 = 472W

12号機:172W
 CPU XEON L5240 TDP40W / MaximumPower70W ×2
 GPU GT730 23W ×1
 合計 70W x 2 + 32W x 1 = 172W

13号機:638W
 CPU XEON X5675 TDP95W (TURBO-OFF) ×2
 GPU GTX580 TDP224W ×2
 合計 95W x 2 + 224W x 2 = 638W

14号機:84W
 CPU XEON LV TDP31W ×2
 GPU GT730 23W ×1
 合計 31W x 2 + 23 = 84W

15号機:638W
 CPU Opteron 2387 TDP115W ×2
 GPU GTX285 204W ×2
 合計 115W x 2 + 204W x 2 = 638W

16号機:不明(実測最大消費電力40W)
 CPU VIA QuadCore
 GPU Chrome640IGP

17号機:770W
 CPU XEON E5-2670 TDP110W / MaximumPower135W ×2
 GPU GTX780ti 250W ×2
 合計 135W x 2 + 250W x 2 = 770W

18号機:772W
 CPU XEON E5450 TDP80W / MaximumPower133W ×2
 GPU HD5870 Eyefinity6 TDP228(MAX) ×2
 合計 133W x 2 + 228W x 2 = 772W

19号機:730W
 CPU Opteron 4184 TDP95W / MaximumPower115W ×2
 GPU HD6970 250W ×2
 合計 115W x 2 + 250W x 2 = 730W

20号機:730W
 CPU Opteron 6380 TDP115W ×2
 GPU HD7970 250W ×2
 合計 115W x 2 + 250W x 2 = 730W


 筆者の自作機2台を1個のコンセントに接続して最大負荷を掛けると、ブレーカのギリギリまで皮相電力が上昇し、そのコンセントと同系統のコンセントで何か他の機器を使うと・・・という事が判りますし、力率の悪い電源の場合は2台の負荷だけでブレーカ断されてしまう可能性が高いと思います。
 
 
プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR