Areca RAID カードに至る筆者の遍歴と岐路

筆者のRAID自作歴とも・・・
 ->デュアルソケット・ザ・ワールドの目次は こちら へどうぞ。

1号機4号機 (1999年~2001年頃)
 Promise FastTrak66(33だったかもしれない) で RAID-0 を組んだのが自作初RAIDでした。
 HDDが1台壊れて全体のデータ救出が出来ないという痛い思いをした事が今でも強烈な体験として記憶に残っています。
 仕事のデータが消えてしまうのは業務に関わる大勢の人に迷惑を掛ける取り返しのつかない痛過ぎる経験なのです。

5号機7号機 (2001年~2003年頃)
 64Bit/66MHz のPCIスロットを搭載したマザーボードでは高速RAIDカードが欲しく成りました。
 RAID-0 でトラウマに近い強烈な負の体験をした筆者は、それ以降 RAID-5(後にRAID-6) が必須だと考える様になりました。
 当時の常識としてはAdaptec製のSCSI-RAIDに成るのですが、RAIDの復旧作業が難しい事に加えSCSI-HDDは爆熱・轟音・低容量で私の用途には向かないと判断し、行き着いた先がSATAが使える 3Ware Escalade 8500-8 *1 でした。
 3Ware Escalade 8500 は、とても使い易くてRAIDの復旧作業が簡単でしたので愛着を持って使っていましたが、RAID-5が若干遅い点には不満が残りました。しかし当時は RAID-5 では遅くなって当然、 Escalade の真骨頂は RAID-1 での高速化と考えていたのです。

8号機11号機 (2003年~2006年頃)
 PCI-X(64Bit/133MHz)スロットを搭載したマザーボードでは 3Ware Escalade 8500 が力不足と感じる様に成り、ネットで英語圏も含めてPCI-X対応品を探した結果、最初に購入したものが LSI-Logic SATA 150-6 でしたが、届いた物にはβ版のFirmwareが入っていて、正式版Firmwareが配布されるまでまともに動きませんで、かつ、RAIDの設定が難解で復旧作業も面倒(覚えるまでに数日を要し、急いでいる時の復旧作業にストレスを感じる事が容易に想像できました) かつWriteBackにはBBUが必須など、筆者には総じて使い辛く、次に試したのが Areca ARC-1120 でした。
 Areca ARC-1120 の恐らく初ロットを購入した為、当初の状況は LSI-Logic SATA 150-6 と似たりよったりでしたが、購入後に登場したFirmware更新で問題も解消し、このカードで筆者は初めて RAID-6 を知り、かつ、単機のHDDよりも高速なランダムアクセスが出来る RAID-6 に驚愕、これ以上の選択肢が有るのだろうか!?とArecaの虜になってゆくのです。

12号機15号機 ( 2008年~2011年頃 )
 マザーボードから PCI-X が消え、時代が PCI-Express x8 に変移しつつある事を感じた筆者は、 Areca 1231ML と Areca 1680ix12 を購入、4GBキャッシュをRAIDカードに搭載しつつ、前世代のARC-1120とのアレイ移行がモバイルラックによる抜き差しだけで簡単に出来る事や、RAID-6 + バックグランドスクラブによる堅牢性、ArecaによるIntel製SSD対応Firmwareのダウンロード提供で更なる高速化など、これ以上を望む必要性がなくなりつつありました。
 この頃には様々なRAIDカード(HigiPoint / LSI / Sil / Raidcore / チップセット内蔵 / etc...) を試してみましたが Areca を選択した事が間違いではなかった事を再認識する結果となり、これ以降、Areca 以外のRAIDには興味が無くなってゆきました。

16号機 (2012年初頭)
 16号機はマザーがECCに対応していない事や小型ITXである事などから RAID を組まず単機のSSD搭載にしていますので筆者の自作機では例外的存在になります。メモリにECCが無いので常用はしません、16号機は図画工作やプラモデルの延長です。

17号機20号機 ( 2012年~2015年頃 )
 ArecaはRAID用IOP(I/O Prosessor)としてARMアーキテクチャの Intel XScale を利用していましたが、Intelが、このXScaleを事業ごとMarvellに売却してしまった為に、次世代(PCIe 3.0 / 6G)製品で使うIOPの供給が断たれ、岐路に立たされました。
 その際に利用したコントローラが、競合会社のLSI(現:ブロードコム)製ROCだった事は驚愕でしたが、それよりも驚愕したのは初代の ARC-1120 で作成したアレイを LSI-ROC搭載 ARC-1882 にそのまま無造作に挿すだけで何ら支障なく使えた互換性の高さです。
 こちら↓は当時(2012年4月)に Areca ARC-1882i で組んで使い倒したものを5年後の今日(2017/02/05)測定した結果です。ホストは19号機から換装した20号機(Piledriver 2.8GHz)です。
 4K-Read では M.2 960 PRO にも勝ってますね(その他は惨敗です苦笑)。
20170205ARC1882iI530RAID6CDM521.png
20170205ARC1882iI530RAID6ATTO305.png


21号機以降 ( 2016年以降 )
 昨年(2016年)より海外生活(日本と海外を頻繁に往復)を続ける筆者ですが、その為も有り2016年は自作をしていません。Broadwell-EPで組むか?と迷いましたが結局組みませんでした。その僅かな期間に M.2 が主流になったのかもしれず若干取り残されつつあります。
 ですが、今年(2017年)は何と言っても待望の AMD Zen が登場しますので、何とかして自作しようと考えています。
 その前哨戦?として最近20号機に R9-nano CFX を構築しましたが、 Zen には Vega でしょうね。たぶん。
 そこに組み合わせるストレージは普通に考えると M.2 だと思うのですが、これ、壊れたらどうなるんでしょうかね?怖いです。PCは同一構成で2台ぶん買えば、壊れた時に即修理出来ますが、ストレージだけは内部データが壊れたら交換出来ないキモの部分であり、その為に筆者はRAID-6、それも単機より速度が速くなり過去機とのHotSwapも出来る Areca の RAID-6 に拘ってきたのです。 M.2時代でも Areca の RAID-6 が組めるといいな・・・
 
 と言う事で2017年に組む21号機をどうしようか・・・とネットを漁っていましたら代理店(キング・テックさん)のHPから ARC-1883ix のベンチマークデータがダウンロード出来ます。たぶん ATTO Disk Benchmark にとっては速過ぎて計測不能になってますからATTOは参考に成らない事が判ります。
 ↓はキング・テックさんから拝借したものです(スミマセン、お借りしました)。
ARC1883ixx2ARC4038x2MB998AJACDM5021GB.png

 結局、キングテックさんの↑のデータを見て概ね決めてしまいました。21号機は今のところ ARC-1883 で組もうと考えていて、どのモデルにするかは後ほど決めようと思います。
 
 
Windows7 で Windows Update がうまく出来ない場合の対処法
 
 
スポンサーサイト

y-cruncher 0.7.1 で x86 版の復活と Skylake 対応、高速化などが行われた。

海外生活の続く筆者ですが、自作機3台(13号機17号機20号機)を海外拠点(コンセントが220Vの地域)に移設しActivePFC搭載電源の恩恵を受けています。
それと20号機にR9-nanoを1機追加してCFX構成にしました(元はHD7970-CFX)。そこでOpenCLベンチをガンガンに回しましたらOpenCLではR9-nanoの電力リミッターが効かないのか?突然PC本体ごとPOWERダウンしてくれました。R9-nano 1台構成やHD7970-CFX構成では大丈夫だったので・・・触ると火傷するほど熱くなっていました。その後、調べてみましたらディスプレイ/モニターを接続しない側がヤバイ状態に成る様でディスプレイ/モニターをとりあえず接続しておけば、この現象は発生しない様です。(どのGPUにも共通で言える事ですがGPGPUで高負荷を掛けて使う時にはGPU搭載ファンの回転をMAXに設定しておくか水冷化するのが良いと思います)。

と、近況報告はここまでにして、本日の本題です。

y-cruncher がバージョンUPしていたので試してみました。Skylake版の追加より筆者的にはx86版復活の方が有難いです^^。

ご存知無い方向けのy-cruncherの簡単な紹介としては、ギネス記録保持のマルチコア対応 円周率計算アプリ(ベンチ)です。

↓の一覧表は、筆者の自作機での1億桁計算結果(Broadwell-EPの結果だけはネットからの拾い物)です。デュアルソケットでは主にNUMAチューニングで速度が大きく変化し、タイマー選択によっても変化します。秒数は計測の都度変化するので数回実行した結果を四捨五入しています。その為、下表は参考値程度と考えて下さい。表はクリック/タッチ/タップすると拡大出来ます。
 
y-cruncher-ALL4.png


表の右端の列は、GFLOPS値 × 計算速度 ですが、これにより演算機の計算効率を見ようとしたのですが、GFLOPS値からではよく判らなくなってしまいました。FMAとMULやADDを単純にFLOPSで比較しては駄目だと改めて痛感ですね。今後はFMA搭載機が主流となるでしょう。演算機の指標がLINPACKからHPCG(LAPACK)へと移行した事が大きく関与している事も確かだと思います。

y-cruncher のバージョンアップ v0.6.8 -> v0.7.1 で 20号機で1秒、17号機では3秒ほど高速化していますが、逆に13号機では HTT-off で2秒、HTT-on では5秒近く遅くなりました(NUMA関連設定の影響かも?)。他の機体も計測し直せば速度改善(改悪)しているかもしれませんが、冒頭に記載しました通り、他の機体は日本に置き去りですので、次回の帰国まで再計測出来ませんOrz)
 
Windows7 で Windows Update がうまく出来ない場合の対処法
 
 
 

AMD の Naples に見る 1.4GHz と 2.8GHz

久しぶりに Dual Socket の全く新しいモノが登場しそうでワクワクしている筆者です。

古くは Tiger-MPXTyan) に始まり、HDAMAFlextronics) や S2915Tyan) などヒット&ロングランしたAMDデュアル板の様に、Zenでも名機が登場してくれる事を切望していますし、その可能性を秘めていると思うのです。ちなみに、この記事は15号機(S2915)で書いています。

Zenの特徴の1つとして、分岐予測以前に両枝をパイプライン上で同時に投機実行する事ではないかと思います。AMDは、これを投機実行ではなく人工知能的学習機能を備えた分岐予測だと宣伝していますが、実は力仕事でやってるのではと思うのです。まぁ、実際はSMTの事もあり、もう少し複雑だと思いますが・・・

しかし、残念な事は、Windows7が動かないかもしれない事です。MSは今後登場するCPUはWin10でのみ対応する発言をしていたので・・・

噂では AMDのZen世代Opteron初物は2017年4~6月(たぶん自作市場で入手出来るのは数ヶ月遅れ)に登場して、デュアルソケット対応品は Naples もしくは Diesel という名称で 8コア×4ダイ=32コア/64スレッドの MCM(Multi Chip Module) 又は MCP(Multi Chip Package)らしく、メモリ8チャネル(つまり、ダイ辺りデュアルチャネルのNUMA構成になるのでしょう)。これがHyperTransport接続なのか、もっと密結合をするのかに付いての情報は未だ得ていませんが、PCIe3.0はCPUに統合されておりGPUを最大6枚フル帯域で直結出来る様です。2CPUで64コア/128スレッド、E-ATX/SSI-EEB規格のマザーでPCIeが6本有る板をSuperMicrが出すと思いますが確証はありません(面積的にE-ATA/SSI-EEBだとPCIeスロットは4~5本かもしれません)。伝統的に初物はTyanからですがMiTAC傘下でAMDとの蜜月は変容していると思われます。鯖専用の色が濃い場合はオンボードサウンドが無いかもしれず、できればSoundを2chでも良いのでオンボードにして欲しいです。例えばこちらの画像マイナビ記事)にSuperMicroと書かれているZenのデュアルソケット・ブレードサーバらしきものが掲載されています。

伝統的に、AMDの複数ソケット対応CPUは1.4GHzで登場し、2.8GHzがハイエンドです。もちろん例外もありますが、1.4GHzで始まり2.8GHzで終わるのには何らかの理由が有ると思うのです。TB/TCやコア数削減版は4GHzを超えるかもしれませんが、低クロック高IPCが私は好きですしAMDにこそ、それを実現して欲しいと思うのです。

Zen 世代の Naples も初物は 1.4GHz (TB/TC 2.8GHz)の様ですから伝統を踏襲していると言えそうです。そして恐らく来年か再来年辺りに 2.8GHz(TB/TC 3.5GHz) が登場して後にコア数増量版もしくはアーキテクチャ改良版が登場するのではないかと思います・・・

どんな板が登場するか?楽しみですね。
 
 

演算速度を決定付けるもの

明けましておめでとうございます。

2017年最初の記事は、私の思いつきのメモ的なもので、すみません。

演算速度を決定付けるものとして、

1)帯域(バンド幅/Bandwidth)
2)遅延(レイテンシ/Latency)
3)同期(シンクロ/Synchronize)
4)優先順(プライオリティ/Priority)
5)手順(アルゴリズム/Algorithm)
6)大人の事情

などが有ると思います。

これらを総称し、もしくは決定付けるものが設計思想(アーキテクチャ/Architecture)だと言って良いと思います。

周波数(クロック/Clock) やビット数やコア数など、CPUのカタログスペックは主に帯域を決定する要素として私は捉えています。

アルゴリズムは、設計段階で抽象的な大枠が決まり、言語やコンパイラの性能に大きく影響を受け、最終的には機械語からマイクロコードに翻訳され、その結果が具体的アルゴリズムと言えるのではないでしょうか。

大人の事情とは、例えば歩留まり改善とか、電気代削減などですね。
 
結局、大雑把に極論するとクーロンの法則に従って演算速度が決定する。なぜなら電磁気学のパラダイムでコンピュータが設計されているから。というのが年始の私の思いつきメモです(笑

と言う事で、今年も宜しくお願い致します。
m(_ _)m
 
 

R9 nano を買ってみました。

昨日、別件で東京ビックサイトで開催されていたイベント会場に潜入した際に Tesla P100 を見掛けまして 単精度9.3TFlops 倍精度4.7TFlopsのスペックを見て、PEZY-SC Quadの方がスペック高いなと考えながら帰りに秋葉に寄って何故か R9 nano を買ってしまいました。

GeForce 1080 はチップがGP104らしいので購入を躊躇い(つまりGP100ではないので)、そういう意味では R9 nano も倍精度性能は低いのですがHBM搭載品が気に成って衝動買いした次第です。

お前何言ってるの?と言われそうですが、これが私の行動パターンなんでしょう・・・

GeForce 1095ti とか GeForce 1180 とか、GeForce TITAN P100 とか、そんな名前で GP100 搭載品が市場に出回る事を期待してます。TITAN X の新しい方はGP102でFP64が無い様ですね。今迄と同じパターンだとすればGP110/GP112搭載品を待つのが吉かも?と言う気がしてきたとも・・・

いつものベンチを更新です。やはり R9 nano は電力効率が良好ですね。
OpenCL-Bench-2-LPK-D2.png
推測値などは私の推測であって実態とは異なると思いますが、ホスト名が記載されている行は基本的には実測値です。

それにしても、これで何故にP100がGreen500でTOPを奪取出来たのか少し不思議です。電力効率に注力してクロックなどをチューニングしたのでしょうかね?それともNVLinkの効果?

あとまぁ、Skylake-EPで噂の32コア・ハイエンド品がデュアルソケットだとTesla P100と同程度の性能が出そうな事も気に成ります。Silvermontベースと言われるKnights Landing世代のXEON Phiとも重なりますね。

Vega10は、R9 Fury/Nano のシュリンクand/orブラッシュUP版でしょうかね?HBM2で16GBは魅力ですがTahitiを最後にFP64削ってるのが回復すると良いですね・・・
  
プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR