5号機復活

LuxMarkというOpenCLベンチを回していましたところ、5号機(TYAN TigerMPX)が起動不全を起しまして、途方にくれておりました。

本日、復活致しましたので、今後の為に記録として復活手段と経緯を掲載致します。

5号機に使われているTigerMPXは筆者所有のPOSTコードチェッカ(PCガイガー他)では有用なPOSTコードが得られません。
しかも、オンボードBEEPが故障し易い(後期リビジョンで対策が入っている)為、原因究明が困難な事があります。
そこで、

TigerMPXにはマザーのスピーカ端子に常時スピーカを取り付けておく事をお勧めします。
(未だ使っている人が居ればの話ですが・・・)

エラー発生時の復活方法。
 1:元電源OFF(これ重要、待機電力が暴走の原因て事もある)
 2:電源ケーブルをコンセントから抜く(規格外動作を想定し念のため)
 3:CMOSクリアの位置にジャンパを移動(2-3ショート、これ重要)
 4:ボタン電池交換(CR2032)※概ね電池切れと思われるので
 5:CMOSクリアジャンパを元の位置(1-2ショート)に戻す
 6:電源ケーブルをコンセントに挿す
 7:元電源ON(と同時に主電源が勝手にONになりBIOS画面表示)
 8:キーボードのF2を押してBIOS設定 -> 時刻合わせのみ行う
 9:BIOSの時刻合わせ後に Load Setup Default して後設定変更しない
   ※TygerMPXはBIOS設定を変更すると起動しない事が多いです。
 10:セーブして終了 -> 再起動後にメモリチェックが延々始まりますが初回のみです
 11:それでも駄目なら下記BEEPコード参照

TigetMPXのBEEPコード表
※出展1:PhoenixBIOS 4.0 Release 6.0 POST Tasks and Beep Codes
※出展2:TYAN Tiger MPX /// S2466 Revision 1.2 (Manual)


 1(long)-2 option ROMs checksum failure
 1-1-1-1 未定義ですがメモリ認識不良の時に鳴ります
 1-2-2-3 BIOS ROM checksum ERROR
 1-3-1-1 Test DRAM refresh
 1-3-1-3 Test 8742 Keyboard Controller
 1-3-3-1 Memory Error
 1-3-4-1 RAM failure on address line
 1-3-4-3 RAM failure on data bits of low byte
 1-4-1-1 RAM failure on data bits of high byte
 2-1-2-3 Check ROM copyright notice
 2-2-3-1 Test for unexpected interrupts

上記以外が鳴った場合は
1 -> 00
2 -> 01
3 -> 10
4 -> 11
の2進数変換して更に16進変換しますとPOSTコードに変換出来ます。

例えば
1-3-2-4の場合は
00-10-01-11に変換して更に
0010-0111 = 0x27h の様に16進に変換するとPOSTコードです。

TigerMPXは特にメモリ周りが弱いので、メモリ関連のBEEPコードが多いです。
また、メモリのソフトエラー(Bit化け)などでもBEEPが鳴って画面が出ません。

復活までの経緯
1)PC電源ON -> ファンが回転するが画面が表示されない。
2)電源モジュール交換 -> 症状変わらず。
3)4種類のグラボで試す -> 症状変わらず。
4)POSTコードチェッカを試す -> TigerMPXはPOSTコードが正しく出てない。
5)オンボードBEEPが壊れ易い事を思い出す。
6)マザーのBEEP端子にスピーカを取り付け -> 1-3-4-3 のBEEP
7)BEEPの意味を調べ、メモリのソフトエラーと判断。差し替えて復活。

BEEPコード1-3-4-3はメモリのデータに異常を発見した場合ですが、メモリはそんなに簡単に物理破損するものではありません。そこで疑われるのは接触不良/ノイズ過多/ソフトエラー(宇宙線やホットキャリアの影響)などが有りますが、経験と帰納的推測からソフトエラーと判断しました。
電源からのサージの類か、気温や湿度の変化からくる接触不良か、或いは、因果関係を証明する事は出来ませんが、地震のちょっと前だった事と、5号機が2台とも同じ状況で起動不全を起した事(筆者は全てのPCを同じ構成で2台づつ組んでいる)、2日前には正常起動した事、震源地にそこそこ近い場所である事などから、震源地周辺から地震の直前に多量の放射線が一時的に放出されていた可能性を疑ってみます・・・類似の事象が多発していたならそれが証明に成るかもしれませんが、類似の事象が他に無ければ的外れの推測です。
※メモリは高温状態で使うと簡単に壊れてしまう事が有りますが、定格で適切に冷却されていれば壊れる事は滅多にありません。

ソフトエラーの回復手段は、単にメモリモジュールを取り外して放電するだけですので、それで回復したのですから、ソフトエラー(或いは接触不良)が原因とみて間違い有りません。

いづれにしろ2台とも復活出来てホッとしました。
関連記事
スポンサーサイト

コメントの投稿

非公開コメント

プロフィール

DualSocketTheWorld

Author:DualSocketTheWorld
自作を始めて20台目くらいになりますが、最初からデュアルソケット限定(始めた当時はデュアルスロット)で自作しており、近年になってAMD K6を試したくなりSocket7でK6-2+のシングル構成で組んだのがシングル初です。

シングルマザー(含:シングルソケットマルチコア)や4ソケット以上の自作は基本的にしませんし、メーカー製PCの改造も基本的にはしません(ノートPCのSSD化くらいはしますが・・・)

基本路線はワークステーションと呼ばれる分野での自作で、OSもWindows系であればProfesionalが主な対象に成ります。

ゲーマーの様なOverClockは行わず、WS路線としてハイエンドCPUとハイエンドGPUの組み合わせで定格或いはDownClockで発熱を抑えつつ、その時のアーキテクチャに置いて爆速かつ静音を目指し、30年以上の長期に渡り稼動状態をキープする事を目指します。

※基本的にリンクフリーです。どこでも自由にどうぞ。

※画像は時々変ります。

※お決まりの文章ですが、改造は個人の責任で行ってください。ここに記載された情報は間違いを含んでいる可能性が有り、それを元に製作や改造などをして失敗しても筆者は一切責任持てませんので悪しからず。

筆者略歴:
小学生時代にゴミ捨て場で拾ったジャンクテレビ数台を分解して部品を取り出し真空管アンプを自作、中学生時代にPC8801mkⅡsrでZ80アセンブラを始める。社会人になって初のプログラムは弾道計算、後に医療系・金融系プログラマ~SEを経て100~200人規模プロジェクトのジェネラルマネジャを数年経験、独立して起業。現在は不動産所得で半引退生活。
(人物特定を避ける目的で一部経歴を変更しています)

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
アクセスカウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR