SMART(Self-Monitoring, Analysis and Reporting Technology)

スマートといって体型の話ではなく、勿論、車の名前でもありません。
HDDに搭載されている自己診断プログラムのこと。
最近のHDDには殆ど全て搭載されていて、マザーボードもそれに対応しており事前にHDDの故障をアナウンスできる機能が付いています。
エラーの発生率や温度等を監視してHDDの健康状態を知る機能で、この専用のビューワーも存在します。
起動画面のBIOSといわれる画面でもこういった障害が発生すれば、HDDのワーニングが出る機能を持っていて、そろそろ危ないと起動するたびに教えてくれます。
実際、ちゃんと出るのかどうか壊れたHDDを接続して試したらちゃんと出たので凄いななんて思ったりして・・・・
HDDも突然壊れる物ではなく、故障予測をする可能性が出てきてすばらしいことだと思っていたのですが・・・
 
一昨日、いつごろからかは判りませんがHDDが故障しました。
リードが途中で止まってしまい、そのままPCが動かなくなるという症状です。
一般的に、完全にリードが出来なくなるとアプリケーションでの実行中で無ければそのままエラーを出して止まるのですが、途中で固まってしまうと手も足も出ません。
出来ることは、タスクスイッチ(Ctrl+Tab)ぐらいで、シャットダウンを強制的にかけてもPCのBusy状態が止まらないのですからいつまで待っても(1日ぐらいは様子を見ましたが)終了しないという状況です。
疑いだすときりが無い、最初からHDDに原因を特定しているわけでもなく 発生するアプリケーションの特定や、発生する頻度の特定、常駐プログラムの除去等 色々とソフトに原因を探り、メモリーを外してみたりCPUの速度を落としたり、冷却効率を上げる為に庫内掃除をしてみたり 最近のマザーボードには大体付いているアプリケーションで電圧や温度変化のLOGを取ってみたりとするのですが どうも原因が特定できない。
 
頭を抱えているときには既に機械はばらばら、コネクターを入れ替えたり ケーブルを交換したりと机一杯のPCとなっていました。
ふと、そうやっているときにPCがフリーズ。
そのときにHDDから蝉が押さえつけられて鳴くような音・・・・・
最近のHDDは軸受けも流体軸受けになり、震度を吸収されるようにケース内に緩衝材が詰められている手前 外部に音を漏らしにくい作りに成っていて気がつかないものなのです。
その後、有名メーカーのHDDチェックツールをかけると、パーテーション情報はおかしい物の数時間かけたHDDチェックに関しては問題がないと出てきます。
いったい何をチェックしているのか・・・(これは、プログラムに罪はありません。全てがわかるわけではないのです 恐らくデータエリアでない部分、若しくはコントロールするべきICの障害による物で、HDD自身のコントロールがおかしくなっているのでしょう)
 
多くのメーカー製PCでもSmartのエラー通知機能を起動しないに選択されています(これはお確かめください、もしかしたら救われることもあります)。これは、診断機能がメーカーロゴが表示されているときに動作する為に見えないという 広告重視で考えられているからか、故障がメーカーの不利益に繋がるからかのどちらかではないかと想像するのですが・・・(この機能には問題も有るので じつはそうでないかもしれません)
逆に、私のPCのように最初から有効にしてあるとデータのリードエラーが続くと勝手に判定されてしまう物だと信じてしまう。そういう先入観を持ってしまうのが最もいけないことです。
 
昔から、障害判定は経験が必要で 一緒に連れて行ってもらうと馬鹿らしいぐらい基本的なところからアプローチを始められます。
例えば、コンセントが刺さっているか、電気が来ているかから始まって 機械の周りの掃除を始めてようやくPCの電源を入れられます。
もちろん、一般家庭のPCの修理の多くはソフト的なことなので、こういったアプローチではないのでしょうけど あまりにも当たり前のことからはじめられます。
自己診断機能は便利で、多くの情報を与えてくれます。
しかし、それだけに頼るあまりに実際の問題点を発見できないまま見過ごしてしまうことも有ります。
データの復旧も含めて二日間多くの時間を費やしました。
常にバックアップがあり、HDDの故障を最初から疑っていれば HDDを購入する時間+1時間ほどで済んだ作業。
仕事ではこういった失敗をしてはいけないと、久しぶりに考えさせられる事件でした。