更新日:2026年6月16日|カテゴリ:運用・トラブル

結論:HDD故障は「突然」ではなく予兆が出る。S.M.A.R.Tの5項目を見れば先回りできる

クラウドストレージ大手 Backblaze が数万台のHDDを分析した結果、故障したドライブの約76.7%が、故障前に S.M.A.R.T の重要5項目(ID 5・187・188・197・198)のどれかで「異常値(RAW値がゼロより大きい)」を示していたと報告しています。

とくに「代替処理済みセクタ数(05)」と「代替処理保留中セクタ数(197)」がゼロから増え始めたら、交換準備のサイン。RAIDを組んでいても、1台壊れたら再構築中に2台目が逝く「二重故障」でデータ全損のリスクがあるため、予兆を見つけたら早めに動くのが鉄則です。

1. そもそもS.M.A.R.T(スマート)とは?

S.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology)は、HDD/SSD自身が動作状態を記録・自己診断する仕組みです。各項目は「ID(番号)」と「RAW値(実数)」を持ち、代替したセクタの数や通電時間、温度などを記録しています。NASのOS(SynologyのDSMなど)はこの値を読み取り、異常があれば警告を出してくれます。

ポイントは「正規化値(100や253などの相対スコア)」よりも、項目によっては「RAW値(実際の回数・個数)」を見ること。とくに不良セクタ系はRAW値がゼロから増え始めた瞬間が重要なサインです。

2. 故障を予兆する重要なS.M.A.R.T項目

数十項目あるS.M.A.R.Tのうち、家庭用NASユーザーが押さえるべきは次の項目です。

ID(16進)項目名意味危険度
5(05)代替処理済みセクタ数読み書きできない不良セクタを予備領域に振り替えた数。劣化の進行を表す★★★★
197(C5)代替処理保留中セクタ数読み取りが不安定で「振替待ち」のセクタ。データ損失に直結しやすい★★★★★
198(C6)回復不能セクタ数訂正できなかったセクタ。出たら危険信号★★★★★
187(BB)報告された訂正不能エラーECCで訂正できなかったエラー数★★★★
188(BC)コマンドタイムアウト命令への応答が間に合わなかった回数。配線・電源・劣化のサイン★★★
194(C2)温度高温が続くと寿命が縮む。目安は概ね50℃以下に★★(参考)
9(09)通電時間累積稼働時間。年数の目安に★(参考)

Backblazeが重視する「5項目」

Backblazeは長年の運用と業界の知見から、メーカーをまたいで一貫性があり故障予測に有効な項目として SMART 5・187・188・197・198 の5つを採用しています。このいずれかのRAW値が「0」から「1以上」になったら要調査、というのが実務的な判断基準です。逆に言えば、これらがずっと0なら比較的安心の目安になります。

3. SynologyのDSMでHDDの健康状態を確認する手順

Synology NAS(DSM)なら、専用ソフトを入れなくてもブラウザだけでS.M.A.R.Tを確認できます。

  1. DSMに管理者アカウントでログイン
  2. メインメニュー → ストレージマネージャ → HDD/SSD を開く
  3. 対象ドライブを選び 「健康状態」 を表示(S.M.A.R.T属性の一覧と総合ステータスを確認)
  4. 「S.M.A.R.T.テスト」→「拡張テスト」→「起動」 で詳細スキャンを実行(時間がかかるため夜間推奨)
⚠ 結果の読み方
総合ステータスが「正常」以外(警告/重大)になっている、拡張テストが「失敗」または途中で止まる、不良セクタが増え続けている──このいずれかなら故障が強く疑われます。Synologyは月1回「ドライブ正常性レポート」も自動送付するので、メール通知を有効にしておきましょう。

4. 数値だけじゃない「動作」の予兆サイン

S.M.A.R.Tに加えて、次のような体感サインも故障の前触れです。

  • 異音:「カチッ、カチッ」という繰り返し音(ヘッドの退避音)や、定期的な「ジー」という音
  • 転送速度が急に遅くなる:読み取りリトライで待たされている可能性
  • 頻繁にフリーズ・ビジーになる/たまにドライブを見失う
  • RAIDが「劣化(degraded)」通知を出す:1台がすでに脱落している状態
  • 起動・マウントに異常に時間がかかる

5. 交換タイミングの判断基準

状況判断
総合ステータスが「警告」「重大」即交換
S.M.A.R.T拡張テストが失敗即交換
197(保留中)・198(回復不能)が1以上即交換準備(増加中なら最優先)
05(代替済み)が0から増え、増え続ける早めに交換
187・188が継続的に増える警戒(配線・電源も点検)
RAIDが劣化通知即交換(※下記の注意)
温度が常時50℃超設置環境を改善(故障要因)
⚠ RAID=バックアップではない
RAIDは「1台壊れても止まらない(可用性)」ための仕組みで、バックアップの代わりにはなりません。とくに同時購入・同型番のHDDは故障時期も近くなりがちで、1台交換後の再構築(リビルド)中に2台目が脱落してデータ全損という事故が実際に起きます。劣化を見つけたら迅速に交換しつつ、必ず別媒体へのバックアップ(3-2-1ルール)も併用してください。

S.M.A.R.Tで警告が出たら、まずこの3ステップ

  1. バックアップを最優先で取る:交換やテストより先に、まだ読めるうちに重要データを別媒体へ退避します。すでにRAIDが劣化中なら、負荷をかける操作は最小限に。
  2. 状態を確定する:拡張テストと健康状態で、どの項目が悪化しているか(05・197・198が増えていないか)を記録します。
  3. 同容量以上のCMR HDDを用意して交換:RAIDなら1台ずつ交換してリビルド。リビルド中は高負荷で2台目が脱落しやすいため、ステップ1のバックアップがここで効いてきます。

6. 交換用HDDの選び方

交換するならNAS用のCMR方式HDDを選びましょう。定番は Western Digital「WD Red Plus」Seagate「IronWolf」です。24時間稼働・振動耐性を前提に設計されています。容量は現在使用中のドライブと同容量以上が原則(RAIDは最小容量に合わせるため)。

⚠ SMRは避ける
SMR方式のHDDはRAID再構築時に極端に遅くなり、リビルド失敗のリスクが上がります。NASではCMR方式を選んでください(WD Red Plus・IronWolfはCMR)。なお2026年はNAS向けHDDが値上がり傾向(生成AI・データセンター需要の影響)のため、予兆が出てから慌てず、早めに1台予備を確保しておくと安心です。

7. 故障を遠ざける予防策

  • UPS(無停電電源装置)を併用:停電・瞬電は書き込み中のデータやファイルシステムを壊す代表的な原因。NASとUPSをUSBで連携させ、停電時に自動で安全シャットダウンを。
  • 温度管理:直射日光・密閉空間を避け、風通しのよい場所へ。高温はHDD寿命を縮めます。
  • データスクラビング:DSMの定期スクラビングで「ビットロット(静かなデータ破損)」を早期検出(深夜にスケジュール)。
  • 月1回のS.M.A.R.T拡張テスト+正常性レポートのメール通知ON。
  • 3-2-1バックアップ:データ3つ・媒体2種類・1つは別の場所。RAIDだけに頼らない。

8. よくある質問(FAQ)

Q1. SSDにもS.M.A.R.Tはありますか?
A. あります。ただし見るべき指標が違い、「残り寿命(%)」「総書込量(TBW)」「Wear Leveling Count(消耗度)」が中心です。NVMe SSDも対応しています。SSDは不良セクタより「書込寿命」の消費で寿命が来ます。
Q2. RAIDを組んでいれば故障予兆は気にしなくていい?
A. いいえ。RAIDは可用性のための仕組みで、バックアップでも「壊れない保証」でもありません。1台の予兆を放置すると二重故障で全損し得ます。予兆→即交換+別途バックアップが正解です。
Q3. 予兆ゼロで突然壊れることはありますか?
A. あります。Backblazeのデータでも、故障の約2割強はこの5項目に明確な予兆が出ていませんでした(基板・モーターの突発故障など)。だからこそバックアップが最後の砦です。
Q4. 何年で交換すべきですか?
A. 一律の年数より状態監視で判断するのが基本です。一般にHDDは3〜5年あたりから故障率が上がる傾向があるため、通電時間(09)と不良セクタ系(05/197)を目安に、予兆が出たら年数に関わらず交換します。
Q5. 不良セクタは修復できますか?
A. 代替処理で一時的に「隠す」ことはできますが、05や197が増え続けるなら劣化が進行しているサインです。重要データを預けるなら、修復に期待せず交換するのが確実です。
Q6. WindowsやMacから手軽に確認できるツールはありますか?
A. PCに直結したHDDなら、Windowsは無料のCrystalDiskInfoが定番で、健康状態を「正常/注意/異常」と色分けで表示してくれます。ただしNASに内蔵したHDDはネットワーク越しのため、基本はNAS側のOSで確認します(SynologyはDSMのストレージマネージャ、QNAPは「ストレージ&スナップショット」からS.M.A.R.Tを確認)。

まとめ:予兆を「数値」と「音」で早期発見し、迅速交換+バックアップ

この記事の要点

  • 故障の約77%は事前にS.M.A.R.Tの5項目(5・187・188・197・198)で予兆が出る
  • とくに197(保留中)・198(回復不能)が1以上、05(代替済み)が増加中なら即対応
  • DSMは「ストレージマネージャ→HDD/SSD→健康状態→S.M.A.R.T拡張テスト」で確認
  • RAIDはバックアップではない。予兆→迅速交換+3-2-1バックアップ
  • 交換はNAS用CMR(WD Red Plus/IronWolf)。UPS・温度管理・スクラビングで予防