更新日:2026年6月16日|カテゴリ:運用・トラブル
結論:HDD故障は「突然」ではなく予兆が出る。S.M.A.R.Tの5項目を見れば先回りできる
クラウドストレージ大手 Backblaze が数万台のHDDを分析した結果、故障したドライブの約76.7%が、故障前に S.M.A.R.T の重要5項目(ID 5・187・188・197・198)のどれかで「異常値(RAW値がゼロより大きい)」を示していたと報告しています。
とくに「代替処理済みセクタ数(05)」と「代替処理保留中セクタ数(197)」がゼロから増え始めたら、交換準備のサイン。RAIDを組んでいても、1台壊れたら再構築中に2台目が逝く「二重故障」でデータ全損のリスクがあるため、予兆を見つけたら早めに動くのが鉄則です。
1. そもそもS.M.A.R.T(スマート)とは?
S.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology)は、HDD/SSD自身が動作状態を記録・自己診断する仕組みです。各項目は「ID(番号)」と「RAW値(実数)」を持ち、代替したセクタの数や通電時間、温度などを記録しています。NASのOS(SynologyのDSMなど)はこの値を読み取り、異常があれば警告を出してくれます。
ポイントは「正規化値(100や253などの相対スコア)」よりも、項目によっては「RAW値(実際の回数・個数)」を見ること。とくに不良セクタ系はRAW値がゼロから増え始めた瞬間が重要なサインです。
2. 故障を予兆する重要なS.M.A.R.T項目
数十項目あるS.M.A.R.Tのうち、家庭用NASユーザーが押さえるべきは次の項目です。
| ID(16進) | 項目名 | 意味 | 危険度 |
|---|---|---|---|
| 5(05) | 代替処理済みセクタ数 | 読み書きできない不良セクタを予備領域に振り替えた数。劣化の進行を表す | ★★★★ |
| 197(C5) | 代替処理保留中セクタ数 | 読み取りが不安定で「振替待ち」のセクタ。データ損失に直結しやすい | ★★★★★ |
| 198(C6) | 回復不能セクタ数 | 訂正できなかったセクタ。出たら危険信号 | ★★★★★ |
| 187(BB) | 報告された訂正不能エラー | ECCで訂正できなかったエラー数 | ★★★★ |
| 188(BC) | コマンドタイムアウト | 命令への応答が間に合わなかった回数。配線・電源・劣化のサイン | ★★★ |
| 194(C2) | 温度 | 高温が続くと寿命が縮む。目安は概ね50℃以下に | ★★(参考) |
| 9(09) | 通電時間 | 累積稼働時間。年数の目安に | ★(参考) |
Backblazeが重視する「5項目」
Backblazeは長年の運用と業界の知見から、メーカーをまたいで一貫性があり故障予測に有効な項目として SMART 5・187・188・197・198 の5つを採用しています。このいずれかのRAW値が「0」から「1以上」になったら要調査、というのが実務的な判断基準です。逆に言えば、これらがずっと0なら比較的安心の目安になります。
3. SynologyのDSMでHDDの健康状態を確認する手順
Synology NAS(DSM)なら、専用ソフトを入れなくてもブラウザだけでS.M.A.R.Tを確認できます。
- DSMに管理者アカウントでログイン
- メインメニュー → ストレージマネージャ → HDD/SSD を開く
- 対象ドライブを選び 「健康状態」 を表示(S.M.A.R.T属性の一覧と総合ステータスを確認)
- 「S.M.A.R.T.テスト」→「拡張テスト」→「起動」 で詳細スキャンを実行(時間がかかるため夜間推奨)
総合ステータスが「正常」以外(警告/重大)になっている、拡張テストが「失敗」または途中で止まる、不良セクタが増え続けている──このいずれかなら故障が強く疑われます。Synologyは月1回「ドライブ正常性レポート」も自動送付するので、メール通知を有効にしておきましょう。
4. 数値だけじゃない「動作」の予兆サイン
S.M.A.R.Tに加えて、次のような体感サインも故障の前触れです。
- 異音:「カチッ、カチッ」という繰り返し音(ヘッドの退避音)や、定期的な「ジー」という音
- 転送速度が急に遅くなる:読み取りリトライで待たされている可能性
- 頻繁にフリーズ・ビジーになる/たまにドライブを見失う
- RAIDが「劣化(degraded)」通知を出す:1台がすでに脱落している状態
- 起動・マウントに異常に時間がかかる
5. 交換タイミングの判断基準
| 状況 | 判断 |
|---|---|
| 総合ステータスが「警告」「重大」 | 即交換 |
| S.M.A.R.T拡張テストが失敗 | 即交換 |
| 197(保留中)・198(回復不能)が1以上 | 即交換準備(増加中なら最優先) |
| 05(代替済み)が0から増え、増え続ける | 早めに交換 |
| 187・188が継続的に増える | 警戒(配線・電源も点検) |
| RAIDが劣化通知 | 即交換(※下記の注意) |
| 温度が常時50℃超 | 設置環境を改善(故障要因) |
RAIDは「1台壊れても止まらない(可用性)」ための仕組みで、バックアップの代わりにはなりません。とくに同時購入・同型番のHDDは故障時期も近くなりがちで、1台交換後の再構築(リビルド)中に2台目が脱落してデータ全損という事故が実際に起きます。劣化を見つけたら迅速に交換しつつ、必ず別媒体へのバックアップ(3-2-1ルール)も併用してください。
S.M.A.R.Tで警告が出たら、まずこの3ステップ
- バックアップを最優先で取る:交換やテストより先に、まだ読めるうちに重要データを別媒体へ退避します。すでにRAIDが劣化中なら、負荷をかける操作は最小限に。
- 状態を確定する:拡張テストと健康状態で、どの項目が悪化しているか(05・197・198が増えていないか)を記録します。
- 同容量以上のCMR HDDを用意して交換:RAIDなら1台ずつ交換してリビルド。リビルド中は高負荷で2台目が脱落しやすいため、ステップ1のバックアップがここで効いてきます。
6. 交換用HDDの選び方
交換するならNAS用のCMR方式HDDを選びましょう。定番は Western Digital「WD Red Plus」や Seagate「IronWolf」です。24時間稼働・振動耐性を前提に設計されています。容量は現在使用中のドライブと同容量以上が原則(RAIDは最小容量に合わせるため)。
SMR方式のHDDはRAID再構築時に極端に遅くなり、リビルド失敗のリスクが上がります。NASではCMR方式を選んでください(WD Red Plus・IronWolfはCMR)。なお2026年はNAS向けHDDが値上がり傾向(生成AI・データセンター需要の影響)のため、予兆が出てから慌てず、早めに1台予備を確保しておくと安心です。
7. 故障を遠ざける予防策
- UPS(無停電電源装置)を併用:停電・瞬電は書き込み中のデータやファイルシステムを壊す代表的な原因。NASとUPSをUSBで連携させ、停電時に自動で安全シャットダウンを。
- 温度管理:直射日光・密閉空間を避け、風通しのよい場所へ。高温はHDD寿命を縮めます。
- データスクラビング:DSMの定期スクラビングで「ビットロット(静かなデータ破損)」を早期検出(深夜にスケジュール)。
- 月1回のS.M.A.R.T拡張テスト+正常性レポートのメール通知ON。
- 3-2-1バックアップ:データ3つ・媒体2種類・1つは別の場所。RAIDだけに頼らない。
8. よくある質問(FAQ)
まとめ:予兆を「数値」と「音」で早期発見し、迅速交換+バックアップ
この記事の要点
- 故障の約77%は事前にS.M.A.R.Tの5項目(5・187・188・197・198)で予兆が出る
- とくに197(保留中)・198(回復不能)が1以上、05(代替済み)が増加中なら即対応
- DSMは「ストレージマネージャ→HDD/SSD→健康状態→S.M.A.R.T拡張テスト」で確認
- RAIDはバックアップではない。予兆→迅速交換+3-2-1バックアップ
- 交換はNAS用CMR(WD Red Plus/IronWolf)。UPS・温度管理・スクラビングで予防