JP2018173809A - ハードディスクドライブ診断装置 - Google Patents

ハードディスクドライブ診断装置 Download PDF

Info

Publication number
JP2018173809A
JP2018173809A JP2017071383A JP2017071383A JP2018173809A JP 2018173809 A JP2018173809 A JP 2018173809A JP 2017071383 A JP2017071383 A JP 2017071383A JP 2017071383 A JP2017071383 A JP 2017071383A JP 2018173809 A JP2018173809 A JP 2018173809A
Authority
JP
Japan
Prior art keywords
disk drive
hard disk
value
vibration
smart
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017071383A
Other languages
English (en)
Inventor
隆生 萩原
Takao Hagiwara
隆生 萩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP2017071383A priority Critical patent/JP2018173809A/ja
Publication of JP2018173809A publication Critical patent/JP2018173809A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】ハードディスクドライブの故障診断の精度向上を図る。【解決手段】自己診断機能であるSMARTの各種属性値のうち、外部振動による一時的な性能低下と外部振動以外の要因による性能低下とを判別可能な一部の属性値が前回値よりも悪化した際に、第1振動センサ3の検出値である加速度値G_S1(n)が閾値G_S1(0)よりも大きく、かつ第2振動センサ5の検出値である加速度値G_S2(n)が閾値G_S2(0)よりも大きければ、当該属性値が外部からの振動により一時的に悪化したと判定する。これにより、交換を必要としないハードディスクドライブ2を交換してしまうことを抑制することが可能となる。【選択図】図1

Description

本発明は、例えば、パーソナルコンピュータ等において、不適切な設置等によって生じる振動により内蔵ハードディスクドライブの性能低下が一時的に低下していることを検出可能な診断装置に関する。
特許文献1、2に開示されているように、パーソナルコンピュータにおける内蔵ハードディスクドライブの故障を予知する手段として、ハードディスクドライブ自身にSMART(Self−Monitoring Analysis and Reporting Technology)機能が搭載されたものが広く知られている。
例えば、特許文献1は、複数の磁気ディスクドライブ(ハードディスクドライブ)を備えたディスクアレイ装置に関するものであって、個々の磁気ディスクドライブがそれぞれ上記SMART機能に用いる動的な複数の属性値(各種状態量)を持っている。そして、これら属性値とこれら属性値毎に予め定められた閾値とを比較して、閾値を超えた状態を検出すると、該当する磁気ディスクドライブが異常状態もしくは故障間近の状態として故障予知に利用している。
上記各属性値のうち、ディスクのリード処理の失敗率(Raw Read Error Rate)及びライト処理の失敗率(Write Error Rate)等は、磁気ディスクドライブの直接的な故障に直結する情報として利用されている。
特開2014−182743号公報 特開2012−59312号公報
しかしながら、ディスクアクセスの失敗は、磁気ディスクドライブ自体の寿命や故障による場合だけでなく、外部振動によっても発生し得る現象である。実際、リード処理の失敗率が閾値を超えたため故障交換された磁気ディスクドライブを調査すると、ハードウェア的な異常は全く見られず、他のコンピュータに搭載して正常に使用できる場合がある。
つまり、このような場合、パーソナルコンピュータの設置環境の改善による振動の除去を実施すべきであり、磁気ディスクドライブの交換は、費用を発生させるだけの無駄な対策である。
従って、磁気ディスクドライブの故障を予知あるいは検出するにあっては、更なる改善の余地がある。
本発明のハードディスクドライブ診断装置は、自身の動作状態を示す各種状態量を用いた自己診断機能を備えるハードディスクドライブと、上記ハードディスクドライブに取り付けられ、該ハードディスクドライブの振動を検出可能な第1のセンサと、上記ハードディスクドライブが収容される筐体に取り付けられ、該筐体の振動を検出可能な第2のセンサと、上記各種状態量のうち、外部振動による一時的な性能低下と外部振動以外の要因による性能低下とを判別可能な一部の状態量が前回値よりも悪化した際に、上記第1のセンサで検出された振動が所定の第1閾値よりも大きく、かつ上記第2のセンサで検出された振動が所定の第2閾値よりも大きければ、当該状態量が外部からの振動により一時的に悪化したと判定する判定部と、を有することを特徴としている。
また、上記各種状態量は、具体的には、上記ハードディスクドライブのSMART(Self−Monitoring Analysis and Reporting Technology)の各検査項目である。
本発明によれば、筐体の設置環境が適切でないために振動が発生している場合、環境改善が必要であることを外部に通知することが可能となる。そのため、交換を必要としないハードディスクドライブを交換してしまうことを抑制することが可能となる。
本発明に係るハードディスクドライブ診断装置の概略構成を模式的に示した説明図。 筐体振動監視スレッドの一例を示すフローチャート。 SMART値監視スレッドの一例を示すフローチャート。
以下、本発明の一実施例を図面に基づいて詳細に説明する。図1は、本発明に係るハードディスクドライブ診断装置1をパーソナルコンピュータに適用した場合の概略構成を模式的に示した説明図である。
ハードディスクドライブ診断装置1は、ハードディスクドライブ(HDD)2と、第1振動センサ3と、第2振動センサ5と、CPU(Central Processing Unit)6と、から大略構成されている。
第1振動センサ3は、第1のセンサに相当するものであり、ハードディスクドライブ2に取り付けられている。第1振動センサ3は、ハードディスクドライブ2の振動を検出可能なものである。
第2振動センサ5は、第2のセンサに相当するものであり、ハードディスクドライブ2が収容される筐体4に取り付けられている。第2振動センサ5は、筐体4の振動を検出可能なものである。
第1振動センサ3及び第2振動センサ5は、本実施例では加速度センサである。なお、第1振動センサ3及び第2振動センサ5は、加速度センサに限定されるものではなく、例えば速度センサ等を用いることも可能である。
CPU6は、判定部に相当するものであって、第1振動センサ3及び第2振動センサ5の検出信号が入力されているとともに、データ伝送路7を介してハードディスクドライブ2との通信(データの授受等)が可能となっている。
ハードディスクドライブ2は、自己診断機能であるSMART(Self−Monitoring Analysis and Reporting Technology)を備えている。上記SMARTは、ハードディスクドライブ2の動作状態を示す各種属性値(各種状態量)を用いて各種検査を実行するものであり、ハードディスクドライブ2の故障予知あるいは故障検出が可能である。
ハードディスクドライブ2のデータ領域には、監視ソフトウェアが記録する振動データ情報と、上記SMARTの情報として各種属性値の現在値及び閾値が格納されている。
監視ソフトウェアは、筐体振動監視スレッドとSMART値監視スレッドである。これらのスレッドは、CPU6で実行される。
図2は、筐体振動監視スレッドの一例を示すフローチャートである。筐体振動監視スレッドは、例えば監視周期を1秒として実行される。つまり、筐体振動監視スレッドは、例えば1秒毎に繰り返し実行される。
ステップS11では、第1振動センサ3の検出値である加速度値G_S1(n)を読み込む。つまり、ステップS11では、第1振動センサ3の検出信号である加速度値G_S1(n)が入力される。
ステップS12では、加速度値G_S1(n)が第1閾値としての閾値G_S1(0)よりも大きいか否かを判定する。閾値G_S1(0)は、例えば、ハードディスクドライブ2のデータ領域等に予め記録されている。加速度値G_S1(n)が閾値G_S1(0)よりも大きい場合はステップS13へ進む。加速度値G_S1(n)が閾値G_S1(0)以下の場合はステップS14へ進む。
ステップS13では、超過記録として加速度値G_S1(n)と現在時刻をハードディスクドライブ2のデータ領域に保存する。
ステップS14では、第2振動センサ5の検出値である加速度値G_S2(n)を読み込む。つまり、ステップS14では、第2振動センサ5の検出信号である加速度値G_S2(n)が入力される。
ステップS15では、加速度値G_S2(n)が閾値G_S2(0)よりも大きいか否かを判定する。閾値G_S2(0)は、例えば、ハードディスクドライブ2のデータ領域等に予め記録されている。加速度値G_S2(n)が閾値G_S2(0)よりも大きい場合はステップS16へ進む。加速度値G_S2(n)が閾値G_S2(0)以下の場合は、今回のルーチンを終了する。
ステップS16では、超過記録として加速度値G_S2(n)と現在時刻をハードディスクドライブ2のデータ領域に保存する。
第1振動センサ3及び第2振動センサ5を設ける理由は、以下の通りである。ハードディスクドライブ2に起因する振動のみで、第1振動センサ3で検出された加速度値G_S1(n)が閾値G_S1(0)よりも大きくなる場合、第2振動センサ5で検出される加速度値G_S2(n)は閾値G_S2(0)を下回ると予想できる。つまり、加速度値G_S1(n)及び加速度値G_S2(n)がそれぞれ両者の閾値を超えるような状態のとき、外部振動によりハードディスクドライブ2に振動が発生していると判定するためである。
図3は、SMART値監視スレッドの一例を示すフローチャートである。SMART値監視スレッドは、例えば監視周期を60秒として実行される。つまり、SMART値監視スレッドは、例えば60秒毎に繰り返し実施される。
ステップS21では、上記SMARTの各種属性値のうち監視対象となる所定の属性値を取得する。ステップS21で取得される属性値(例えば、Raw Read Error Rate)は、外部振動による一時的な性能低下と外部振動以外の要因による性能低下とを判別可能なものである。
ステップS22では、ステップS21で取得した上記SMARTの属性値と、この属性値の前回値とを比較して変化しているが否かを判定する。属性値の前回値は、ハードディスクドライブ2のデータ領域に記録されている。ステップS21で取得した上記SMARTの属性値が、この属性値の前回値から変化している場合はステップS23へ進む。ステップS21で取得した上記SMARTの属性値が、この属性値の前回値から変化していない場合は今回のルーチンを終了する。
ステップS23では、ステップS21で取得した上記SMARTの属性値と現在時刻をハードディスクドライブ2のデータ領域に保存する。
ステップS24では、ステップS21で取得した上記SMARTの属性値が、この属性値の前回値から悪化しているか否かを判定する。ステップS21で取得した上記SMARTの属性値が、この属性値の前回値から悪化している場合には、ステップS25へ進む。ステップS21で取得した上記SMARTの属性値が、この属性値の前回値から悪化していない場合には、今回のルーチンを終了する。
ステップS25では、前回記録された時点から今回までの間に、加速度値G_S1(n)が閾値G_S1(0)を超過した記録、及び加速度値G_S2(n)が閾値G_S2(0)を超過した記録がないか検索する。
ステップS26では、超過記録の有無を判定する。詳述すると、ステップS26では、超過記録がある場合、ステップS27を経てステップS28へ進む。また、ステップS26では、超過記録がない場合、ステップS28へ進む。ステップS26では、加速度値G_S1(n)が閾値G_S1(0)を超過した記録、及び加速度値G_S2(n)が閾値G_S2(0)を超過した記録の双方があった場合に、超過記録ありと判定する。
ステップS27では、ログ記録警告発報を行う。具体的には、振動によりSMART属性値悪化が発生したことをハードディスクドライブ2のデータ領域に保存し、外部に発報する。例えば、監視対象となる属性値がRaw Read Error Rateの場合には、振動によりSMART属性値(Raw Read Error Rate)低下が発生したことをハードディスクドライブ2のデータ領域に保存し、外部に発報する。監視対象となる属性値がRaw Read Error Rateの場合、SMART属性値悪化は、SMART属性値低下である。Raw Read Error Rateは、ハードディスクドライブ2からデータを読み込む時に発生したエラーの割合を示すものである。この数値が閾値よりも低い場合、ハードディスクドライブ2内の磁気ディスク(図示せず)または磁気ヘッド(図示せず)に異常がある。
ステップS28では、ステップS21で取得された今回の属性値(今回値)を前回値としてハードディスクドライブ2のデータ領域に保存する。すなわち、ステップS28では、ステップS21で取得された今回の属性値(今回値)を用いて、前回値を更新する。
なお、ハードディスクドライブ2の寿命判断は、上記SMARTの属性値が閾値を超過した時点で判定する。
これによって、ハードディスクドライブ2の各種属性値のうちの一部の属性値については、当該属性値の悪化が外部振動による一時的な性能低下なのか、寿命による性能低下なのか区別することが可能となる。つまり、筐体4の設置環境が適切でないために振動が発生している場合、環境改善が必要であることを外部に通知することが可能となる。そのため、交換を必要としないハードディスクドライブ2を交換してしまうことを抑制することが可能となる。
なお、外部振動による一時的な性能低下と外部振動以外の要因による性能低下とを判別可能な上記SMARTの属性値(監視対象属性値)としては、Raw Read Error Rateの他に、Throughput Performance、Spin−Up Time、Reallocated Sectors Count、Seek Error Rate、Seek Time Performance、Spin Retry Count、G−Sense Error Rate、Reallocation Event Count、Write Error Rate、Vibration During Write、Vibration During Read、Shock During Write、Read Error Retry Rateがある。
つまり、上述した図3において監視対象となる属性値は、Raw Read Error Rateのみではなく、Raw Read Error Rate以外の属性値に対しても図3と同様の処理を行うことで、より信頼性の高いロジックとすることができる。換言すれば、外部振動による一時的な性能低下と外部振動以外の要因による性能低下とを判別可能な上記SMARTの複数の属性値に対して、図3と同様の処理を並列的に行うことで、より信頼性の高いロジックとすることができる。
例えば、監視対象となる属性値がSpin−Up Timeであれば、図3のS27において、振動によりSMART属性値(Spin−Up Time)悪化が発生したことをハードディスクドライブ2のデータ領域に保存し、外部に発報することになる。Spin−Up Timeは、ハードディスクドライブが通電回転を開始してから規定の回転数に達するまでに係った平均時間である。監視対象となる属性値がSpin−Up Timeの場合、SMART属性値悪化は、SMART属性値低下である。
例えば、監視対象となる属性値がSeek Error Rateであれば、図3のS27において、振動によりSMART属性値(Seek Error Rate)悪化が発生したことをハードディスクドライブ2のデータ領域に保存し、外部に発報することになる。Seek Error Rateは、ハードディスクドライブ2の磁気ヘッド(図示せず)が目的のデータの在るトラックへ移動しようとして失敗(シークエラー)した割合である。監視対象となる属性値がSeek Error Rateの場合、SMART属性値悪化は、SMART属性値低下である。
ここで、上述したThroughput Performanceは、ハードディスクドライブ2の全体的な処理能力である。この値が閾値以下の場合、高い確率でハードディスクドライブ2に異常がある。
Reallocated Sectors Countは、代替処置を施された不良セクタの数である。
Seek Time Performanceは、ハードディスクドライブ2の磁気ヘッド(図示せず)がシーク作業に要した平均時間である。
Spin Retry Countは、ハードディスクドライブ2の磁気ディスク(図示せず)を規定の速度までスピンアップしようと再試行を試みた回数である。
G−Sense Error Rateは、衝撃によって引き起こされるプログラムエラーの頻度である。
Reallocation Event Countは、セクタの代替処理が発生した回数である。
Write Error Rateは、データの書き込み中に発見されたエラーの総数である。
Vibration During Writeは、データの書き込み中に加わった大きな振動を表す。
Vibration During Readは、データの読み込み中に加わった大きな振動を表す。
Shock During Writeは、データの書き込み中に加わった大きな衝撃を表す。
Read Error Retry Rateは、データをハードディスクドライブ2の磁気ディスク(図示せず)から読み込む間に現れるエラーの頻度である。
1…ハードディスクドライブ診断装置
2…ハードディスクドライブ
3…第1振動センサ
4…筐体
5…第2振動センサ
6…CPU
7…データ伝送路

Claims (2)

  1. 自身の動作状態を示す各種状態量を用いた自己診断機能を備えるハードディスクドライブと、
    上記ハードディスクドライブに取り付けられ、該ハードディスクドライブの振動を検出可能な第1のセンサと、
    上記ハードディスクドライブが収容される筐体に取り付けられ、該筐体の振動を検出可能な第2のセンサと、
    上記各種状態量のうち、外部振動による一時的な性能低下と外部振動以外の要因による性能低下とを判別可能な一部の状態量が前回値よりも悪化した際に、上記第1のセンサで検出された振動が所定の第1閾値よりも大きく、かつ上記第2のセンサで検出された振動が所定の第2閾値よりも大きければ、当該状態量が外部からの振動により一時的に悪化したと判定する判定部と、を有することを特徴とするハードディスクドライブ診断装置。
  2. 上記各種状態量は、上記ハードディスクドライブのSMART(Self−Monitoring Analysis and Reporting Technology)の各検査項目であることを特徴とする請求項1に記載のハードディスクドライブ診断装置。
JP2017071383A 2017-03-31 2017-03-31 ハードディスクドライブ診断装置 Pending JP2018173809A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017071383A JP2018173809A (ja) 2017-03-31 2017-03-31 ハードディスクドライブ診断装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017071383A JP2018173809A (ja) 2017-03-31 2017-03-31 ハードディスクドライブ診断装置

Publications (1)

Publication Number Publication Date
JP2018173809A true JP2018173809A (ja) 2018-11-08

Family

ID=64108651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017071383A Pending JP2018173809A (ja) 2017-03-31 2017-03-31 ハードディスクドライブ診断装置

Country Status (1)

Country Link
JP (1) JP2018173809A (ja)

Similar Documents

Publication Publication Date Title
EP1924994B1 (en) Method and apparatus for detecting the onset of hard disk failures
US10268553B2 (en) Adaptive failure prediction modeling for detection of data storage device failures
US7369339B2 (en) Failure prediction method for magnetic disk devices, and a magnetic disk device using the same
US7304816B2 (en) Disc drive failure prediction
US6415189B1 (en) Method and system for predicting disk drive failures
US20090161243A1 (en) Monitoring Disk Drives To Predict Failure
CN107179968B (zh) 信息存储装置、故障预测装置及故障预测方法
US7574918B2 (en) Method and apparatus for detecting vibrations from a mechanical component
US7627778B2 (en) Prediction-based data reassignment
US8254225B2 (en) Method of writing data to a disc, disc drive
JP2017037626A (ja) 故障予測装置、故障予測方法及び故障予測プログラム
US7881006B2 (en) Long-term asymmetry tracking in magnetic recording devices
US20090217765A1 (en) Sensor failure diagnosis device and sensor failure diagnosis method
JP2018173809A (ja) ハードディスクドライブ診断装置
US9384077B2 (en) Storage control apparatus and method for controlling storage apparatus
JP2021028857A (ja) 磁気ディスク装置
JP2012038362A (ja) ハードディスク故障予兆検出方法
JP5692577B2 (ja) 磁気ディスク装置及び自己診断方法
JP2007335013A (ja) 制御装置および記憶装置
JP2007317319A (ja) 情報処理装置
US20110075218A1 (en) Information processing apparatus, method for controlling information processing apparatus, and storage medium
JP4950861B2 (ja) 情報記録装置および情報記録装置の制御方法
US7876651B2 (en) Method of writing data to a disc, disc drive
JP2008084505A (ja) 記憶装置、書き込み手段診断方法
JP2016207237A (ja) ハードディスク管理装置、ハードディスク装置、ハードディスク管理方法およびハードディスク管理用プログラム