JP2009266291A - Hard disk drive failure prediction device, hard disk drive failure model generation device, and hard disk drive failure prediction method - Google Patents

Hard disk drive failure prediction device, hard disk drive failure model generation device, and hard disk drive failure prediction method Download PDF

Info

Publication number
JP2009266291A
JP2009266291A JP2008114114A JP2008114114A JP2009266291A JP 2009266291 A JP2009266291 A JP 2009266291A JP 2008114114 A JP2008114114 A JP 2008114114A JP 2008114114 A JP2008114114 A JP 2008114114A JP 2009266291 A JP2009266291 A JP 2009266291A
Authority
JP
Japan
Prior art keywords
hard disk
deterioration
disk drive
sensor
estimation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008114114A
Other languages
Japanese (ja)
Inventor
Akihiro Suyama
明弘 酢山
Toshiaki Hatano
寿昭 波田野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008114114A priority Critical patent/JP2009266291A/en
Publication of JP2009266291A publication Critical patent/JP2009266291A/en
Pending legal-status Critical Current

Links

Landscapes

  • Sliding-Contact Bearings (AREA)
  • Rotational Drive Of Disk (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To highly accurately detect the abnormality of a hydrodynamic pressure bearing spindle motor in a hard disk drive. <P>SOLUTION: Based on history information storing sensor information obtained from a sensor mounted on a hard disk drive (HDD) 100 relating to a learning phase for a desired period, a deterioration estimation model indicating a relationship between a sensor item and the deterioration degree of lubricant oil of a fluid dynamic pressure bearing spindle motor for rotary-driving a disk, and a HDD generation model indicating a relationship between the time-sequential change of the deterioration degree of the lubricant oil and the endurance probability of the HDD are generated. Then, the sensor information obtained from the sensor mounted on the HDD 101 relating to a prediction phase is applied to the generated deterioration estimation model, the degree of the deterioration of the lubricant oil is estimated, and tendency analysis is performed by the HDD endurance model based on the estimated deterioration of the lubricant oil, thereby predicting the failure time of the HDD 101. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、ハードディスクドライブにおける流体動圧軸受スピンドルモータの異常を検出するハードディスクドライブ故障予測装置、ハードディスクドライブ故障モデル生成装置、及びハードディスクドライブ故障予測方法に関する。   The present invention relates to a hard disk drive failure prediction device, a hard disk drive failure model generation device, and a hard disk drive failure prediction method for detecting an abnormality of a fluid dynamic bearing spindle motor in a hard disk drive.

S.M.A.R.T.(Self−Monitoring, Analysis and Reporting Technology)は、ハードディスクドライブの障害の早期発見・故障の予測を目的としてハードディスクドライブに搭載された機能である。この機能は、各種検査項目をリアルタイムに自己診断し、その状態を数値化する。端末コンピュータを利用するユーザはその数値を各種のツールを用いることで知ることができる。全ての故障を予知することはできないが、安定した利用環境における経年劣化による故障を知るには非常に有効である。   S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) is a function installed in a hard disk drive for the purpose of early detection of failure of the hard disk drive and prediction of failure. This function self-diagnose various inspection items in real time and digitizes their status. The user using the terminal computer can know the numerical value by using various tools. Not all failures can be predicted, but it is very effective to know failures due to aging in a stable usage environment.

このS.M.A.R.T.機能を利用した故障予測方法としては、(1)S.M.A.R.T.機能の各項目に閾値を設定し、その閾値を超えた場合に警告を行う方法(例えば特許文献1〜2)、(2)S.M.A.R.T.項目の起動時間、起動回数、起動リトライ回数から故障予測モデルを作成し、外部的な振動・衝撃によってスピンドルモータに故障が発生しているかを診断・予測し、モデルの出力結果によって警告を行う方法(例えば特許文献3)、(3)データ記憶装置自体に特別なセンサを設置し、そのセンサ値から総合的に故障を判断する方法(例えば特許文献4〜7)などが挙げられる。
特開2007−213670号公報 特開2007−335016号公報 特開2006−236524号公報 特開2005−55296号公報 特開2002−272172号公報 特開2002−131188号公報 特開平11−2669号公報 Eduardo.P. et al, “Failure Trends in a Large Disk Drive Population”, 2007
As a failure prediction method using this SMART function, (1) a threshold value is set for each item of the SMART function, and a warning is issued when the threshold value is exceeded (for example, Patent Documents 1 and 2), (2) SMART A method to create a failure prediction model from the item start time, start count, and start retry count, diagnose and predict whether a spindle motor has failed due to external vibration or shock, and issue a warning based on the model output result (For example, patent documents 3), (3) The method (for example, patent documents 4-7) which installs a special sensor in data storage device itself, and judges a failure comprehensively from the sensor value etc. are mentioned.
Japanese Patent Laid-Open No. 2007-213670 JP 2007-335016 A JP 2006-236524 A JP 2005-55296 A JP 2002-272172 A JP 2002-131188 A Japanese Patent Laid-Open No. 11-2669 Eduardo.P. Et al, “Failure Trends in a Large Disk Drive Population”, 2007

しかしながら、上記従来技術においては、以下の問題点があった。上記(1)の方法の場合、各項目の閾値をチェックする方法であるので、誤り警告や故障の見逃しが多く発生するという問題がある。上記(2)の方法の場合、非特許文献1に記述されているように、起動リトライの発生頻度は極めて低く、起動リトライが発生する前に故障することが殆どであるため、有効性に欠ける。上記(3)の場合には、特殊なセンサを必要とするため、現在流通している多くのハードディスクドライブに適用できない問題がある。その中において、特許文献4では電流・温度・規定回転数を項目として利用している。これら3つの項目は、現在の一部のハードディスクドライブにおいても取得可能な項目であるが、電流に関しては真値を取得することができず、定格電流より低い値であった場合のみ標準化された項目値から減算する仕様であるため、軸受の劣化を適切に表現できないという問題が残る。   However, the above prior art has the following problems. The method (1) is a method of checking the threshold value of each item, and there is a problem that many error warnings and oversights of failures occur. In the case of the method (2), as described in Non-Patent Document 1, the frequency of start-up retries is extremely low, and failure is mostly caused before start-up retries occur, so that the method lacks effectiveness. . In the case of the above (3), since a special sensor is required, there is a problem that it cannot be applied to many hard disk drives currently distributed. Among them, Patent Document 4 uses current, temperature, and specified rotational speed as items. These three items are items that can be acquired even in some of the current hard disk drives, but the items that are standardized only when the true value of the current cannot be acquired and the value is lower than the rated current. Since the specification is subtracted from the value, there remains a problem that the deterioration of the bearing cannot be expressed appropriately.

そこで、本発明は、上記従来技術の問題を鑑み、殆どのハードディスクドライブにおいてS.M.A.R.T.機能などによって取得可能なセンサ項目を利用して流体動圧軸受スピンドルモータの劣化により発生する故障の診断・予測を行うハードディスクドライブ故障予測装置、ハードディスクドライブ故障モデル生成装置、及びハードディスクドライブ故障予測方法を提供することを目的とする。   In view of the above-described problems of the prior art, the present invention diagnoses and predicts a failure caused by deterioration of a fluid dynamic bearing spindle motor using sensor items that can be acquired by the SMART function or the like in most hard disk drives. An object of the present invention is to provide a hard disk drive failure prediction device, a hard disk drive failure model generation device, and a hard disk drive failure prediction method.

本発明に係るハードディスクドライブ故障予測装置は、学習フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納する第1のデータ取得部と、前記取得されるセンサ情報を所望の期間蓄積した履歴情報に基づき、前記センサ情報とディスクを回転駆動する流体動圧軸受スピンドルモータの潤滑油の劣化度との関係を表す劣化推定モデルを生成する劣化推定モデル生成部と、前記生成された劣化推定モデルによって推定された前記潤滑油の劣化度の時系列における変化とハードディスクドライブの生存確率との関係を表すハードディスクドライブ生存モデルを生成するハードディスクドライブ生存モデル生成部と、予測フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納する第2のデータ取得部と、前記取得されたセンサ情報を前記生成された劣化推定モデルに当てはめて前記予測フェーズに係るハードディスクドライブの前記潤滑油の劣化度を推定する劣化推定部と、前記推定された潤滑油の劣化度を前記生成されたハードディスクドライブ生存モデルに当てはめて傾向分析を行い、前記予測フェーズに係るハードディスクドライブの故障時間を予測する故障予測部と、を具備することを特徴とする。   A hard disk drive failure prediction apparatus according to the present invention acquires a sensor data from a sensor mounted on a hard disk drive in a learning phase, and stores the acquired sensor information as sensor information. A deterioration estimation model generation unit that generates a deterioration estimation model that represents a relationship between the sensor information and the degree of deterioration of lubricating oil of a fluid dynamic pressure bearing spindle motor that rotationally drives the disk based on history information accumulated for a period of time, and the generation A hard disk drive survival model generation unit for generating a hard disk drive survival model representing a relationship between a change in the time series of the deterioration degree of the lubricant estimated by the determined deterioration estimation model and a hard disk drive survival probability, and a prediction phase The sensor mounted on the hard disk drive A second data acquisition unit that acquires the data and stores it as sensor information, and applies the acquired sensor information to the generated deterioration estimation model to determine the degree of deterioration of the lubricating oil of the hard disk drive according to the prediction phase. A deterioration estimation unit for estimation, a failure analysis unit that applies a trend analysis by applying the estimated deterioration level of the lubricant to the generated hard disk drive survival model, and predicts a failure time of the hard disk drive according to the prediction phase; It is characterized by comprising.

本発明に係るハードディスクドライブ故障モデル生成装置は、学習フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納するデータ取得部と、前記取得されるセンサ情報を所望の期間蓄積した履歴情報に基づき、前記センサ項目とディスクを回転駆動する流体動圧軸受スピンドルモータの潤滑油の劣化度との関係を表す劣化推定モデルを生成する劣化推定モデル生成部と、前記生成された劣化推定モデルによって推定された前記潤滑油の劣化度の時系列における変化とハードディスクドライブの生存確率との関係を表すハードディスクドライブ生存モデルを生成するハードディスクドライブ生存モデル生成部と、を具備することを特徴とする。   A hard disk drive failure model generation device according to the present invention acquires a sensor data from a sensor mounted on a hard disk drive according to a learning phase, stores the sensor data as sensor information, and the acquired sensor information for a desired period A deterioration estimation model generation unit that generates a deterioration estimation model that represents a relationship between the sensor item and the degree of deterioration of the lubricating oil of the fluid dynamic bearing spindle motor that rotationally drives the disk based on the accumulated history information; A hard disk drive survival model generation unit that generates a hard disk drive survival model representing a relationship between a change in the time series of the deterioration degree of the lubricant estimated by the deterioration estimation model and the survival probability of the hard disk drive. And

本発明に係るハードディスクドライブ故障予測方法は、学習フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納する第1のデータ取得ステップと、前記取得されたセンサ情報を所望の期間蓄積した履歴情報に基づき、前記センサ項目とディスクを回転駆動する流体動圧軸受スピンドルモータの潤滑油の劣化度との関係を表す劣化推定モデルを生成する劣化推定モデル生成ステップと、前記生成された劣化推定モデルによって推定された前記潤滑油の劣化度の時系列における変化とハードディスクドライブの生存確率との関係を表すハードディスクドライブ生存モデルを生成するハードディスクドライブ生存モデル生成ステップと、予測フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納する第2のデータ取得ステップと、前記取得されたセンサ情報を前記生成された前記劣化推定モデルに当てはめて前記潤滑油の劣化度を推定する劣化推定ステップと、前記推定された潤滑油の劣化度に基づいて前記ハードディスクドライブ生存モデルによる傾向分析を行い、前記予測フェーズに係るハードディスクドライブの故障時間を予測する故障予測ステップと、を有することを特徴とする。   A hard disk drive failure prediction method according to the present invention includes a first data acquisition step of acquiring sensor data from a sensor mounted on a hard disk drive according to a learning phase, and storing the acquired sensor information as sensor information. A deterioration estimation model generation step for generating a deterioration estimation model representing a relationship between the sensor item and a degree of deterioration of lubricating oil of a fluid dynamic bearing spindle motor that rotationally drives the disk based on history information accumulated for a period of time, and the generation A hard disk drive survival model generation step for generating a hard disk drive survival model representing a relationship between a change in the time series of the deterioration degree of the lubricant estimated by the determined deterioration estimation model and a survival probability of the hard disk drive, and a prediction phase Installed in hard disk drive A second data acquisition step of acquiring sensor data from the acquired sensor and storing it as sensor information, and applying the acquired sensor information to the generated deterioration estimation model to estimate the degree of deterioration of the lubricating oil A deterioration estimation step, and a failure prediction step of performing a trend analysis by the hard disk drive survival model based on the estimated deterioration degree of the lubricating oil and predicting a failure time of the hard disk drive according to the prediction phase. Features.

本発明によれば、S.M.A.R.T.機能などの取得可能なセンサ項目を利用することで、殆どのハードディスクドライブにおいて流体動圧軸受スピンドルモータの劣化により発生する故障の診断・予測を行うハードディスクドライブ故障予測装置、ハードディスクドライブ故障モデル生成装置、及びハードディスクドライブ故障予測方法が提供される。   According to the present invention, a hard disk drive failure prediction device for diagnosing and predicting a failure caused by deterioration of a fluid dynamic bearing spindle motor in most hard disk drives by using an acquirable sensor item such as a SMART function, A hard disk drive failure model generation device and a hard disk drive failure prediction method are provided.

(実施形態1)
以下、本発明の実施形態について図面を用いて説明する。図1は、本発明の実施形態1に係るハードディスクドライブ(以下、「HDD」と表す。)故障モデル生成装置1及びHDD故障予測装置2の全体構成例を示すブロック図である。HDD故障モデル生成装置1は、HDD故障モデル生成過程(学習フェーズ)に係る装置であり、HDD故障予測装置2は、HDD故障予測過程(予測フェーズ)に係る装置である。
(Embodiment 1)
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an example of the overall configuration of a hard disk drive (hereinafter referred to as “HDD”) failure model generation device 1 and HDD failure prediction device 2 according to Embodiment 1 of the present invention. The HDD failure model generation device 1 is a device related to the HDD failure model generation process (learning phase), and the HDD failure prediction device 2 is a device related to the HDD failure prediction process (prediction phase).

HDD故障モデル生成装置1は、データ取得部11、履歴情報記憶部12、モデル生成部13、劣化推定モデル記憶部14、及びHDD生存モデル記憶部15を含む汎用計算機などのコンピュータであり、複数台の学習フェーズ用のHDD100が接続されている。尚、学習フェーズ用のHDDは大量の履歴情報を収集するために複数台、複数種設けると好適であるが、これに限られない。   The HDD failure model generation apparatus 1 is a computer such as a general-purpose computer including a data acquisition unit 11, a history information storage unit 12, a model generation unit 13, a deterioration estimation model storage unit 14, and an HDD survival model storage unit 15. The learning phase HDD 100 is connected. Note that it is preferable to provide a plurality of learning phase HDDs and a plurality of types of HDDs for collecting a large amount of history information, but the invention is not limited to this.

データ取得部11は、学習フェーズに係る複数台のHDD100から内部状態の情報として、少なくとも規定回転数、通電時間(PowerOnHours)、ディスク温度(Temperature)、スピンアップ時間(SpinUpTime)、スピンアップ電流量(SpinHighCurrent)を定期的に取得し、これらの取得された情報を計算機が処理しやすい形式の履歴情報(例えばCSV形式)に変換して、故障が発生するまでの履歴情報を履歴情報記憶部12に記憶するプログラムである。規定回転数は、定常状態におけるディスク回転数(例えばカタログスペック)である。スピンアップ時間は、ディスクが通電回転を開始してから規定回転数に達するまで(スピンアップ)に要した時間である。スピンアップ電流量は、ディスクのスピンアップに使用した最大電流量である。ディスク温度は、ディスク内部の温度である。尚、通電時間(PowerOnHours)、ディスク温度(Temperature)、及びスピンアップ時間(SpinUpTime)は、HDD100に予め備えられたS.M.A.R.T.機能との連携によって取得される。また、規定回転数は、ディスク内に記憶されたファイル(例えば環境設定ファイル)などから読込まれ、スピンアップ電流量は専用に設けられたセンサなどによって取得される。以下、これらS.M.A.R.T.機能などによって取得されたデータの項目、あるいは、データ取得部11によって格納された情報の項目をセンサ項目という。   The data acquisition unit 11 includes at least a specified rotation speed, energization time (PowerOnHours), disk temperature (Temperature), spin-up time (SpinUpTime), spin-up current amount ( SpinHighCurrent) is periodically acquired, and the acquired information is converted into history information in a format that can be easily processed by the computer (for example, CSV format), and history information until a failure occurs is stored in the history information storage unit 12. It is a program to memorize. The specified rotational speed is a disk rotational speed (for example, catalog specification) in a steady state. The spin-up time is the time required for the disk to reach a specified rotation speed (spin-up) after starting energization rotation. The spin-up current amount is the maximum amount of current used to spin up the disk. The disk temperature is the temperature inside the disk. The energization time (PowerOnHours), the disk temperature (Temperature), and the spin-up time (SpinUpTime) are acquired in cooperation with the S.M.A.R.T. function provided in the HDD 100 in advance. The specified rotational speed is read from a file (for example, an environment setting file) stored in the disk, and the spin-up current amount is acquired by a dedicated sensor or the like. Hereinafter, items of data acquired by the S.M.A.R.T. function or the like, or items of information stored by the data acquisition unit 11 are referred to as sensor items.

モデル生成部13は、履歴情報記憶部12に記憶された履歴情報を読み込み、規定回転数毎に劣化推定モデル及びHDD生存モデルを生成して、劣化推定モデル記憶部14及びHDD生存モデル記憶部15にそれぞれ記憶するプログラムである。劣化推定モデルは、履歴情報のセンサ項目とディスクを回転駆動する流体動圧軸受スピンドルモータの潤滑油の劣化度との関係を表す数理モデルである。HDD生存モデルは、劣化推定モデルと履歴情報によって求められるスピンドルモータの潤滑油の劣化度の時系列における変化とハードディスクドライブの生存確率との関係を表す数理モデルである。また、複数の種類のハードディスクドライブの情報から規定回転数毎にモデルを作成する理由は、規定回転数によってスピンアップ時間が変動するからである。このように分類することで、生成されるモデルの精度が向上する。   The model generation unit 13 reads the history information stored in the history information storage unit 12, generates a deterioration estimation model and a HDD survival model for each specified rotational speed, and generates a deterioration estimation model storage unit 14 and a HDD survival model storage unit 15. Are programs to be stored respectively. The deterioration estimation model is a mathematical model that represents the relationship between the history information sensor item and the degree of deterioration of the lubricating oil of the fluid dynamic bearing spindle motor that rotationally drives the disk. The HDD survival model is a mathematical model that represents the relationship between changes in the time series of the deterioration degree of the lubricating oil of the spindle motor obtained from the deterioration estimation model and history information and the survival probability of the hard disk drive. The reason for creating a model for each specified rotational speed from information on a plurality of types of hard disk drives is that the spin-up time varies depending on the specified rotational speed. By classifying in this way, the accuracy of the generated model is improved.

HDD故障予測装置2は、データ取得部21、劣化推定部22、故障予測部23、結果通知部24、劣化推定モデル記憶部14´、HDD生存モデル記憶部15´、履歴情報記憶部25、及び劣化推定履歴記憶部26を含む汎用計算機などのコンピュータであり、予測フェーズに係るHDD101が接続されている。   The HDD failure prediction apparatus 2 includes a data acquisition unit 21, a deterioration estimation unit 22, a failure prediction unit 23, a result notification unit 24, a deterioration estimation model storage unit 14 ′, an HDD survival model storage unit 15 ′, a history information storage unit 25, and A computer such as a general-purpose computer including the deterioration estimation history storage unit 26 is connected to the HDD 101 related to the prediction phase.

データ取得部21は、監視対象である単数若しくは複数台のHDD101から内部状態の情報として、少なくとも規定回転数と、S.M.A.R.T.機能で取得できる通電時間(PowerOnHours)、ディスク温度(Temperature)、スピンアップ時間(SpinUpTime)を定期的に取得し、計算機が処理しやすい履歴情報(例えばCSV形式)に変換して、故障が発生するまでの履歴情報を履歴情報記憶部12に記憶するプログラムである。尚、HDD故障予測過程に用いるHDD101はスピンアップ電流量を取得できる機能を有さないものとする。   The data acquisition unit 21 has at least a specified rotational speed, energization time (PowerOnHours), disk temperature (Temperature), and spin-up time (which can be acquired by the SMART function) as internal state information from one or a plurality of HDDs 101 to be monitored. SpinUpTime) is periodically acquired, converted into history information (for example, CSV format) that can be easily processed by a computer, and history information until a failure occurs is stored in the history information storage unit 12. It is assumed that the HDD 101 used in the HDD failure prediction process does not have a function that can acquire the spin-up current amount.

劣化推定モデル記憶部14´及びHDD生存モデル記憶部15´は、故障モデル生成装置1の劣化推定モデル記憶部14及びHDD生存モデル記憶部15と同一のモデルをそれぞれ記憶する記憶装置である。   The deterioration estimation model storage unit 14 ′ and the HDD survival model storage unit 15 ′ are storage devices that store the same models as the deterioration estimation model storage unit 14 and the HDD survival model storage unit 15 of the failure model generation device 1, respectively.

劣化推定部22は、履歴情報記憶部25の最後のレコードを、劣化推定モデル記憶部14´に記憶された劣化推定モデルに適用して、現在のHDD101の劣化度を推定し、この推定された劣化度(以下、「推定劣化度」という。)を時刻とペアにした推定結果を劣化推定履歴情報として劣化推定履歴記憶部26に記憶するプログラムである。   The degradation estimation unit 22 estimates the degradation level of the current HDD 101 by applying the last record of the history information storage unit 25 to the degradation estimation model stored in the degradation estimation model storage unit 14 ′. This is a program for storing an estimation result obtained by pairing a degradation level (hereinafter referred to as “estimated degradation level”) with time in the degradation estimation history storage unit 26 as degradation estimation history information.

故障予測部23は、ディスク生存率が著しく減少する故障判定劣化度を自動的に同定、或いは、HDD生存モデルをディスプレイ(図示省略する)上に提示して利用者にディスクドライブ生存率の閾値θの入力を促すことで、予め故障判定劣化度dθを決定しておき、劣化推定履歴記憶部26に新たな情報が追加された時、HDD生存モデル記憶部15′に記憶されたHDD生存モデルを利用して、劣化推定履歴記憶部17に記憶された情報を傾向分析することによって、現在監視しているHDD101の推定劣化度が故障判定劣化度dθに到達するまでの余寿命を計算するプログラムである。 The failure predicting unit 23 automatically identifies the failure determination deterioration level at which the disk survival rate is significantly reduced, or presents the HDD survival model on a display (not shown) to inform the user of the threshold θ of the disk drive survival rate. When the failure determination deterioration degree is determined in advance and new information is added to the deterioration estimation history storage unit 26, the HDD survival model stored in the HDD survival model storage unit 15 ′ is prompted. utilizing, by trend analysis information stored in the degradation estimation history storage unit 17, calculates the remaining service life of up to estimate the degree of deterioration of HDD101 currently monitored reaches the failure determination deterioration degree d theta It is a program.

結果通知部24は、余寿命が予め定めた時間を下回った場合に、故障予測部23で計算された余寿命、或いは、余寿命から計算可能な故障予測時間(日付や時刻)をディスプレイ(図示省略する)やメールソフトに出力し、ユーザに通知するプログラムである。   The result notification unit 24 displays the remaining life calculated by the failure prediction unit 23 or the predicted failure time (date and time) that can be calculated from the remaining life when the remaining life falls below a predetermined time (shown in the figure). It is a program that outputs to mail software and notifies the user.

以下、HDD故障モデル生成装置1の動作について図面を参照して説明する。図2は、HDD故障モデル生成装置1における処理の具体例を示すフローチャートである。   Hereinafter, the operation of the HDD failure model generation apparatus 1 will be described with reference to the drawings. FIG. 2 is a flowchart illustrating a specific example of processing in the HDD failure model generation apparatus 1.

先ず、データ取得部11は、HDD電源OFFシーケンスが開始されるまで待機する(S201)。HDD電源OFFシーケンスが開始されると、データ取得部11は、HDDから少なくとも「データ取得日時」「ディスク温度」を取得し(S202)、所定の形式で履歴情報記憶部12に追加保存する(S203)。図3は、履歴情報の形式の具体例を示す図である。図3(a)は、履歴情報スキーマを示しており、ここではデータ取得日時(Date)、ハードディスクの識別子(ID)、電源OFF時のディスク温度(PowerOffTemp)、電源ON時のディスク温度(PowerOnTemp)、規定回転数(RPM)、通電時間(PowerOnHours)、停止時間(PowerOffHours)、スピンアップ時間(SpinUpTime)、スピンアップ電流量(SpinHighCurrent)などから構成されている。図3(b)は、HDD電源OFFシーケンス時の履歴情報の更新を示す図である。ここでは、最終行が更新された情報を示している。   First, the data acquisition unit 11 waits until the HDD power OFF sequence is started (S201). When the HDD power OFF sequence is started, the data acquisition unit 11 acquires at least “data acquisition date” and “disk temperature” from the HDD (S202), and additionally stores them in the history information storage unit 12 in a predetermined format (S203). ). FIG. 3 is a diagram illustrating a specific example of the history information format. FIG. 3A shows a history information schema. Here, data acquisition date and time (Date), hard disk identifier (ID), disk temperature when power is turned off (PowerOffTemp), disk temperature when power is turned on (PowerOnTemp) , A specified rotation speed (RPM), energization time (PowerOnHours), stop time (PowerOffHours), spin-up time (SpinUpTime), spin-up current amount (SpinHighCurrent), and the like. FIG. 3B is a diagram showing the update of the history information during the HDD power OFF sequence. Here, the information in which the last line is updated is shown.

次に、データ取得部11は、HDD電源ONシーケンスが開始されるまで待機する(S204)。HDD電源ONシーケンスが開始され、かつ、接続されているHDDのいずれかが起動しているかチェックする(S205)。   Next, the data acquisition unit 11 waits until the HDD power ON sequence is started (S204). It is checked whether the HDD power ON sequence is started and one of the connected HDDs is activated (S205).

S205において、いずれかのHDDが起動していた場合、データ取得部11は、起動しているすべてのHDDから少なくとも「取得日時」「規定回転数」「ディスク温度」「スピンアップ電流量」「スピンアップ時間」「通電時間」を取得し(S206)、S203で記憶した情報とマージして、所定の形式に沿って履歴情報記憶部12に追加保存する(S207)。図3(c)は、HDD電源ONシーケンス時の履歴情報の更新を示す図である。ここでは、最終行が更新された情報を示している。   In S205, if any HDD has been activated, the data acquisition unit 11 performs at least “acquisition date / time”, “specified rotation speed”, “disk temperature”, “spin-up current amount”, “spin” from all the activated HDDs. The “up time” and “energization time” are acquired (S206), merged with the information stored in S203, and additionally stored in the history information storage unit 12 in a predetermined format (S207). FIG. 3C is a diagram illustrating the update of history information during the HDD power-on sequence. Here, the information in which the last line is updated is shown.

また、S205において、すべてのHDDが起動していない場合(すなわち故障した場合)、或いは、所定の数のHDDが起動していない場合には、データ取得部11は、履歴情報記憶部12に記憶された情報から、「規定回転数」「ディスク温度(ON時)」「ディスク温度(OFF時)」「スピンアップ電流量」「スピンアップ時間」「通電時間」「停止時間」を読み込む(S208)。   In S205, when all HDDs are not activated (that is, when a failure occurs), or when a predetermined number of HDDs are not activated, the data acquisition unit 11 stores the history information in the history information storage unit 12. From the obtained information, the “specified rotational speed”, “disk temperature (when ON)”, “disk temperature (when OFF)”, “spin-up current amount”, “spin-up time”, “energization time” and “stop time” are read (S208) .

次に、モデル生成部13は、ベイジアンネットワークのCPT(条件付確率表)を規定回転数毎にカテゴリ分けして作成し、劣化推定モデルとして劣化推定モデル記憶部14に記憶する(S209)。   Next, the model generation unit 13 categorizes the Bayesian network CPT (conditional probability table) for each specified number of rotations, and stores it as a deterioration estimation model in the deterioration estimation model storage unit 14 (S209).

最後に、モデル生成部13は、劣化推定モデルの「潤滑油の古さ」のノードの時系列情報とHDDの生存率をペアにしたHDD生存モデルをHDD生存モデル記憶部15に記憶し(S210)、処理を終了する。   Finally, the model generation unit 13 stores in the HDD survival model storage unit 15 an HDD survival model in which the time series information of the “lubricating oil age” node of the degradation estimation model and the HDD survival rate are paired (S210). ), The process is terminated.

図4は、劣化推定モデル(ベイジアンネットワーク)の構造を説明する図である。ベイジアンネットワークは、複数の確率変数の間の定性的な依存関係をグラフ構造によって表し、個々の変数の間の定量的な関係を条件付確率で表した確率モデルである。ここでは、総稼働時間(t)、停止時ディスク温度(T)、総停止時間(t)の3つの要素からスピンドルモータの潤滑油の古さ(劣化度)が求められ、この潤滑油の古さと起動時ディスク温度(T)から潤滑油の粘度が求められる。そして、潤滑油の粘度とスピンアップ電流量からディスクの角速度が求められ、この角速度からスピンアップ時間が求められることが示されている。尚、白丸で表されたノードは学習フェーズにおいて観測可能な項目であり、黒丸で表されたノードは観測不可能な項目であるが、ベイジアンネットワークのグラフ構造によって観測可能な項目から観測不可能な項目を推定することが可能である。 FIG. 4 is a diagram for explaining the structure of a deterioration estimation model (Bayesian network). A Bayesian network is a probability model in which a qualitative dependency relationship between a plurality of random variables is represented by a graph structure, and a quantitative relationship between individual variables is represented by a conditional probability. Here, the age (degradation degree) of the lubricating oil of the spindle motor is obtained from three elements of the total operation time (t 1 ), the disk temperature at stop (T 1 ), and the total stop time (t 2 ). The viscosity of the lubricating oil is determined from the age of the oil and the starting disk temperature (T 0 ). It is shown that the angular velocity of the disk is obtained from the viscosity of the lubricating oil and the amount of spin-up current, and the spin-up time is obtained from this angular velocity. Note that the nodes represented by white circles are items that can be observed in the learning phase, and the nodes represented by black circles are items that cannot be observed, but cannot be observed from items that can be observed by the Bayesian network graph structure. It is possible to estimate items.

図5及び図6は、図4の依存関係を与えるにあたって、HDDの劣化傾向を実験により分析した結果を示す図である。図5は、スピンアップ時間とディスク温度の関係を示す図である。ここでは、丸印は初期状態のHDDにおけるデータを、四角印は経年劣化したHDDにおけるデータを示し、これらをデータ別に結ぶと2つの二次曲線状の帯となる。この二つの帯を比較することで、劣化方向が矢印の方向であると推定される。図6は、スピンアップ時間、ディスク温度、及びスピンアップ電流量の関係を示す図である。ここでは、電流値が一定の場合には図5の同様の結果を示すが、電流値を変更した場合には、スピンアップ時間が大幅に変わるという結果が示されている。すなわち、スピンアップ時間は、ディスクの温度だけでなくスピンアップ電流量にも依存して決定されることが分かる。   FIG. 5 and FIG. 6 are diagrams showing results of analyzing the tendency of HDD degradation by experiments in giving the dependency shown in FIG. FIG. 5 is a diagram showing the relationship between the spin-up time and the disk temperature. Here, the circles indicate the data in the HDD in the initial state, and the squares indicate the data in the HDD that has deteriorated over time, and when these are connected by data, two quadratic bands are obtained. By comparing these two bands, it is estimated that the deterioration direction is the direction of the arrow. FIG. 6 is a diagram showing the relationship between the spin-up time, the disk temperature, and the spin-up current amount. Here, the same result as in FIG. 5 is shown when the current value is constant, but the result that the spin-up time changes significantly when the current value is changed is shown. That is, it can be seen that the spin-up time is determined not only by the disk temperature but also by the spin-up current amount.

また、現在多く利用されているディスクドライブのスピンドルモータの軸受け部分には、微少な溝が掘られており、溝が狭くなる方向にオイルが集められて、回転軸がスリーブから浮き上がり、オイルの粘性でディスクが巻き込まれる形で回転する仕組みとなっている。よって、ある一定以上の粘性効果が必要であるが、あまりに高すぎると起動トルクを満たすことができず、回転しない現象が起こる。以上のことから、スピンアップ時間は温度が直接的に影響しているのではなく、オイルの粘性と深い関わりがあることが分かる。図7は、ディスク温度と粘度の関係を示す図である。同図に示されるように、オイルの粘性は、温度が高いほど小さくなる特性を持っており、温度が60℃変化すると、粘性は1桁近く変化する。また、酸化・不純物の混入・高温といった要因によってオイルの劣化が進行し、粘性が高くなる。このことから、起動時のディスク温度と現在のオイルの劣化状態によって、起動時の粘性が決定することも分かる。このとき、現在のオイルの劣化状態である酸化は時間経過によるものである。同様に、高温はディスクドライブが通電されている状態の温度を獲得すれば判断できる。したがって、通電時間、停止時間、停止時ディスク温度(すなわち、通電されていた状態のディスク温度)が、オイル劣化の要因となることが分かる。   In addition, a minute groove is dug in the bearing part of the spindle motor of the disk drive that is widely used at present. Oil is collected in the direction of narrowing the groove, and the rotating shaft floats up from the sleeve. It is a mechanism that rotates in the form that the disk is involved. Therefore, a viscosity effect of a certain level or more is necessary, but if it is too high, the starting torque cannot be satisfied and a phenomenon of not rotating occurs. From the above, it can be seen that the spin-up time is not directly affected by the temperature, but is closely related to the viscosity of the oil. FIG. 7 is a graph showing the relationship between the disk temperature and the viscosity. As shown in the figure, the viscosity of the oil has a characteristic that it becomes smaller as the temperature is higher, and when the temperature changes by 60 ° C., the viscosity changes by almost one digit. Further, the deterioration of oil proceeds due to factors such as oxidation, contamination of impurities, and high temperature, and the viscosity becomes high. From this, it can be seen that the viscosity at startup is determined by the disk temperature at startup and the current deterioration state of the oil. At this time, oxidation, which is the current state of deterioration of oil, is due to the passage of time. Similarly, the high temperature can be determined by obtaining a temperature in a state where the disk drive is energized. Therefore, it can be seen that the energization time, the stop time, and the disk temperature at the time of stop (that is, the disk temperature in the energized state) cause the oil deterioration.

また、混入する不純物としては、(1)非常に微細な埃、(2)結露による水滴、(3)ディスク表面の損傷などによる金属片が考えられる。(1)に関しては経過時間によって代用でき、(2)に関しては極度な温度差がない環境であれば考慮しなくても良い。また、(3)に関しては、衝撃・振動がない環境であれば考慮しなくても良いと考えられる。以上のことを総合的に鑑みて、図4の劣化推定モデルの構造を与えられる。   Further, as impurities to be mixed in, (1) very fine dust, (2) water droplets due to dew condensation, (3) metal pieces due to damage on the disk surface, etc. are conceivable. (1) can be substituted depending on the elapsed time, and (2) need not be considered in an environment where there is no extreme temperature difference. Further, regarding (3), it is considered that it is not necessary to consider if there is no impact / vibration. Taking the above into consideration, the structure of the deterioration estimation model in FIG. 4 is given.

図8は、HDD生存モデルの具体例を示す図である。ここでは、HDDの生存率(=1−HDD故障率)は、潤滑油の古さが所定の劣化度を境として急速に低下することが示されている。   FIG. 8 is a diagram illustrating a specific example of the HDD survival model. Here, it is shown that the HDD survival rate (= 1-HDD failure rate) rapidly decreases with the age of the lubricating oil as a boundary.

以下、HDD故障予測装置2の動作について図面を参照して説明する。図9は、HDD故障予測装置2における処理の具体例を示すフローチャートである。   Hereinafter, the operation of the HDD failure prediction apparatus 2 will be described with reference to the drawings. FIG. 9 is a flowchart illustrating a specific example of processing in the HDD failure prediction apparatus 2.

先ず、HDD故障モデル生成装置1で生成した劣化モデル及びHDD生存モデルをHDD故障予測装置2にコピーする(S901)。尚、コピーする手段は、LAN、インターネット、外部記憶媒体などどのような手段を用いても良い。   First, the deterioration model and HDD survival model generated by the HDD failure model generation device 1 are copied to the HDD failure prediction device 2 (S901). Note that any means such as a LAN, the Internet, or an external storage medium may be used for copying.

次に、故障予測部23は、HDD生存モデル記憶部15′に記憶されたHDD生存モデルを利用して、生存率が著しく減少する劣化度を自動的に同定、或いは、図8に示されるようなHDD生存モデルをディスプレイ(図示省略する)上に提示し、利用者にディスクドライブ生存率の閾値θを入力してもらうことで、故障判定劣化度dθを決定する(S902)。 Next, the failure prediction unit 23 automatically identifies the degree of deterioration in which the survival rate is significantly reduced by using the HDD survival model stored in the HDD survival model storage unit 15 ', or as shown in FIG. A hard disk survival model is presented on a display (not shown), and the threshold value θ of the disk drive survival rate is input by the user to determine the failure determination deterioration degree d θ (S902).

次に、データ取得部21は、HDD電源OFFシーケンスが開始されるまで待機する(S903)。HDD電源OFFシーケンスが開始されると、HDDから少なくとも「データ取得日時」「ディスク温度」を取得し(S904)、加工して履歴情報記憶部25に追加保存する(S905)。図10は、履歴情報の形式の具体例を示す図である。図10(a)は、履歴情報スキーマを示しており、ここではデータ取得日時(Date)、ハードディスクの識別子(ID)、電源OFF時のディスク温度(PowerOffTemp)、電源ON時のディスク温度(PowerOnTemp)、規定回転数(RPM)、通電時間(PowerOnHours)、停止時間(PowerOffHours)、スピンアップ時間(SpinUpTime)、スピンアップ電流量(SpinHighCurrent)などから構成されている。図10(b)は、HDD電源OFFシーケンス時の履歴情報の更新を示す図である。ここでは、最終行が更新されたデータを示している。   Next, the data acquisition unit 21 waits until the HDD power OFF sequence is started (S903). When the HDD power OFF sequence is started, at least “data acquisition date” and “disk temperature” are acquired from the HDD (S904), processed and additionally stored in the history information storage unit 25 (S905). FIG. 10 is a diagram illustrating a specific example of a history information format. FIG. 10A shows a history information schema. Here, data acquisition date and time (Date), hard disk identifier (ID), disk temperature when the power is turned off (PowerOffTemp), disk temperature when the power is turned on (PowerOnTemp) , The specified rotation speed (RPM), energization time (PowerOnHours), stop time (PowerOffHours), spin-up time (SpinUpTime), spin-up current amount (SpinHighCurrent), and the like. FIG. 10B is a diagram illustrating the update of history information during the HDD power OFF sequence. Here, the data in which the last line is updated is shown.

次に、データ取得部21は、HDD電源ONシーケンスが開始されるまで待機する(S906)。HDD電源ONシーケンスが開始されると、起動しているすべてのHDDから少なくとも「取得日時」「規定回転数」「ディスク温度」「スピンアップ時間」「通電時間」を取得し(S907)、S905で記憶したデータとマージし、所定の形式に沿って履歴情報記憶部25に追加保存する(S908)。図10(c)は、HDD電源ONシーケンス時の履歴情報の更新を示す図である。ここでは、最終行が更新されたデータを示している。   Next, the data acquisition unit 21 waits until the HDD power ON sequence is started (S906). When the HDD power ON sequence is started, at least “acquisition date / time”, “specified rotation speed”, “disk temperature”, “spin-up time”, and “energization time” are acquired from all activated HDDs (S907). The data is merged with the stored data and additionally stored in the history information storage unit 25 according to a predetermined format (S908). FIG. 10C is a diagram illustrating the update of history information during the HDD power-on sequence. Here, the updated data is shown in the last row.

次に、劣化推定部22は、履歴情報記憶部25に記憶されたデータから、最終レコードの「規定回転数(R)」「ディスク温度_ON(T)」「ディスク温度_OFF(T)」「スピンアップ時間(S)」「通電時間(t)」「停止時間(t)」を読み込む(S909)。 Next, the deterioration estimation unit 22 determines, from the data stored in the history information storage unit 25, the “specified rotational speed (R)”, “disk temperature_ON (T 0 )”, “disk temperature_OFF (T 1 )” ) ”,“ Spin-up time (S) ”,“ Energization time (t 1 ) ”, and“ Stop time (t 2 ) ”are read (S909).

次に、劣化推定部22は、S909で読み込んだデータを劣化推定モデル14′に記憶された劣化推定モデルに適用して、「潤滑油の古さ」の期待値(ガウス分布に従う)を推定し、この推定された期待値(推定劣化度)を時刻とペアにした推定結果を劣化推定履歴情報として劣化推定履歴記憶部26へ記憶する(S910)。図11は、ベイジアンネットワークに基づいて潤滑油の古さを推定する場合の入出力(エビデンスとクエリ)を説明する図である。ここでは、白丸で表される観測可能な項目(e:エビデンス)を条件に、潤滑油の古さの事後確率であるP(X|e)を推定する。尚、予測フェーズにおいてはスピンアップ電流量を取得することはできないが、学習フェーズにおいて強固なグラフ構造が構築できているならばベイジアンネットワークの特性上、推定可能である。   Next, the deterioration estimation unit 22 applies the data read in S909 to the deterioration estimation model stored in the deterioration estimation model 14 ′, and estimates an expected value (following a Gaussian distribution) of “lubricating oil age”. The estimation result obtained by pairing the estimated expected value (estimated deterioration level) with the time is stored in the deterioration estimation history storage unit 26 as deterioration estimation history information (S910). FIG. 11 is a diagram illustrating input / output (evidence and query) when estimating the age of the lubricating oil based on the Bayesian network. Here, P (X | e), which is the posterior probability of the age of the lubricating oil, is estimated on the condition of an observable item (e: evidence) represented by a white circle. Note that the spin-up current amount cannot be acquired in the prediction phase, but can be estimated from the characteristics of the Bayesian network if a strong graph structure can be constructed in the learning phase.

次に、故障予測部23は、劣化推定履歴記憶部26に記憶された劣化推定履歴情報を傾向分析し、図12に示すように故障予測時刻(dθ到達時刻)tを求め、現在時刻tとの差分により余寿命を計算する(S911)。図12は、ディスクの潤滑油劣化曲線を傾向分析し、故障予測時刻tを求める方法を説明する図である。 Next, the failure prediction unit 23 analyzes the tendency of the deterioration estimation history information stored in the deterioration estimation history storage unit 26 to obtain a failure prediction time (d θ arrival time) t b as shown in FIG. The remaining life is calculated based on the difference from t (S911). Figure 12 is a lubricant deterioration curve of the disc and trend analysis is a view for explaining a method of determining the failure prediction time t b.

そして、結果通知部24は、予め利用者が指定した値より余寿命が短いか否かを判定し(S912)、指定した値よりも余寿命が短い場合に、利用者のディスプレイに直接警告を表示、或いは、メールなどによって警告通知し(S913)、S903へ戻る。これに対し、余寿命が指定した値以上の場合には、警告を行わずにS903へ戻る。   Then, the result notifying unit 24 determines whether or not the remaining life is shorter than the value designated in advance by the user (S912), and if the remaining life is shorter than the designated value, directly gives a warning to the user's display. A warning is notified by display or e-mail (S913), and the process returns to S903. On the other hand, if the remaining life is greater than the specified value, the process returns to S903 without warning.

上記のように構成することにより、殆どのハードディスクドライブにおいてS.M.A.R.T.機能で取得可能なセンサ項目を利用して流体動圧軸受スピンドルモータの劣化により発生する故障の診断・予測を行うことができる。また、HDD故障モデル生成装置1で生成した劣化モデル及びHDD生存モデルをHDD故障予測装置2に外部記憶媒体などによって予めコピーする形式であるので、ネットワーク接続されていない場合にも故障予測ができる利点がある。   By configuring as described above, it is possible to diagnose and predict a failure caused by deterioration of a fluid dynamic bearing spindle motor using sensor items that can be acquired by the S.M.A.R.T. function in most hard disk drives. Further, since the deterioration model and HDD survival model generated by the HDD failure model generation device 1 are copied in advance to the HDD failure prediction device 2 by an external storage medium or the like, it is possible to perform failure prediction even when not connected to the network. There is.

(実施形態2)
図13は、実施形態2に係るHDD故障モデル生成装置1及びHDD故障予測装置2の全体構成例を示すブロック図である。図1と共通する符号は、同一のものを表すので説明を省略し、実施形態1と異なる点について詳細に説明する。同図に示されるように、本実施形態においては、実施形態1と異なり、HDD故障モデル生成過程(学習フェーズ)に係る故障モデル生成装置1とHDD故障予測過程(予測フェーズ)に係るHDD故障予測装置2がLANなどのネットワーク3を介して接続されている。
(Embodiment 2)
FIG. 13 is a block diagram illustrating an overall configuration example of the HDD failure model generation device 1 and the HDD failure prediction device 2 according to the second embodiment. The same reference numerals as those in FIG. 1 represent the same components, and thus the description thereof will be omitted. Differences from the first embodiment will be described in detail. As shown in the figure, in this embodiment, unlike the first embodiment, the failure model generation apparatus 1 related to the HDD failure model generation process (learning phase) and the HDD failure prediction related to the HDD failure prediction process (prediction phase). A device 2 is connected via a network 3 such as a LAN.

また、HDD故障モデル生成装置1で生成した劣化推定モデル及びHDD生存モデルをHDD故障予測装置3にコピーするのではなく、HDD故障予測装置2の劣化推定部22及び故障予測部23がHDD故障モデル生成装置1側の劣化推定モデル記憶部14及びHDD生存モデル記憶部15にネットワーク経由でそれぞれアクセスして取得する。   Further, instead of copying the deterioration estimation model and the HDD survival model generated by the HDD failure model generation device 1 to the HDD failure prediction device 3, the deterioration estimation unit 22 and the failure prediction unit 23 of the HDD failure prediction device 2 are replaced with the HDD failure model. The degradation estimation model storage unit 14 and the HDD survival model storage unit 15 on the generation device 1 side are respectively accessed and acquired via a network.

したがって、HDD故障モデル生成装置1の構成に関しては、実施形態1と同様であるが、HDD故障予測装置2に関しては、モデルを記憶するための劣化推定モデル記憶部14´及びHDD生存モデル記憶部15´を有さない。   Therefore, the configuration of the HDD failure model generation device 1 is the same as that of the first embodiment, but the HDD failure prediction device 2 has a degradation estimation model storage unit 14 ′ and a HDD survival model storage unit 15 for storing models. Does not have a ´.

また、本実施形態のHDD故障モデル生成装置1の動作は、実施形態1の動作(図2)と同様であり、HDD故障予測装置2の動作は、図9のS901においてモデルをコピーする代わりに、HDD故障予測装置2の劣化推定部22及び故障予測部23がHDD故障モデル生成装置1側の劣化推定モデル記憶部14及びHDD生存モデル記憶部15にネットワーク経由でそれぞれアクセスして取得すること以外は同様である。   The operation of the HDD failure model generation device 1 of the present embodiment is the same as the operation of the first embodiment (FIG. 2), and the operation of the HDD failure prediction device 2 is performed instead of copying the model in S901 of FIG. The deterioration estimation unit 22 and the failure prediction unit 23 of the HDD failure prediction apparatus 2 access and acquire the deterioration estimation model storage unit 14 and the HDD survival model storage unit 15 on the HDD failure model generation apparatus 1 side through the network, respectively. Is the same.

上記のように構成することにより、HDD故障モデル生成装置1において最新の履歴情報に基づいて劣化推定モデルとHDD生存モデルの更新が行われた場合にも、HDD故障予測装置2において迅速に取得可能な利点がある。   By configuring as described above, even when the HDD failure model generation device 1 updates the deterioration estimation model and the HDD survival model based on the latest history information, the HDD failure prediction device 2 can quickly acquire the update. There are significant advantages.

尚、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。   Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, the constituent elements over different embodiments may be appropriately combined.

具体的には、HDD故障モデル生成過程(学習フェーズ)に係る故障モデル生成装置1とHDD故障予測過程(予測フェーズ)に係るHDD故障予測装置2を別々の装置ではなく、一つの装置としても良い。   Specifically, the failure model generation device 1 related to the HDD failure model generation process (learning phase) and the HDD failure prediction device 2 related to the HDD failure prediction process (prediction phase) may be a single device instead of separate devices. .

また、ハードディスクドライブから種々の情報を取得する方法としてS.M.A.R.T.機能を利用しているが、スピンアップ時間、スピンアップ電流量、ディスク温度、通電時間、及び規定回転数を取得可能な別のセンサ機能を利用しても良い。   In addition, the SMART function is used as a method of acquiring various information from the hard disk drive, but there is another sensor function that can acquire the spin-up time, spin-up current amount, disk temperature, energization time, and specified rotation speed. May be used.

更に、上記実施形態においては、予測フェーズにおいてスピンアップ電流量を取得できない場合を想定しているが、スピンアップ電流量を測定できるセンサなどが設けられている場合には、劣化推定モデルに対して当てはめるセンサ項目に測定されたスピンアップ電流量を加えることで、推定される劣化度の精度を更に向上させることができる。   Furthermore, in the above-described embodiment, it is assumed that the spin-up current amount cannot be acquired in the prediction phase. However, when a sensor or the like that can measure the spin-up current amount is provided, the degradation estimation model is used. By adding the measured spin-up current amount to the sensor item to be applied, the accuracy of the estimated deterioration degree can be further improved.

本発明の実施形態1に係るHDD故障モデル生成装置1及びHDD故障予測装置2の全体構成例を示すブロック図。1 is a block diagram showing an overall configuration example of an HDD failure model generation device 1 and an HDD failure prediction device 2 according to Embodiment 1 of the present invention. HDD故障モデル生成装置1における処理の具体例を示すフローチャートである。4 is a flowchart illustrating a specific example of processing in the HDD failure model generation device 1. 履歴情報の形式の具体例を示す図。The figure which shows the specific example of the format of log | history information. 劣化推定モデル(ベイジアンネットワーク)の構造を説明する図。The figure explaining the structure of a degradation estimation model (Bayesian network). 図4の依存関係を与えるにあたって、HDDの劣化傾向を実験により分析した結果を示す図。The figure which shows the result of having analyzed the degradation tendency of HDD by experiment in giving the dependence relationship of FIG. 図4の依存関係を与えるにあたって、HDDの劣化傾向を実験により分析した結果を示す図。The figure which shows the result of having analyzed the degradation tendency of HDD by experiment in giving the dependence relationship of FIG. ディスク温度と粘度の関係を示す図。The figure which shows the relationship between disc temperature and a viscosity. HDD生存モデルの具体例を示す図。The figure which shows the specific example of HDD survival model. HDD故障予測装置2における処理の具体例を示すフローチャート。5 is a flowchart showing a specific example of processing in the HDD failure prediction apparatus 2. 履歴情報の形式の具体例を示す図。The figure which shows the specific example of the format of log | history information. ベイジアンネットワークに基づいて潤滑油の古さを推定する方法を説明する図。The figure explaining the method of estimating the age of lubricating oil based on a Bayesian network. ディスクの潤滑油劣化曲線を傾向分析し、故障予測時刻を求める方法を説明する図。The figure explaining the method which carries out the trend analysis of the lubricating oil deterioration curve of a disk, and calculates | requires failure prediction time. 本発明の実施形態2に係るHDD故障モデル生成装置1及びHDD故障予測装置2の全体構成例を示すブロック図。The block diagram which shows the example of whole structure of the HDD failure model production | generation apparatus 1 and HDD failure prediction apparatus 2 which concern on Embodiment 2 of this invention.

符号の説明Explanation of symbols

1…HDD故障モデル生成装置、
2…HDD故障予測装置、
3…ネットワーク、
11…データ取得部、
12…履歴情報記憶部、
13…モデル生成部、
14,14´…劣化推定モデル記憶部、
15,15´…HDD生存モデル記憶部、
21…データ取得部、
22…劣化推定部、
23…故障予測部、
24…結果通知部、
25…履歴情報記憶部、
26…劣化推定履歴記憶部。
1 HDD failure model generation device,
2 ... HDD failure prediction device,
3 ... Network,
11: Data acquisition unit,
12 ... History information storage unit,
13 ... model generation unit,
14, 14 '... deterioration estimation model storage unit,
15, 15 '... HDD survival model storage unit,
21 ... Data acquisition unit,
22 ... deterioration estimation part,
23 ... Failure prediction unit,
24 ... result notification part,
25. History information storage unit,
26: Deterioration estimation history storage unit.

Claims (10)

学習フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納する第1のデータ取得部と、
前記取得されるセンサ情報を所望の期間蓄積した履歴情報に基づき、前記センサ情報とディスクを回転駆動する流体動圧軸受スピンドルモータの潤滑油の劣化度との関係を表す劣化推定モデルを生成する劣化推定モデル生成部と、
前記生成された劣化推定モデルによって推定された前記潤滑油の劣化度の時系列における変化とハードディスクドライブの生存確率との関係を表すハードディスクドライブ生存モデルを生成するハードディスクドライブ生存モデル生成部と、
予測フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納する第2のデータ取得部と、
前記取得されたセンサ情報を前記生成された劣化推定モデルに当てはめて前記予測フェーズに係るハードディスクドライブの前記潤滑油の劣化度を推定する劣化推定部と、
前記推定された潤滑油の劣化度を前記生成されたハードディスクドライブ生存モデルに当てはめて傾向分析を行い、前記予測フェーズに係るハードディスクドライブの故障時間を予測する故障予測部と、
を具備することを特徴とするハードディスクドライブ故障予測装置。
A first data acquisition unit that acquires sensor data from a sensor mounted on a hard disk drive according to a learning phase, and stores the sensor data as sensor information;
Deterioration that generates a deterioration estimation model that represents the relationship between the sensor information and the degree of deterioration of the lubricating oil of the fluid dynamic bearing spindle motor that rotationally drives the disk, based on history information obtained by accumulating the acquired sensor information for a desired period. An estimation model generation unit;
A hard disk drive survival model generating unit that generates a hard disk drive survival model representing a relationship between a change in the time series of the deterioration degree of the lubricant estimated by the generated deterioration estimation model and the survival probability of the hard disk drive;
A second data acquisition unit that acquires sensor data from a sensor mounted on the hard disk drive according to the prediction phase, and stores the sensor data as sensor information;
A deterioration estimation unit that applies the acquired sensor information to the generated deterioration estimation model to estimate the degree of deterioration of the lubricating oil of the hard disk drive according to the prediction phase;
Applying the estimated degree of deterioration of the lubricant to the generated hard disk drive survival model to perform a trend analysis, and predict a failure time of the hard disk drive according to the prediction phase;
A hard disk drive failure prediction apparatus comprising:
前記劣化推定モデル生成部は、前記履歴情報のセンサ項目の内、少なくとも前記ディスクへの通電時間、前記ディスクの定常状態における規定回転数、前記ディスクに電源投与されてから前記規定回転数に達するまでの所要時間、前記ディスクの温度、及び前記規定回転数に達するまでに要した最大電流量を利用し、前記劣化推定モデルを生成することを特徴とする請求項1記載のハードディスクドライブ故障予測装置。   The degradation estimation model generation unit includes at least the energization time to the disk, the specified rotational speed in a steady state of the disk, and the predetermined rotational speed after power is supplied to the disk, among the sensor items of the history information The hard disk drive failure prediction apparatus according to claim 1, wherein the deterioration estimation model is generated using a required time, a temperature of the disk, and a maximum amount of current required to reach the specified rotational speed. 前記劣化推定部は、前記第2のデータ取得部において取得されるセンサ情報の内、少なくとも前記ディスクへの通電時間、前記ディスクの定常状態における規定回転数、前記ディスクに電源投与されてから前記規定回転数に達するまでの所要時間、及び前記ディスクの温度を前記劣化推定モデルに当てはめて前記予測フェーズに係るハードディスクドライブの前記潤滑油の現時点における劣化度を求めることを特徴とする請求項1又は請求項2記載のハードディスクドライブ故障予測装置。   The deterioration estimating unit includes at least the energization time to the disk, the specified rotational speed in a steady state of the disk, and the specified after the power is applied to the disk, among the sensor information acquired by the second data acquiring unit. The time required to reach the rotational speed and the temperature of the disk are applied to the deterioration estimation model to determine the current deterioration degree of the lubricating oil of the hard disk drive related to the prediction phase. Item 3. The hard disk drive failure prediction apparatus according to Item 2. 前記劣化推定モデルは、前記センサ項目及び前記潤滑油の劣化度をノードとするベイジアンネットワークであることを特徴とする請求項1乃至請求項3のいずれか一項に記載のハードディスクドライブ故障予測装置。   4. The hard disk drive failure prediction apparatus according to claim 1, wherein the deterioration estimation model is a Bayesian network in which the sensor items and the deterioration degree of the lubricant are nodes. 5. 学習フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納するデータ取得部と、
前記取得されるセンサ情報を所望の期間蓄積した履歴情報に基づき、前記センサ項目とディスクを回転駆動する流体動圧軸受スピンドルモータの潤滑油の劣化度との関係を表す劣化推定モデルを生成する劣化推定モデル生成部と、
前記生成された劣化推定モデルによって推定された前記潤滑油の劣化度の時系列における変化とハードディスクドライブの生存確率との関係を表すハードディスクドライブ生存モデルを生成するハードディスクドライブ生存モデル生成部と、
を具備することを特徴とするハードディスクドライブ故障モデル生成装置。
A data acquisition unit that acquires sensor data from a sensor mounted on a hard disk drive related to the learning phase, and stores it as sensor information;
Deterioration that generates a deterioration estimation model that represents the relationship between the sensor items and the degree of deterioration of the lubricating oil of the fluid dynamic bearing spindle motor that rotationally drives the disk, based on the history information obtained by accumulating the acquired sensor information for a desired period. An estimation model generation unit;
A hard disk drive survival model generation unit that generates a hard disk drive survival model representing a relationship between a change in the time series of the deterioration degree of the lubricant estimated by the generated deterioration estimation model and the survival probability of the hard disk drive;
A hard disk drive failure model generation device comprising:
前記劣化推定モデル生成部は、前記履歴情報のセンサ項目の内、少なくとも前記ディスクへの通電時間、前記ディスクの定常状態における規定回転数、前記ディスクに電源投与されてから前記規定回転数に達するまでの所要時間、前記ディスクの温度、及び前記規定回転数に達するまでに要した最大電流量を利用し、前記劣化推定モデルを生成することを特徴とする請求項5記載のハードディスクドライブ故障モデル生成装置。   The degradation estimation model generation unit includes at least the energization time to the disk, the specified rotational speed in a steady state of the disk, and the predetermined rotational speed after power is supplied to the disk, among the sensor items of the history information 6. The hard disk drive failure model generation device according to claim 5, wherein the deterioration estimation model is generated using a required time, a temperature of the disk, and a maximum amount of current required to reach the specified rotational speed. . 前記劣化推定モデルは、前記センサ項目及び前記潤滑油の劣化度をノードとするベイジアンネットワークであることを特徴とする請求項5又は請求項6記載のハードディスクドライブ故障モデル生成装置。   7. The hard disk drive failure model generation device according to claim 5, wherein the deterioration estimation model is a Bayesian network having the sensor items and the deterioration degree of the lubricant as nodes. 学習フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納する第1のデータ取得ステップと、
前記取得されたセンサ情報を所望の期間蓄積した履歴情報に基づき、前記センサ項目とディスクを回転駆動する流体動圧軸受スピンドルモータの潤滑油の劣化度との関係を表す劣化推定モデルを生成する劣化推定モデル生成ステップと、
前記生成された劣化推定モデルによって推定された前記潤滑油の劣化度の時系列における変化とハードディスクドライブの生存確率との関係を表すハードディスクドライブ生存モデルを生成するハードディスクドライブ生存モデル生成ステップと、
予測フェーズに係るハードディスクドライブに搭載されたセンサからセンサデータを取得し、センサ情報として格納する第2のデータ取得ステップと、
前記取得されたセンサ情報を前記生成された前記劣化推定モデルに当てはめて前記潤滑油の劣化度を推定する劣化推定ステップと、
前記推定された潤滑油の劣化度に基づいて前記ハードディスクドライブ生存モデルによる傾向分析を行い、前記予測フェーズに係るハードディスクドライブの故障時間を予測する故障予測ステップと、
を有することを特徴とするハードディスクドライブ故障予測方法。
A first data acquisition step of acquiring sensor data from a sensor mounted on a hard disk drive according to a learning phase and storing it as sensor information;
Deterioration that generates a deterioration estimation model that represents the relationship between the sensor item and the degree of deterioration of lubricating oil in a fluid dynamic bearing spindle motor that rotationally drives the disk, based on history information obtained by accumulating the acquired sensor information for a desired period. An estimation model generation step;
A hard disk drive survival model generation step for generating a hard disk drive survival model representing a relationship between a change in the time series of the deterioration degree of the lubricant estimated by the generated deterioration estimation model and the survival probability of the hard disk drive;
A second data acquisition step of acquiring sensor data from a sensor mounted on the hard disk drive according to the prediction phase and storing it as sensor information;
A deterioration estimation step for estimating the degree of deterioration of the lubricating oil by applying the acquired sensor information to the generated deterioration estimation model;
A failure prediction step of performing a trend analysis by the hard disk drive survival model based on the estimated deterioration degree of the lubricating oil, and predicting a failure time of the hard disk drive according to the prediction phase;
A hard disk drive failure prediction method comprising:
前記劣化推定モデル生成ステップにおいて、前記履歴情報のセンサ項目の内、少なくとも前記ディスクへの通電時間、前記ディスクの定常状態における規定回転数、前記ディスクに電源投与されてから前記規定回転数に達するまでの所要時間、前記ディスクの温度、及び前記規定回転数に達するまでに要した最大電流量を利用し、前記劣化推定モデルを生成することを特徴とする請求項8記載のハードディスクドライブ故障予測方法。   In the deterioration estimation model generation step, at least the energization time to the disk, the specified rotational speed in the steady state of the disk, and the specified rotational speed after the power supply to the disk is reached among the sensor items of the history information 9. The hard disk drive failure prediction method according to claim 8, wherein the deterioration estimation model is generated using a required time, a temperature of the disk, and a maximum amount of current required to reach the specified rotational speed. 前記劣化推定モデルは、前記センサ項目及び前記潤滑油の劣化度をノードとするベイジアンネットワークであることを特徴とする請求項8又は請求項9記載のハードディスクドライブ故障予測方法。   The hard disk drive failure prediction method according to claim 8 or 9, wherein the deterioration estimation model is a Bayesian network having the sensor items and the deterioration degree of the lubricating oil as nodes.
JP2008114114A 2008-04-24 2008-04-24 Hard disk drive failure prediction device, hard disk drive failure model generation device, and hard disk drive failure prediction method Pending JP2009266291A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008114114A JP2009266291A (en) 2008-04-24 2008-04-24 Hard disk drive failure prediction device, hard disk drive failure model generation device, and hard disk drive failure prediction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008114114A JP2009266291A (en) 2008-04-24 2008-04-24 Hard disk drive failure prediction device, hard disk drive failure model generation device, and hard disk drive failure prediction method

Publications (1)

Publication Number Publication Date
JP2009266291A true JP2009266291A (en) 2009-11-12

Family

ID=41391951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008114114A Pending JP2009266291A (en) 2008-04-24 2008-04-24 Hard disk drive failure prediction device, hard disk drive failure model generation device, and hard disk drive failure prediction method

Country Status (1)

Country Link
JP (1) JP2009266291A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013027744A1 (en) * 2011-08-23 2013-02-28 日本電気株式会社 Failure prediction method and failure prediction system
JP2013178619A (en) * 2012-02-28 2013-09-09 Kyocera Document Solutions Inc Device for detecting number of times of start-ups of hard disk drive and image formation device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013027744A1 (en) * 2011-08-23 2013-02-28 日本電気株式会社 Failure prediction method and failure prediction system
US8861110B2 (en) 2011-08-23 2014-10-14 Nec Corporation Failure prediction method and failure prediction system
JPWO2013027744A1 (en) * 2011-08-23 2015-03-19 日本電気株式会社 Failure prediction method and failure prediction system
JP2013178619A (en) * 2012-02-28 2013-09-09 Kyocera Document Solutions Inc Device for detecting number of times of start-ups of hard disk drive and image formation device

Similar Documents

Publication Publication Date Title
JP6008070B1 (en) Operation management apparatus, operation management method, and recording medium on which operation management program is recorded
US8484145B2 (en) Standardizing data used for monitoring an aeroengine
US20190324430A1 (en) Computer System and Method for Creating a Supervised Failure Model
KR101114054B1 (en) Monitoring reliability of a digital system
JP4767148B2 (en) Rolling bearing remaining life diagnosis method using normal database, remaining life diagnosis system, and computer program used for remaining life diagnosis
KR20090099536A (en) Monitoring reliability of a digital system
US9058250B2 (en) In-situ computing system failure avoidance
JP2007328522A (en) Failure probability calculation device, method, and program
US11307569B2 (en) Adaptive sequential probability ratio test to facilitate a robust remaining useful life estimation for critical assets
US9218694B1 (en) Recommendations for time to replace parts on machines
US20140188777A1 (en) Methods and systems for identifying a precursor to a failure of a component in a physical system
JP2015049606A (en) Management system, management object device, management device, method, and program
US8450984B2 (en) Diagnosis and prognosis of rotor thermal sensitivity
US11921005B2 (en) System, apparatus and method for estimating remaining useful life of a bearing
US20140324409A1 (en) Stochastic based determination
JP2009266291A (en) Hard disk drive failure prediction device, hard disk drive failure model generation device, and hard disk drive failure prediction method
CN111061581B (en) Fault detection method, device and equipment
JP2020139763A (en) Monitoring device, monitoring method, creation method of shaft vibration determination model, and program
US11340141B2 (en) Exception-based route plan generation
JP2019519753A (en) Computerized fluid analysis to determine if an asset is likely to have fluid problems
US11216329B2 (en) Maintenance intervention predicting
JP2018005393A (en) Failure sign determination method, failure sign determination device and failure sign determination program
JP2008084392A (en) Magnetic disk device, failure prediction device, and method for predicting failure of magnetic disk device
US20230315559A1 (en) Fault diagnosis apparatus, non-transitory computer-readable recording medium, and fault diagnosis method
US20240125675A1 (en) Anomaly detection for industrial assets