JP7273669B2 - ストレージシステム及びその制御方法 - Google Patents

ストレージシステム及びその制御方法 Download PDF

Info

Publication number
JP7273669B2
JP7273669B2 JP2019167495A JP2019167495A JP7273669B2 JP 7273669 B2 JP7273669 B2 JP 7273669B2 JP 2019167495 A JP2019167495 A JP 2019167495A JP 2019167495 A JP2019167495 A JP 2019167495A JP 7273669 B2 JP7273669 B2 JP 7273669B2
Authority
JP
Japan
Prior art keywords
failure
storage
drive
model
predicted value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019167495A
Other languages
English (en)
Other versions
JP2021043891A (ja
Inventor
幹 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019167495A priority Critical patent/JP7273669B2/ja
Publication of JP2021043891A publication Critical patent/JP2021043891A/ja
Application granted granted Critical
Publication of JP7273669B2 publication Critical patent/JP7273669B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

本発明は、記憶ドライブの故障リスクを予測できるようにしたストレージシステム、及び、その制御方法に関する。
記録媒体としてのハードディスクは、表面に磁性体が蒸着された回転体であって、移動する磁気ヘッドが、ハードディスクに磁気情報を記録し、又は、ハードディスクから磁気情報を読み出す。ハードディスクドライブは、ハードディスクを回転させる機構、磁気ヘッドを駆動させる機構など多くの機械モジュールを備え、したがって、機構モジュールの故障や、機構モジュールに生じる僅かな歪みや、振動などにより、ハードディスクが損傷して、データ喪失のおそれがあることが知られている。
そこで、ストレージシステムは、複数の記憶ドライブによってRAIDグループを構成し、グループの記憶ドライブに故障が生じても、グループの他の記憶ドライブに格納された、データとパリティデータとに基づいて、故障した記憶ドライブのデータをスペアディスクに再現させるようにしている(縮退運転)。
しかしながら、ストレージシステムは、縮退運転の際の演算負荷によって、ストレージシステムの性能を低下させてしまうことと、縮退運転期間中、RAIDグループに属する記憶ドライブがさらに故障してしまうと、故障したハードディスクドライブのデータを復元できないという課題がある(多重障害)。
そこで、ハードディスクドライブが故障してしまう前に、ハードディスクドライブのデータをスペアディスクに退避させようとするこころみが知られている。
特許文献1には、ハードディスクドライブに読み書きのエラーなど何らかの事象が発生したとき、ドライブにその事象に応じた数値を加算して割当て、その加算結果が一定値を超えたリスクを高リスクと判断することが記載されている。
特許文献2には、冗長性を備える複数のドライブから構成される同一RAIDグループ内に複数(m基)の高リスクドライブが存在した場合に、それぞれのドライブの1/mずつのデータをスペアディスクにコピーする手段が記載されている。
特開2015-52960公報 特開2009-211619公報
近年、半導体技術の進歩により、フラッシュメモリの高集積化と低価格化が進み、記憶媒体としてフラッシュメモリを使用した記憶ドライブも広く知られるようになっている。フラッシュメモリは、メモリセルを多層化してドライブの容量を増大させているため、一部のメモリセルが寿命により劣化しても、他のメモリセルによってこれを代用できることから、ハードディスクドライブのように、記憶ドライブの急な故障ということはなく、ストレージシステムは、フラッシュメモリドライブの交換が必要になるまで、これを継続的に使用し続けることができる。
したがって、ストレージシステムには、フラッシュメモリドライブの故障リスクを正確に評価することが望まれる。何故なら、故障リスクの評価を厳しくすると、継続使用可能な記憶ドライブを交換しなければならなくなる等の過剰保守を招き、一方、評価が甘くなると、既述の縮退運転をしなければならない状況に追い込まれてしまう。
特許文献1に記載の技術では、リスクが記憶ドライブの劣化による進行性のものなのか、また、他の装置のリスクが影響したものなのかが不明で、フラッシュメモリドライブのリスクを正確に評価できない。
特許文献2に記載の技術では、スペアドライブの容量は限られており、故障リスクが高いドライブのデータ量が他のドライブに対して多い場合、高リスクドライブのデータを全てスペアドライブに退避できないおそれがある。
本発明は、記憶媒体としてのフラッシュメモリを有する記憶ドライブの故障リスクを正確に評価できる、ストレージシステム、及び、その制御方法を提供することを目的とする。
前記目的を達成するために、本発明は、RAIDグループを備えるストレージと、前記ストレージに対するデータのリード、及び、ライトを制御する制御装置と、を備えるストレージシステムであって、前記RAIDグループは、記憶媒体としてのフラッシュメモリを有する記憶ドライブを複数有し、前記制御装置は、前記記憶ドライブの稼働ログを検出することと、前記記憶ドライブの周辺装置の稼働ログを検出することと、前記記憶ドライブを評価する第1のモデルを設定することと、前記周辺装置を評価する第2のモデルを設定することと、前記記憶ドライブの稼働ログを前記第1のモデルに適用することと、前記周辺装置の稼働ログを前記第2のモデルに適用することと、前記第1のモデルに基づいて、前記記憶ドライブの故障を予測するための第1の予測値を得ることと、前記第2のモデルに基づいて、前記周辺装置の故障を予測するための第2の予測値を得ることと、前記第1の予測値に基づいて、前記記録ドライブの故障リスクを判定することと、前記第2の予測値に基づいて、前記周辺装置の故障リスクを判定することと、を備えるストレージシステムである。
本発明によれば、記憶媒体としてのフラッシュメモリを有する記憶ドライブの故障リスクを正確に評価できる、ストレージシステム、及び、その制御方法を提供することができる。
本発明に係るストレージシステムの一実施形態のハードウェアブロックである。 図1の稼働ログ記録モジュール、そして、障害・保守情報記録モジュールの機能ブロック図である。 図1の予測モデル生成モジュールの機能ブロック図である。 予測モデル生成モジュールのモデル評価モジュール229の機能ブロック図である。 予測モデルを生成する工程図である。 生成した予測モデルの確度を評価する工程図である。 予測値分布の一例を示すグラフである。 図8における閾値の大小と、正答率と失報率の推移の関係を示すグラフである。 図1に係る稼動ログの一例を示すテーブルである。 図1に係る障害・保守記録の一例を示すテーブルである。 冗長性を備えるRAIDグループのドライブに生じた障害を回復するための動作を説明するためのブロック図である。 図1に係る故障リスク判定モジュールの機能ブロック図である。 故障リスク判定モジュールの他の実施形態に係る機能ブロック図である。 予測モデル1の予測値と、予測モデル2の予測値との相関を示すグラフである。 同じRAIDグループに属するドライブ1の予測値とドライブ2の予測値との相関を示すグラフである。 故障リスク判定モジュールによる、故障リスクの判定の複数の態様を説明するテーブルである。 フラッシュメモリドライブの交換の流れの一例に係る工程図である。
以下、本発明の実施の形態を、図面を参照して説明する。図1に、ストレージシステムのハードウェアブロックの一例を示す。ストレージシステムは、制御装置100と、ストレージ101と、一つまたは複数のスペアドライブ107、108と、を備える。ストレージ101は、夫々、冗長性を備える、一つまたは複数のRAIDグループ101を備える。一つのRAIDグループは、102~106で示される、記憶媒体としてフラッシュメモリを備える記憶ドライブを5台備えている。
制御装置100のRAID制御モジュール113は、ホストコントローラ130とのインタフェース(図示省略)を備え、ホストコントローラ130からの書き込みリクエスト131、読み込みリクエスト132により、ストレージ101への書き込み、読み込みを行う。
RAID制御モジュール113は、ホストコントローラ130からの書き込みデータを分割し(141、143、145、147)、更に、誤り訂正が可能な冗長データ149を加えて、複数のドライブ102~106に並列してデータを書き込む。
ホストコントローラ130からの読み込みリクエストに対しては、RAID制御モジュール113は、複数のドライブ102~106から、分割されたデータ140、142、144、146、および、冗長データ148を並列して読み込み、リードデータを構成して、ホストコントローラ130へ応答する(132)。
制御装置100は、記憶ドライブに、リードエラー、又は、ライトエラー等を診断し、そして、記憶ドライブの周辺装置を診断するモジュール112、診断結果を、記憶ドライブ、又は、周辺装置の稼働ログとして記憶する稼働ログ記憶モジュール111と、を備える。更に、制御装置100は、記憶ドライブ、及び、周辺装置の障害、修理等の情報を障害/保守記録モジュール110に記録する。
制御装置100は、ストレージ101を構成するドライブの個体番号や、それぞれの個体がどのRAIDグループに属するかの情報を、RAID構成情報119として記録している。なお、障害、保守記録、ならびにRAID構成情報を、制御装置100以外が管理、記録してもよい。
制御装置100は、予測モデル生成モジュール114を備える。モジュールとは、制御装置100のコントローラによって実行されるプログラム、及び/又は、ハードウェアとから実現される機能であって、部、手段、回路、ユニット、又は、単位とも称される。予測モデル生成モジュール114は、稼働ログ記録モジュール111に記録された稼働ログと、障害・保守情報記録モジュールに記録された障害、修理の情報に基づいて機械学習を行い、故障種別ごとに、故障リスクの予測モデル群115を生成する。
故障種別には、フラッシュメモリドライブのように、フラッシュメモリのセルの一部に障害が生じても、故障して交換しなければならなくなる迄使用を継続できるタイプ(経年劣化)と、フラッシュメモリドライブへのデータの入出力を補助する等の周辺装置、例えば、代表的には、ASIC、RAM、インタフェース(I/F)のように、突然して故障し交換されることを免れ得ないタイプがある。そこで、予測モデル群115は、フラッシュメモリ(NANDフラッシュメモリ)の故障予測モデル120と、一つまたは複数の周辺装置の故障予測モデル(ASIC故障予測モデル121、RAM故障予測モデル122、I/F故障予測モデル123)とを有する。
複数のモデルの夫々は、故障を予測したい期間の稼働ログに基づいて、その期間における予測対象が故障する度合いを表す特性値(予測値)を出力する。予測モデルは、故障に関連する稼働ログ項目の多項式で表現され、予測値を出力する。
NANDフラッシュメモリ故障予測モデル120、ASIC故障予測モデル121、RAM故障予測モデル122、I/F故障予測モデル123の4つの故障予測モデルによって、夫々算出された故障予測値150~153は、故障リスク判定モジュール116に出力される。故障リスク判定モジュール116は、複数のRAIDグループ夫々のドライブの故障リスクを判定し、判定結果159をスペアドライブ制御モジュール117に出力する。スペアドライブ制御モジュール117は、高リスクドライブのデータをスペアドライブ107、108へコピーして退避させる。
故障リスク判定モジュール116は、障害リスクの判定を、ドライブ単体について行うこともできるし、RAIDグループ内での偏在を考慮したリスク判定をすることもできる。故障リスク判定モジュール116は、RAIDグループ内でのドライブの障害リスクを判断するために、どのドライブがどこのRAIDグループに属するかの情報を得る必要があり、そこで、RAID構成情報119を参照する。
図2A、2B,2C、図3、図4に基づいて、稼働ログ記録モジュール111、障害・保守情報記録モジュール110、そして、予測モデル生成モジュール114の詳細に触れながら、故障予測モデルを生成するための動作を説明し、次いで、生成した故障予測モデルの確からしさ(確度)を評価する動作を説明する。
図2Aは、稼働ログ記録モジュール111、そして、障害・保守情報記録モジュール110の機能ブロック図である。図2Bは、予測モデル生成モジュール114の機能ブロック図であり、図2Cは、予測モデル生成モジュール114のモデル評価モジュール229の機能ブロック図である。図3は、予測モデルを生成する工程図であり、図4は、生成した予測モデルの確度を評価する工程図である。
図2Aに示す様に、RAIDグループの記憶ドライブ102~106の稼働状態、そして、記憶ドライブの周辺装置である、ASIC、RAM、インタフェース(I/F)の夫々の稼働状態を、診断モジュール112が診断すると、診断結果158を、一旦、稼働ログ201として蓄積記憶する。
一般的に、収集される、装置の稼動ログには、装置の動作状況や、収集経路によって、重複や欠損があると同時に、ほとんど記録のない項目や、分析に不適切なデータが含まれる場合がよくある。そこで、稼働ログ記録モジュール111は、有効データを抽出する(1401)ため、稼働ログスクリーニング202として、ログをクレンジング(除去、補正、補完)する。
稼動ログの種類によっては、適切な集計処理を施すことが必要なこともある。たとえば、装置稼働ログ記録モジュール111が、一定期間で、稼働ログを平均化したり、絶対値ではなく、百分率や分布で、装置ログを参照することもある。次いで、稼働ログ記録モジュール111は、装置の製番毎に、日々、時間毎の稼働ログの特徴量を演算する(図2A:213、図3:1403)。
障害・保守記録記憶モジュール110は、フラッシュメモリドライブ、ASIC、RAM、そして、I/Fを含む障害・保守情報をメモリに記録して蓄積し(203)、この情報をスクリーニングする(図2A:204、図3:1400)。スクリーニングは、障害・保守情報をクレンジング(除去、補正、補完)することと、障害・保守情報は連続データではなくイベントなので、障害・保守記録記憶モジュール110は、障害の発生日時、障害内容、保守実施を摘出し、これを、障害派生日時205、障害内容206、保守実施日時207に分類して記憶することを含む。
稼働ログ記憶モジュール111は、稼動ログ(特徴量)224を予測モデル生成モジュール114に送り、障害・保守情報記憶モジュール110は、障害発生日時221、障害内容222、保守日時223を予測モデル生成モジュール114に送る。
図2Bに示すように、予測モデル生成モジュール114の目的変数生成モジュール209は、目的変数を、障害に関連する稼動ログ、及び/又は、障害・保守情報に基づいて、故障種別ごとの故障発生有無として複数生成し(図3:1402)、故障種別ごとに複数のモデルを生成できるようにしている。
故障予測の対象機器に何等かのダメージが生じたり、保守が行われたりすると、それを境にして対象の状態が変化する。機械学習がこの状態変化の前後を混在すると、故障予測精度が悪化する。そこで、予測モデル生成モジュール114は、対象の稼働状態の変化を検出する(図2B:207、図3:1404)。
予測モデル生成モジュール114の説明変数生成モジュール208は、装置状態の変換点を加味して適切な稼働ログを摘出し、当該ログに基づいて、説明変数を生成する(図2B:208、図3:1405)を行う。機器状態の変化点は、例えば、障害・保守情報の保守実施日や、稼働ログの時系列データにおける統計的変化点である。
予測モデル生成モジュール114の目的変数生成モジュール209は、図2Bに示すように、NANDフラッシュメモリ故障(障害)の有無225、ASIC故障の有無226、SDRAM故障の有無227、I/F故障の有無228の4種類の故障に関連する目的変数を設定し(209)、故障に先立つ学習用稼動ログを故障の予兆の説明変数210として生成し、機械学習モジュール212は、目的変数、及び、説明変数に基づいて機械学習を実行、即ち、故障要因別に、故障有無を予測する回帰式を生成する(図3:1406)。
機械学習モジュール212は、NANDフラッシュメモリ故障予測モデル120、ASIC故障予測モデル121、RAM故障予測モデル122、I/F故障予測モデル123の4つの故障予測モデルを設定するための、夫々の故障有無に関連する稼働ログ項目の特徴量による多項式154、155、156、157を生成する。
さらに、モデル評価モジュール229は、それぞれのモデルにおいて、予測値に基づいて、故障リスクを判定するための閾値164、165、166、167と、その閾値で判断したときの、確度情報160、161、162、163を出力する。夫々のモデルの確度は、例えば、学習に用いたデータをモデルに入力し、学習データが、モデルにより故障と正しく分別される割合でよい。閾値、モデル確度の情報は、予測結果に基づいて、故障リスクを判断する障害リスク判定モジュール116で利用される。
次に、モデル評価モジュール229の機能ブロックである図2Cと、モデルの確度を評価する工程を示す図4とに基づいて、NAND故障予測モデルの確度を評価することを詳しく説明する。なお、他の故障予測モデルでも同じである。
モデル評価モジュール229は、モデル予測値230を導出(図4:1501)するために、NAND故障予測モデル154に、モデル生成に使った説明変数(稼働ログ)210を入力して、NAND故障に対するリスクをモデル予測値230として計算する。予測値230は、対象となるNAND障害のリスクが高ければより大きい数値に、低ければより小さい数値になる。
一般に、予測対象の稼働ログであって、任意の期間の稼働ログを予測モデルに入力し、予測モデルから出力されたモデル予測値に対して、閾値を適用して閾値を超過するか否かで、リスク判定モジュール116は故障リスクの判断を行い、その結果、保守対象を決定する。モデル評価モジュール229は、機械学習に使用した、目的変数と説明変数とを使って、閾値164を設定し、予測モデルの確度160を計算する。
モデル評価モジュール229は、予測値分布231を計算し、閾値決定233において閾値を変化させて、実際の故障リスク情報の正解値である目的変数と予測値分布231とを照合することにより正答・失報評価232を行い、当該評価に基づいて閾値を決定し、閾値の値によって予測モデルの精度を計算する。
正答率とは、母集団から摘出された閾値以上の対象群のうち、目的の対象(故障対象)が当該群にどのくらいの割合で含まれていたかの割合である。失報率とは、母集団から摘出されなかった閾値以下の対象群のうち、目的とする対象(故障)が当該群にどのくらいの割合で含まれていたかの割合である。正答率は高い方が、正常な対象を誤って故障と判定することが少なく、失報率は低い方が、故障の対象を正常とみなしてしまうことが少ない。
モデル評価モジュール229は、故障群モデル予測値、正常群モデル予測値を使って、予測値ヒストグラムを作成し、予測値分布を導出する(1502)。モデル評価モジュール229は、この故障群の予測値分布、正常群の予測値分布から、判定閾値を変化させた場合における正答率、失報率推移を導出できる(1503)。
モデル評価モジュール229は、例えば、正答率を制約して、失報率が最も低くなるところに閾値を決定する(1504)。モデル評価モジュール229は、閾値に基づいて、予測モデルの、学習用データに対する正答率、失報率を計算でき、これをモデル確度として決定する(1505)。
予測値の分布の例を図5に示す。横軸に予測値、縦軸に頻度分布(分布率)をとると、一般的には母集団のうち、正常群の予測値は左寄りの分布800となり、故障群の予測値は右寄りの分布801となる。例えば、故障か正常かの判定閾値を、予測値に対して807で示す境界に設定すると、判定閾値以上には故障群しか含まれていないので、正答率は100%である。しかし、閾値806~807までの領域は、正常、故障それぞれの群が混在している領域であり、摘出したい故障群の大半もここに含まれている。つまり、失報率(とり逃しの割合)が高い。一方で、故障か正常かの判定閾値を、予測値に対して806で示す境界に設定すると、閾値以下には故障群が含まれていないので、失報率(取り逃し)が0%となる。しかし、同様に閾値806~807までの領域は、正常、故障それぞれの群が混在している領域であるから、正常群の大半を故障と誤判別することになり、正答率が悪くなる。
図6に、図5における閾値の大小と、正答率900と失報率901の推移の特性図を示す。一般に、閾値を高く設定すると、摘出数が減るので、正答率、失報率が100%に近づく。閾値を低くするに従い、失報率が低くなって改善されていくが、同時に、正答率も低くなって悪化する。正常群を故障と誤検出することは過剰保守になるため、保守コストの増大を招く。従って、正答率は高い水準が要求されるため、正答率が、現場ニーズに応じた高い水準を維持できる条件(正当率制約:902)で、失報率が最も良い(低い)点903に最適閾値905が設定されればよい。
稼動ログ111の一例を図7に示す。稼動ログ111は、装置を構成するドライブをユニークに識別できるドライブID(301)と稼動ログが記録された日時302とともに、診断結果としての、稼動に伴う各種記録から構成される。稼動に伴う各種記録には、装置の不調などの検出記録である特定事象ごとの発生回数303、装置の動作を監視するセンサの値304、オペレータやユーザが当該装置を操作した履歴305、ドライブの設定パラメータ306を含む。センサとしては、温度センサ、電流センサ、電圧センサ等でよい。
障害・保守記録は、監視対象の装置に発生した障害の発生日時と、当該装置に対する保守、修理の記録とを備える。当該装置自身が自動的に記録するもののほか、保守作業員が作業記録として記録してもよい。図8に障害・保守記録の一例を示す。障害・保守記録は、装置をユニークに識別できる機器ID401、障害の発生日時402、保守実施の日時43、障害が発生して保守が行われた対象404、保守の内容405を有する。保守内容を、保守現場で作業員が手書きで記録する場合、表記のゆれや欠落が生じることもある。障害の内容と保守の内容を表す記号406は、障害と保守の内容を分類、集計を容易にする。
図9は、冗長性を備えるRAIDグループ101(図1)のドライブに生じた障害を回復するための動作を説明するためのブロック図である。RAIDグループは、冗長性を備えるドライブ1~ドライブ5の5台のドライブ510~514と、1台のスペアドライブ515によって構成されている。ドライブ3(512)が故障し、データを読み出せなくなった場合、ディスクアレイ制御装置100(図1)は、ドライブ3のData3(502)をホストコントローラ130(図1)に読み出し結果として出力することができない。
そこで、RAID制御モジュール113(図1)は、ドライブ3以外のData1(500)、Data2(501)、Data4(503)と、冗長データ(Parity)504を使って、誤り訂正復号を行い、Data3(507)を復元してホストコントローラ130へ応答する(縮退リード)。
同時に、RAID制御モジュール113は、ドライブ3以外の残りのドライブのデータを使って、ドライブ3に格納されていた全データをスペアドライブ515へ復元する(縮退復旧)。RAID制御モジュール113が、ドライブ3のデータを全てスペアド515に再構築するためには、ドライブ3以外全てのドライブのデータを読み出す必要があり、かつ、誤り訂正復号の演算を必要とするので、制御装置100の負荷を高めながら長い時間を要するという問題があった。さらに、縮退復旧中は、冗長度が低下しているため、更に他のドライブが故障すると、多重障害としてデータ喪失に至ってしまう。
制御装置100は、ドライブを交換しなければならなくなる以前に、ドライブの故障予測によって、リスクの高いドライブのデータをスペアドライブにコピーできるので、縮退復旧から解放される。制御装置100は、コピー開始後のドライブへのアクセス内容をスペアドライブに同期させておけば、そのドライブが故障した場合、当該ドライブをスペアドライブと差し替えればよく、障害復旧までの期間を短縮でき、そして、多重障害リスクを低減できる。
次に、故障リスク判定モジュール116の動作を説明する。図10は、故障リスク判定モジュール116の機能ブロック図である。モデル評価モジュール229(図2B)は、各モデルの予測値に基づいて、夫々に閾値を決定する(図5,6)。機械学習モジュール212(図2B)は、故障予測モデルを学習する際、例えば、故障が予測される対象について“1”を、正常な対象について“0”を目的変数に入力する。生成されたモデルに予測対象の稼働ログを入力すると、故障リスクが高い対象ほど予測値は“1”に近く、正常な対象ほど予測値は“0”に近い。
閾値判定モジュール607は、モデル評価モジュール229で決定された、モデル毎の閾値(164~167)で、モデル毎の故障予測値(150~153)を判定して、高リスクな対象を抽出する。閾値判定モジュール607は、この抽出結果に基づいて、高リスクとして、注意が優先して適用されるべき、記憶ドライブ、そして、周辺装置の並び(優先順位)608を決定して、これをリスト609として出力する。管理者は、このリストに基づいて、記憶ドライブ、そして、周辺装置の交換の要否を判定する。
図11は、故障リスク判定モジュール116の他の実施形態に係る機能ブロック図であって、閾値判定モジュール607が、複数モデル毎の予測値601~604に、当該モデルの確度160~163を加重させて、即ち、乗じることによってし、優先順位608を決定している。こうすることによって、故障リスク判定モジュール116(図1)は、単一のモデルの予測値としては閾値を超えなくても、複数のモデルの予測値を加味し、リスクが高い対象を判定することができる。
故障リスク判定モジュール116は、NAND予測値601、ASIC予測値602、RAM予測値603、I/F予測値604に基づいて、故障リスクを判定しているため、夫々の故障のリスク、任意の組み合わせの故障リスクを判定することができる。即ち、故障リスク判定モジュール116は、RAIDグループに於ける、複数の記憶ドライブ毎の故障リスクばかりでなく、複数の記憶ドライブを関連させた故障リスク、そして、記憶ドライブと周辺装置とを関連させた故障リスクを判定することができる。
次に、障害リスク判定モジュール116が、複数モデルの予測値を活用して故障判別を行う例を示す。図12は、予測モデル1の予測値と、予測モデル2の予測値との相関を示す。予測モデル1の予測値が、予測モデル1閾値(1005)を超えた場合、または予測モデル2の予測値が、予測モデル2閾値(1004)を超えた場合、つまり、単体NG領域(1001、1002)に予測値が存在すれば、予測モデル1の対象1と予測モデル2の対象2とが個別に故障と判断される。
予測モデル1と予測モデル2の予測値の組合せ1008は、単体NGとなる領域1002,1008にはないが、全ての予測モデルの予測値がゼロ点であるゼロリスク点1007からの正規化距離(ゼロリスク点から各予測モデルの閾値までの距離を“1”としたときの、空間的距離)は“1”を超えている。したがって、対象体1と対象体2との組み合わせに故障リスクがあり、管理者は、対象体1と対象体2との少なくとも一方を交換対象としてよい。対象体1と対象体2とは、同一装置でもよいし、異なる装置でもよい。
図13は、同じRAIDグループに属するドライブ1の予測値とドライブ2の予測値との相関を示す特性図である。縦軸に、ドライブ1の予測値を、横軸に、ドライブ2の予測値を示している。故障リスク判定モジュール116は、ドライブ1の予測値が閾値1105を超えると、ドライブ2の予測値が閾値1104を超えると、つまり、単体NG領域1101、1102に夫々の予測値が存在すれと、ドライブ1とドライブ2とを、個別に、故障と判断する。
ドライブ1とドライブ2の予測値の組合せ1108は、単体でNGとなる範囲に存在しないが、全てのドライブの予測値がゼロ点であるゼロリスク点1107からの正規化距離を超えた領域に存在するため、故障リスク判定モジュール116は、ドライブ1と2との予測値が比較的高い場合、その組合せの故障リスクは高いと判定して、ドライブ1,2の少なくとも一方、好ましは、予測値が高い方ドライブ、又は、両方を、交換対象として、スペアドライブにデータのコピーを開始すればよい。
故障リスク判定モジュール116による、故障リスクの判定の複数の態様について説明する。図14は、複数の態様を具体的に説明するテーブルである。“単一モデル”は図10に対応し、“加重判定”は図11に対応し、“複数モデル”は、図12,13に示す、正規化距離を利用した判定に対応する。
NANDフラッシュメモリ、ASIC、SDRAM、I/Fの4つのモデルの予測値は、A列1201に示す通り、夫々、0.65、0.20、0.60、0.80である。閾値はB列1202に示す通り、全モデルで0.7である。C列(1203)に、故障リスクの判定結果を示す。単体で閾値を超過するのは、I/Fの故障予測モデルの0.80である。
D列1204に、既述の予測モデル毎の確度160~163を示す。確度とは、故障予測モデルの性能を示すものであり、寿命部品であるNANDフラッシュメモリは、稼働ログ158に予兆が現れやすいため、確度を高くでき、突発故障の多い、記憶ドライブの周辺装置である、ASIC等の論理LSIの確度を高くできない。予測モデルの予測値に確度を加重、例えば、予測値に確度を乗じることにより、故障リスクをより高い精度に補正することができる。E列1205に加重後の値を示す。加重値で閾値を超過するものは無いため、全ての予測対象について、故障リスクはないことになる。
G列1207は、NANDフラッシュメモリ、ASIC、SDRAM、そして、I/F夫々の予測モデルの予測値(加重値)を組み合わせた点について、4次元空間に於けるゼロリスク点からの正規化距離の値を示す。この値は、加重値が高い、NANDフラッシュメモリ予測モデル、SDRAMの予測モデルがより重視されたものとなり、その結果、閾値を超過することがなる(H列:1208)。即ち、加重値によって、記憶ドライブ、そして、その周辺装置が夫々交換リスクがないと判定されたものが、実のところ、記憶ドライブは周辺装置の組み合わせにおいて、故障リスクがあると判断される。従って、フラッシュメモリドライブの故障リスクの判定がより正しく実現されることになる。
次に、フラッシュメモリドライブの故障、及び、フラッシュメモリドライブの故障リスクに伴って必要になる、フラッシュメモリドライブの交換の流れについて説明する。図15は、その一例に係る工程図である。
(A)は、故障リスクが判定されることなく、フラッシュメモリドライブが故障するフェーズを示し、(B)は、故障リスクが判定されたドライブが故障するフェーズを示し、(C)は、故障リスクが判定されたドライブより先に他のドライブが故障するフェーズを示し、(D)は、故障リスクが判定されたドライブとは別のドライブに故障リスクが判定されるフェーズを示す。
RAIDグループの全てのドライブに於いて、故障リスクが無い健全な状態で、制御装置100は工程をスタートさせる(1300)。制御装置100は、全てのドライブについて、故障リスクのチェックを実行し(1301)、故障リスクのあるドライブが無いことを判定すると、ステップ1302に移行する。
ステップ1302において、制御装置100は、故障したドライブがあるか否かを判定し、故障ドライブが無いと、ステップ1301に戻り、故障ドライブがあるとステップ1303に進む。故障ドライブは、予兆、即ち、故障リスクが判定されることなく、突発的に故障したものであるため、制御装置100は、故障ドライブの縮退復旧を行い、故障したドライブのデータをスペアドライブに復元した後、管理者が故障ドライブから交換したドライブに、スペアドライブから交換したデータを復旧(1304)し、ステップ1301に戻る。
制御装置100が、ステップ1301において、故障リスクのドライブを判定すると、ステップ1305に進み、故障リスクのドライブのデータをスペアドライブにコピーして、故障リスクのドライブをスペアドライブに同期させる。
制御装置100が、ステップ1306において、故障リスクのドライブが実際に故障したことを判定すると、ステップ1307に進み、交換されたドライブに、スペアドライブからデータをコピーして復旧させて、ステップ1301に戻る。コピーは、縮退運転とは異なり、高速で進むために、既述の多重障害を避けることができる。
制御装置100が、ステップ1306において、故障リスクのドライブが未だ故障していないことを判定すると、ステップ1308に進み、故障ドライブがあるか否かを判定する。制御装置100が、故障ドライブを判定すると、このドライブについて縮退運転を適用すると、ステップ1301において、故障リスクがあると判定されたドライブが多重障害に至るおそれがあるため、このドライブの交換を求め、交換されたドライブにスペアドライブからデータを復旧させる(1309)。この間、冗長性は低下しているが、所要時間は短くて済むため、実害は無いと云える。
制御装置100は、ステップ1310に進み、ステップ1308で判定された故障ドライブに対して縮退運転を行い(1310)、交換されたドライブにスペアドライブからデータを復旧させて(1311)、ステップ1301に戻る。
制御装置100は、ステップ1308において、故障ドライブが無いことを判定すると、ステップ1312に移行し、ステップ1301で故障リスクありと判定された第1ドライブ以外に、故障リスクがある第2のドライブの有無を判定する。
制御装置100は、第2ドライブがあることを判定すると、ステップ1313に移行し、第1ドライブが故障し得る度合い(予測値)と第2ドライブが故障し得る度合い(予測値)とを比較し、第2ドライブが第1ドライブより低リスクであることを判定すると、RAIDグループの冗長度は維持されているため、対応を採ることなく、ステップ1306に戻る。制御装置100は、ステップ1312において、第2ドライブの存在を判定しない場合にも、ステップ1306に戻る。
ステップ1313において、制御装置100が、第2ドライブが第1ドライブより高リスクであることを判定すると、ステップ1314において、第2ドライブのデータをスペアドライブにコピーして、第2ドライブをスペアドライブに同期させて、ステップ1306に戻る。制御装置100は、ステップ1306において、第2ドライブの故障の有無を判定する。
図15に示す工程図によれば、故障リスクがあるフラッシュメモリドライブのデータは、ドライブが実際に故障する前に、スペアドライブに退避させることができるために、縮退運転が必要なフラッシュメモリドライブは、故障リスクが判定されることなく故障するという稀なドライブに限られるために、多重障害のリスクを低減させることができる。
以上説明した実施形態は、本発明の一例であって、本発明は実施形態に限定されるものではない。例えば、記憶デバイスの周辺装置としては、ASIC、SDRAM、I/Fに限られない。

Claims (11)

  1. RAIDグループを備えるストレージと、
    前記ストレージに対するデータのリード、及び、ライトを制御する制御装置と、
    を備えるストレージシステムであって、
    前記RAIDグループは、記憶媒体としてのフラッシュメモリを有する記憶ドライブを複数有し、
    前記制御装置は、
    前記記憶ドライブの稼働ログを検出することと、
    前記記憶ドライブの周辺装置の稼働ログを検出することと、
    前記記憶ドライブを評価する第1のモデルを設定することと、
    前記周辺装置を評価する第2のモデルを設定することと、
    前記記憶ドライブの稼働ログを前記第1のモデルに適用することと、
    前記周辺装置の稼働ログを前記第2のモデルに適用することと、
    前記第1のモデルに基づいて、前記記憶ドライブの故障を予測するための第1の予測値を得ることと、
    前記第2のモデルに基づいて、前記周辺装置の故障を予測するための第2の予測値を得ることと、
    前記第1の予測値に基づいて、前記記憶ドライブの故障リスクを判定することと、
    前記第2の予測値に基づいて、前記周辺装置の故障リスクを判定することと、
    を備えるストレージシステム。
  2. 前記制御装置は、
    前記第1の予測値と前記第2の予測値とに基づいて、
    前記記憶ドライブの故障リスクを判定することと、
    をさらに備える請求項1記載のストレージシステム。
  3. 前記制御装置は、
    複数の記憶ドライブの夫々について前記第1の予測値を得ることと、
    前記複数の記憶ドライブ夫々の前記第1の予測値に基づいて、前記複数の記憶ドライブの少なくとも一つの故障リスクを判定することと、
    をさらに備える請求項1記載のストレージシステム。
  4. 前記制御装置は、
    前記記憶ドライブに生じた障害と当該障害に対する保守の履歴を記憶することと、
    前記周辺装置の障害に生じた障害と当該障害に対する保守の履歴を記憶することと、
    をさらに備える請求項1記載のストレージシステム。
  5. 前記制御装置は、
    前記記憶ドライブに対する前記履歴と前記記憶ドライブの前記稼働ログとに基づく機械学習によって、前記第1のモデルを作成することと、
    前記周辺装置に対する前記履歴と前記周辺装置の前記稼働ログとに基づく機械学習によって、前記第2のモデルを作成することと、
    をさらに備える請求項4記載のストレージシステム。
  6. 前記制御装置は、
    前記故障リスクが判定された記憶ドライブのデータをスペアドライブに多重化させること、
    をさらに備える請求項1記載のストレージシステム。
  7. 前記制御装置は、
    前記第1の予測値の第1の確度を得ることと、
    前記第2の予測値の第2の確度を得ることと、
    前記第1の予測値に前記第1の確度を加重させた結果に基づいて、前記記憶ドライブの故障リスクを判定することと、
    前記第2の予測値に前記第2の確度を加重させた結果に基づいて、前記周辺装置の故障リスクを判定することと、
    をさらに備える請求項1記載のストレージシステム。
  8. 前記制御装置は、
    前記第1の予測値が閾値を超える場合に、前記記憶ドライブに故障リスクがあると判定することと、
    前記第2の予測値が閾値を超える場合に、前記周辺装置に故障リスクがあると判定することと、
    をさらに備える請求項1記載のストレージシステム。
  9. 前記制御装置は、
    前記記憶ドライブが故障リスクがあると判定され、その後に故障に至る率が高く、そして、
    前記記憶ドライブに故障リスクがないと判定されながら、その後、故障に至る率が低く、
    なるように、前記第1の予測値に対する閾値を決定する、
    請求項8記載のストレージシステム。
  10. 前記記憶ドライブの稼働ログは、当該記憶ドライブの診断結果を含み、
    前記周辺装置の稼働ログは、当該周辺装置の診断結果を含む、
    請求項1記載のストレージシステム。
  11. RAIDグループを備えるストレージに対するデータのリード、及び、ライトを制御装置が制御し、前記RAIDグループは、記憶媒体としてのフラッシュメモリを有する記憶ドライブを複数有する、ストレージシステムの制御方法であって、
    前記制御装置は、
    前記記憶ドライブの稼働ログを検出し、
    前記記憶ドライブの周辺装置の稼働ログを検出し、
    前記記憶ドライブを評価する第1のモデルを設定し、
    前記周辺装置を評価する第2のモデルを設定し、
    前記記憶ドライブの稼働ログを前記第1のモデルに適用し、
    前記周辺装置の稼働ログを前記第2のモデルに適用し、
    前記第1のモデルに基づいて、前記記憶ドライブの故障を予測するための第1の予測値を取得し、
    前記第2のモデルに基づいて、前記周辺装置の故障を予測するための第2の予測値を取得し、
    前記第1の予測値に基づいて、前記記憶ドライブの故障リスクを判定し、そして、
    前記第2の予測値に基づいて、前記周辺装置の故障リスクを判定する、
    ストレージシステムの制御方法。
JP2019167495A 2019-09-13 2019-09-13 ストレージシステム及びその制御方法 Active JP7273669B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019167495A JP7273669B2 (ja) 2019-09-13 2019-09-13 ストレージシステム及びその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019167495A JP7273669B2 (ja) 2019-09-13 2019-09-13 ストレージシステム及びその制御方法

Publications (2)

Publication Number Publication Date
JP2021043891A JP2021043891A (ja) 2021-03-18
JP7273669B2 true JP7273669B2 (ja) 2023-05-15

Family

ID=74862418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019167495A Active JP7273669B2 (ja) 2019-09-13 2019-09-13 ストレージシステム及びその制御方法

Country Status (1)

Country Link
JP (1) JP7273669B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023148922A1 (ja) * 2022-02-04 2023-08-10 日本電気株式会社 異常検出システム、情報処理システム、異常検出方法および記録媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100318837A1 (en) 2009-06-15 2010-12-16 Microsoft Corporation Failure-Model-Driven Repair and Backup
WO2019054434A1 (ja) 2017-09-14 2019-03-21 Necプラットフォームズ株式会社 故障予兆検出装置、故障予兆検出方法、及び、故障予兆検出プログラムが格納された記録媒体
JP2019046407A (ja) 2017-09-07 2019-03-22 株式会社日立製作所 性能管理システム、管理装置および性能管理方法
JP2019087217A (ja) 2017-11-07 2019-06-06 先智雲端數據股▲分▼有限公司ProphetStor Data Services, Inc. データセンターの記憶装置の余命を診断する方法及びそのシステム
WO2019142331A1 (ja) 2018-01-19 2019-07-25 株式会社日立製作所 障害予測システムおよび障害予測方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100318837A1 (en) 2009-06-15 2010-12-16 Microsoft Corporation Failure-Model-Driven Repair and Backup
JP2019046407A (ja) 2017-09-07 2019-03-22 株式会社日立製作所 性能管理システム、管理装置および性能管理方法
WO2019054434A1 (ja) 2017-09-14 2019-03-21 Necプラットフォームズ株式会社 故障予兆検出装置、故障予兆検出方法、及び、故障予兆検出プログラムが格納された記録媒体
JP2019087217A (ja) 2017-11-07 2019-06-06 先智雲端數據股▲分▼有限公司ProphetStor Data Services, Inc. データセンターの記憶装置の余命を診断する方法及びそのシステム
WO2019142331A1 (ja) 2018-01-19 2019-07-25 株式会社日立製作所 障害予測システムおよび障害予測方法

Also Published As

Publication number Publication date
JP2021043891A (ja) 2021-03-18

Similar Documents

Publication Publication Date Title
Mahdisoltani et al. Proactive error prediction to improve storage system reliability
US7526684B2 (en) Deterministic preventive recovery from a predicted failure in a distributed storage system
US7774651B2 (en) System and method to detect errors and predict potential failures
US10013321B1 (en) Early raid rebuild to improve reliability
JP5887757B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
US10606722B2 (en) Method and system for diagnosing remaining lifetime of storages in data center
US20060090098A1 (en) Proactive data reliability in a power-managed storage system
JP2005322399A (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
CN111104293A (zh) 用于支持盘故障预测的方法、设备和计算机程序产品
JP6219865B2 (ja) 制御装置の故障予測システム
US20230281489A1 (en) Systems and methods for predicting storage device failure using machine learning
US11734103B2 (en) Behavior-driven die management on solid-state drives
US11449376B2 (en) Method of determining potential anomaly of memory device
Du et al. Predicting uncorrectable memory errors for proactive replacement: An empirical study on large-scale field data
JP7273669B2 (ja) ストレージシステム及びその制御方法
CN114758714A (zh) 一种硬盘故障预测方法、装置、电子设备及存储介质
US7457990B2 (en) Information processing apparatus and information processing recovery method
JP2004227449A (ja) ディスクアレイ装置における障害の診断装置
Pinciroli et al. The life and death of SSDs and HDDs: Similarities, differences, and prediction models
US20030174562A1 (en) Disk control apparatus and its control method
CN116541222A (zh) 一种硬盘状态数据生成方法、系统、设备及介质
CN115794451A (zh) 基于存储设备健康状态的执行策略预测方法、装置及系统
CN117873408B (zh) 一种云打印机数据恢复方法以及相关装置
CN117407207B (zh) 一种内存故障处理方法、装置、电子设备及存储介质
CN111610778B (zh) 一种提高工控系统稳定性的自适应监测系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230428

R150 Certificate of patent or registration of utility model

Ref document number: 7273669

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150