JP2023134170A - Storage medium management device, method for managing storage medium, and storage medium management program - Google Patents
Storage medium management device, method for managing storage medium, and storage medium management program Download PDFInfo
- Publication number
- JP2023134170A JP2023134170A JP2022039539A JP2022039539A JP2023134170A JP 2023134170 A JP2023134170 A JP 2023134170A JP 2022039539 A JP2022039539 A JP 2022039539A JP 2022039539 A JP2022039539 A JP 2022039539A JP 2023134170 A JP2023134170 A JP 2023134170A
- Authority
- JP
- Japan
- Prior art keywords
- storage medium
- disk
- failure risk
- storage media
- standby
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 16
- 238000007726 management method Methods 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 14
- 101100284507 Schizosaccharomyces pombe (strain 972 / ATCC 24843) hdd1 gene Proteins 0.000 abstract description 17
- 238000004458 analytical method Methods 0.000 abstract description 10
- 230000003068 static effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、記憶媒体管理装置、記憶媒体管理方法および記憶媒体管理プログラムに関する。 The present invention relates to a storage medium management device, a storage medium management method, and a storage medium management program.
近年、RAID(Redundant Arrays of Inexpensive Disks、または Redundant Arrays of Independent Disks)システムにおいて、物理ディスクの容量増加に伴い、物理ディスクが故障した際、RAIDのリビルド(再構築)処理に多大な時間を要している。そこで、リビルド処理時間を短縮するために、例えば、エラー統計値が所定の閾値を越えた場合に被疑ディスク装置と判定した復元モード設定中の装置からのアクセス空き時間に、被疑ディスク装置のアドレス範囲を指定しながらデータを予備ディスクへ順次コピーして復元する技術が提案されている(例えば、特許文献1)。なおリビルド処理は、複数のHDD等の物理ディスクを使ってRAIDシステムを構築して運用しており、そのRAIDシステムにおいてあるディスクが故障してしまった場合に故障していない他のHDDから故障したディスク内のデータを復元・再構築し直すことなどの処理をいう。 In recent years, with the increase in the capacity of physical disks in RAID (Redundant Arrays of Inexpensive Disks, or Redundant Arrays of Independent Disks) systems, when a physical disk fails, the RAID rebuild process requires a large amount of time. ing. Therefore, in order to shorten the rebuild processing time, for example, when the error statistics value exceeds a predetermined threshold, the address range of the suspect disk device is set to A technique has been proposed in which data is sequentially copied to a spare disk and restored while specifying the data (for example, Patent Document 1). The rebuild process is performed by constructing and operating a RAID system using physical disks such as multiple HDDs, and if one disk fails in that RAID system, the failure will be detected from other HDDs that are not failed. Processing such as restoring and reconstructing data on a disk.
しかしながら、特許文献1による方法では、ディスク装置(記憶媒体)の各種の故障、例えばモータストップ、媒体欠陥エラー、モードエラーなどのエラー種別について、予め加算値を設定しておき、エラー発生ごとに対応する加算値をエラー統計加算値とし、該エラー統計加算値が所定の閾値を越えたディスク装置を被疑ディスク装置として特定している。しかしながら、エラー統計加算値が所定の閾値を超えたからといって、その被疑ディスク装置が将来故障するとは限らなかった。ゆえに、将来故障するリスクが高いディスク装置を正確に特定できず、他のディスク装置が故障してしまう可能性があり、結果として、リビルド処理に多大な時間を要してしまうという問題がった。
However, in the method disclosed in
そこで本発明は、故障リスクが高い記憶媒体をより正確に予測し、リビルド時間を短縮する記憶媒体管理装置、記憶媒体管理方法および記憶媒体管理プログラムを提供することを目的としている。 SUMMARY OF THE INVENTION Therefore, an object of the present invention is to provide a storage medium management device, a storage medium management method, and a storage medium management program that more accurately predict storage media with a high risk of failure and shorten rebuild time.
上述した課題を解決するために、本発明の一態様は、RAIDアレイを構成する複数の記憶媒体の動作状態を収集する収集手段と、前記収集手段により収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断する動作状態判断手段と、前記動作状態判断手段による判断結果に基づいて、故障リスクが最も高い記憶媒体を予測する予測手段と、前記予測手段によって予測された、前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするコピー制御手段と、を備えることを特徴とする。 In order to solve the above-mentioned problems, one aspect of the present invention includes a collection unit that collects the operating states of a plurality of storage media that constitute a RAID array, and a collection unit that collects the operating states of the plurality of storage media that are collected by the collection unit. an operating state determining means for determining whether there is a relative difference between the operating state determining means; a predicting means for predicting a storage medium with the highest failure risk based on a determination result by the operating state determining means; The present invention is characterized by comprising a copy control means for copying data of the storage medium having the highest failure risk to a standby storage medium.
また、本発明の一態様は、RAIDアレイを構成する複数の記憶媒体を管理する記憶媒体管理方法であって、前記複数の記憶媒体の動作状態を収集するステップと、前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、を含むことを特徴とする。 Further, one aspect of the present invention is a storage medium management method for managing a plurality of storage media constituting a RAID array, the method comprising: collecting operational states of the plurality of storage media; determining whether there is a relative difference in the operating states of storage media; predicting a storage medium with the highest failure risk based on the result of the determination; and determining whether the predicted failure risk is copying data on the highest storage medium to a standby storage medium.
また、本発明の一態様は、RAIDアレイを構成する複数の記憶媒体を管理する記憶媒体管理装置のコンピュータに、前記複数の記憶媒体の動作状態を収集するステップと、前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、を実行させることを特徴とする。 Further, one aspect of the present invention includes the step of collecting the operating states of the plurality of storage media in a computer of a storage medium management device that manages the plurality of storage media constituting the RAID array; determining whether there is a relative difference in the operating states of storage media; predicting a storage medium with the highest failure risk based on the result of the determination; and determining whether the predicted failure risk is The present invention is characterized by causing a step of copying data of the highest storage medium to a standby storage medium to be executed.
以上説明したように、故障リスクが高い記憶媒体をより正確に予測し、リビルド時間を短縮することができるという利点が得られる。 As described above, it is possible to more accurately predict storage media with a high risk of failure and to reduce the rebuild time.
以下、本発明の実施の形態を、図面を参照して説明する。 Embodiments of the present invention will be described below with reference to the drawings.
A.実施形態
図1は、本実施形態によるRAIDコントローラ(記憶媒体管理装置)を適用したサーバシステムの構成を示すブロック図である。サーバシステム1は、OS(Operating System)10、RAIDコントローラ20、およびディスクアレイ30から構成される。OS10は、RAIDドライバ11およびRAID管理ユーティリティ12からなる。RAIDドライバ11は、ディスクアレイ30との間でデータを送受信(読み出し/書き込み)するためのソフトウェアである。RAID管理ユーティリティ12は、OSレベルで、ディスクアレイ30との間でデータを読み出し/書き込みを管理するために用いられるソフトウェアである。
A. Embodiment FIG. 1 is a block diagram showing the configuration of a server system to which a RAID controller (storage medium management device) according to the present embodiment is applied. The
RAIDコントローラ20は、RAIDファームウェア21を含み、RAIDファームウェア21は、HDD情報収集部211、統計情報解析部212、故障HDD予測部213、およびHDDコピー制御部214を備えている。ディスクアレイ30は、RAID5を構成する物理ディスクHDD1、HDD2、HDD3、およびスタンバイディスクSHDDを有する。RAID5は、複数の外部記憶装置(ハードディスクなど)をまとめて一台の装置として管理する技術である。本実施形態において、物理ディスクHDD1、HDD2、HDD3、およびスタンバイディスクSHDDは、ハードディスクを想定しているが、これに限らず、SSD(Solid State Drive)などの半導体記憶媒体であってもよい。
The
HDD情報収集部211は、定期的に、ディスクアレイ30の各物理ディスクHDD1~HDD3の統計情報を収集する。統計情報は、稼働時間、応答速度、エラーレート、代替えセクタ登録数などの少なくとも1つの動作状態を示す情報である。統計情報解析部212は、収集した物理ディスクHDD1~HDD3の稼働時間、応答速度、エラーレート、代替えセクタ登録数などの少なくとも1つの動作状態を含む統計情報を解析する。解析方法については後述する。
The HDD
故障HDD予測部213は、統計情報解析部212により解析された、物理ディスクHDD1~HDD3の統計情報の解析結果に基づいて、RAIDコントローラ20に接続された複数の物理ディスクHDD1~HDD3の中から今後故障するリスクの最も高いHDDm(m=1、2、or3)を特定する。HDDコピー制御部214は、特定された今後故障するリスクの最も高いHDDmのデータをスタンバイディスクSHDDにコピーする。
The failure
B.実施形態の動作
図2は、本実施形態によるRAIDコントローラ20が定期的に実行する動作を説明するためのフローチャートである。図4~図6は、本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
B. Operations of the Embodiment FIG. 2 is a flowchart for explaining operations periodically executed by the
図2に示すフローチャートは、定期的(例えば、1週間毎)に実行される。HDD情報収集部211は、ディスクアレイ30の各物理ディスクHDD1~HDD3の稼働時間、応答速度、エラーレート、代替えセクタ登録数などの統計情報を収集する(ステップS10)。統計情報解析部212は、収集した物理ディスクHDD1~HDD3の稼働時間、応答速度、エラーレート、代替えセクタ登録数を示す統計情報を解析し、物理ディスクHDD1~HDD3の動作状態に今後故障するリスクがあることを十分に予測し得るだけの差異があるか否かを判断する(ステップS12)。例えば、論理ドライブを構成するメンバーの物理ディスクHDD1~HDD3の統計情報を解析し、僅かでも稼働時間が長い、応答速度が遅い、エラーレートが大きい、代替えセクタ登録数が多いなど、他の物理ディスクに対して少なくとも1つの動作状態に相対的な差異(劣化を示す差異)があるか否かを判断する。
The flowchart shown in FIG. 2 is executed periodically (for example, every week). The HDD
そして、収集した物理ディスクHDD1~HDD3のそれぞれの統計情報に含まれる少なくとも1つの動作状態に差異がない場合には(ステップS14のNO)、HDDコピー制御部214は、任意の物理ハードディスクHDDn(n=1、2、or3)を選定し(例えば、HDD2)、物理ハードディスクHDDnのデータをスタンバイディスクSHDDにコピーする(ステップS16)。例えば、図4に示すように、物理ディスクHDD2を選定し、物理ディスクHDD2のデータをスタンバイディスクSHDDにコピーする。その後、当該処理を終了する。
Then, if there is no difference in at least one operating state included in the collected statistical information of each of the physical disks HDD1 to HDD3 (NO in step S14), the HDD
一方、収集した物理ディスクHDD1~HDD3のそれぞれの統計情報に含まれる少なくとも1つの動作状態に、今後故障するリスクがあることを十分に予測し得るだけの差異がある場合には(ステップS14のYES)、故障HDD予測部213は、統計情報解析部212により解析された解析結果、すなわち、物理ディスクHDD1~HDD3の少なくとも1つの動作状態(稼働時間、応答速度、エラーレート、代替えセクタ登録数など)の相対的な差異に基づいて、RAIDコントローラ20に接続された複数の物理ディスクHDD1~HDD3の中から今後故障するリスクの最も高い物理ディスクHDDm(m=1、2、or3)を特定する(ステップS18)。
On the other hand, if there is a difference in at least one operating state included in the collected statistical information of each of the physical disks HDD1 to HDD3 that is sufficient to predict that there is a risk of failure in the future (YES in step S14), ), the failure
例えば、故障HDD予測部213は、論理ドライブを構成するメンバーの物理ディスクHDD1~HDD3のうち、僅かでも稼働時間が長い、応答速度が遅い、エラーレートが大きい、代替えセクタ登録数が多いなど、他の物理ディスクに対して少なくとも1つの動作状態に相対的な差異がある物理ハードディスクを、故障するリスクの最も高い物理ディスクHDDmとして特定する。例えば、図5に示すように、物理ディスクHDD2が他の物理ディスクに対して僅かでも稼働時間が長い、応答速度が遅い、代替えセクタ登録数が多いという差異がある場合には、物理ディスクHDD2が、今後故障するリスクの最も高いと予測される物理ディスクHDDmとして特定される。
For example, the failure
なお、「僅か」については「差異」に対して予め閾値を設定し、当該閾値を超えた場合に、その物理ディスクを、今後故障するリスクが最も高い物理ディスクHDDmと予測してもよい。また、稼働時間、応答速度、代替えセクタ登録数のうち、どの動作状態を用いて判断するかについては、それぞれの動作状態に重み付けしてもよいし、優先順位を設定するようにしてもよい。また、稼働時間、応答速度、代替えセクタ登録数のうち、少なくとも1つを判断条件としてもよいし、2つ以上を組み合わせて判断条件としてもよい。 Note that for "slight", a threshold value may be set in advance for the "difference", and when the threshold value is exceeded, the physical disk may be predicted to be the physical disk HDDm with the highest risk of failure in the future. Further, as to which operating state to use in the determination of operating time, response speed, and number of alternative sector registrations, each operating state may be weighted or a priority may be set. Furthermore, at least one of the operating time, response speed, and number of alternative sector registrations may be used as a judgment condition, or two or more may be used as a judgment condition in combination.
次に、故障HDD予測部213は、前回特定した故障リスクの高い物理ディスクHDDp(p=1、2、or3)よりも、今回特定した故障リスクの高い物理ディスクHDDmの方が、故障リスクが高いか否かを判断する(ステップS20)。故障リスクが高いか低いかは、それぞれの稼働時間、応答速度、代替えセクタ登録数などの大小に基づいて判断すればよい。そして、今回特定した故障リスクの高い物理ディスクHDDmの故障リスクの方が、前回特定した故障リスクの高い物理ディスクHDDpよりも低い場合には(ステップS20のNO)、何もせずに当該処理を終了する。
Next, the failure
一方、今回特定した故障リスクの高い物理ディスクHDDmの方が、故障リスクが前回特定した故障リスクの高い物理ディスクHDDpよりも高い場合には(ステップS20のYES)、HDDコピー制御部214は、今回特定された故障するリスクの最も高い物理ディスクHDDmのデータをスタンバイディスクSHDDにコピーする(ステップS22)。
On the other hand, if the currently identified physical disk HDDm with a high failure risk has a higher failure risk than the previously identified physical disk HDDp with a high failure risk (YES in step S20), the HDD
例えば、今回物理ディスクHDD3が故障リスクの高い物理ディスクHDDmとして特定された場合、稼働時間が長い、応答速度が遅い、代替えセクタ登録数が多いなど、当該物理ディスクHDD3の故障リスクの方が前回特定した故障リスクの高い物理ディスクHDD2よりも高ければ、図6に示すように、物理ディスクHDD2から物理ディスクHDD3に切り替え、今回特定された故障するリスクの最も高い物理ディスクHDD3のデータをスタンバイディスクSHDDにコピーする。その後、当該処理を終了する。 For example, if physical disk HDD3 is identified as a physical disk HDDm with a high failure risk this time, the failure risk of the physical disk HDD3 is higher than that previously identified due to long operating time, slow response speed, large number of registered alternative sectors, etc. If the failure risk is higher than that of the physical disk HDD2, as shown in Figure 6, the physical disk HDD2 is switched to the physical disk HDD3, and the data of the physical disk HDD3, which has the highest failure risk identified this time, is transferred to the standby disk SHDD. make a copy. After that, the process ends.
図3は、本実施形態によるRAIDコントローラ20の通常時の動作を説明するためのフローチャートである。また、図7~図10は、本実施形態によるRAIDコントローラ20によるディスク制御動作を示す模式図である。
FIG. 3 is a flowchart for explaining the normal operation of the
図3に示すフローチャートは、上位のOS10や、アプリケーションなどから書き込み要求が入った場合に実行される。RAIDコントローラ20では、上位のOS10や、アプリケーションなどから書き込み要求が入った場合、HDDコピー制御部214が、故障するリスクが高いと特定された物理ディスクHDDmにデータを書き込むとともに、スタンバイディスクSHDDにも同じデータを書き込む(ステップS30)。例えば、故障するリスクの最も高い物理ディスクが物理ディスクHDD2である場合、図7に示すように、物理ディスクHDD2にデータを書き込むとともに、スタンバイディスクSHDDにも同じデータを書き込む。
The flowchart shown in FIG. 3 is executed when a write request is received from the
次に、RAIDコントローラ20は、故障するリスクが高いと特定された物理ディスクHDDmが実際に故障したか否かを判断する(ステップS32)。そして、故障するリスクが高いと特定された物理ディスクHDDmがまだ故障していない場合には(ステップS32のNO)、何もせずに当該処理を終了する。
Next, the
一方、故障するリスクが高いと特定された物理ディスクHDDmが実際に故障した場合には(ステップS32のYES)、RAIDコントローラ20は、故障した物理ディスクHDDmを切り離し、当該故障した物理ディスクHDDmと同じデータを書き込んでいたスタンバイディスクSHDDを新たにハードディスク装置(RAID)に組み込む(ステップS34)。例えば、図8に示すように、故障するリスクが高いと特定された物理ディスクHDD2が実際に故障した場合、故障した物理ディスクHDD2を切り離し、当該故障した物理ディスクHDD2と同じデータを書き込んでいたスタンバイディスクSHDDを物理ディスクHDD2としてRAIDに組み込む。ゆえに、リビルド作業が不要になるため、システムダウンやデータロストの発生を防止できる。その後、当該処理を終了する。
On the other hand, if the physical disk HDDm identified as having a high risk of failure actually fails (YES in step S32), the
なお、故障HDD予測部213によって故障リスクが高いと予測した物理ディスクHDD2ではなく、他の物理ディスク、例えば、物理ディスクHDD1が故障した場合には、図9に示すように、残りの物理ディスクHDD2および物理ディスクHDD3からスタンバイディスクSHDDにデータを書き込む動作、所謂リビルド処理が行われる。この場合には、リビルド処理が必要となる。
Note that if the
しかしながら、上述したように、本実施形態では、僅かでも稼働時間が長い、応答速度が遅い、エラーレートが大きい、代替えセクタ登録数が多いなど、他の物理ディスクに対して少なくとも1つの動作状態に相対的な差異がある物理ハードディスクを、故障するリスクの最も高い物理ディスクHDDmとして特定している。したがって、本実施形態によれば、単に一意に設定した閾値を超えたことを判断基準とする方法に比べ、今後故障するリスクの最も高い物理ディスクHDDmをより正確に予測することができるので、リビルド処理が必要となる状況は発生しにくい。 However, as described above, in this embodiment, if there is at least one operating state with respect to other physical disks, such as a long operating time, slow response speed, large error rate, or large number of registered alternative sectors, etc. A physical hard disk with a relative difference is identified as the physical disk HDDm with the highest risk of failure. Therefore, according to the present embodiment, compared to a method in which the determination criterion is simply that a uniquely set threshold value has been exceeded, it is possible to more accurately predict the physical disk HDDm that has the highest risk of failure in the future. Situations that require processing are unlikely to occur.
故障した物理ディスクHDD2を新たな物理ディスクHDD2new交換すると、図10に示すように、物理ディスクHDD2newは、自動的にスタンバイディスクSHDDに設定される。スタンバイディスクSHDDの設定が完了した後、RAIDコントローラ20は、図2に示すフローチャートを実行し、物理ディスクHDD1~HDD3の中から今後故障リスクが最も高い物理ディスクHDDmを特定し、スタンバイディスクSHDD(HDD2new)にデータがコピーされる。
When the failed physical disk HDD2 is replaced with a new physical disk HDD2new, the physical disk HDD2new is automatically set as the standby disk SHDD, as shown in FIG. After completing the setting of the standby disk SHDD, the
上述した実施形態によれば、僅かでも稼働時間が長い、応答速度が遅い、代替えセクタ登録数が多いなど、他の物理ディスクに対して少なくとも1つの動作状態に相対的な差異がある物理ハードディスクを、故障するリスクの最も高い物理ディスクHDDmとして特定するので、今後故障するリスクの最も高い物理ディスクをより正確に予測することができる。そして、故障するリスクの最も高い物理ディスクHDDmのデータを、故障する前に予めスタンバイディスクSHDDにデータをコピーしておくことで、実際に故障した場合であっても、故障した物理ディスクに切り替えてスタンバイディスクSHDDをRAIDに組み込むようにしたので、リビルド時間を短縮することができる。 According to the embodiment described above, a physical hard disk that has at least one relative difference in operating state from other physical disks, such as a long operating time, a slow response speed, or a large number of registered alternative sectors, is selected. Since the physical disk HDDm with the highest risk of failure is identified as the physical disk HDDm with the highest risk of failure, it is possible to more accurately predict the physical disk with the highest risk of failure in the future. By copying the data on the physical disk HDDm, which has the highest risk of failure, to the standby disk SHDD before the failure occurs, even if the physical disk actually fails, it can be switched to the failed physical disk. Since the standby disk SHDD is incorporated into the RAID, the rebuild time can be shortened.
図11は、本実施形態による記憶媒体管理装置の最小構成を示すブロック図である。
本実施形態による記憶媒体管理装置50は、少なくとも、RAIDアレイ51を構成する複数の記憶媒体52~54、スタンバイ記憶媒体55、収集手段56、動作状態判断手段57、予測手段58、コピー制御手段59を備えればよい。複数の記憶媒体52~54は、RAIDアレイ(RAID5)を構成する。収集手段56は、複数の記憶媒体52~54の動作状態を収集する。動作状態判断手段57は、収集された複数の記憶媒体52~54の動作状態に相対的な差異があるか否かを判断する。予測手段58は、動作状態判断手段57による判断結果に基づいて、故障リスクが最も高い記憶媒体を予測する。コピー制御手段59は、予測手段58によって予測された、故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体55にコピーする。
FIG. 11 is a block diagram showing the minimum configuration of the storage medium management device according to this embodiment.
The storage
なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより特典情報の制御処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。 Note that the program for realizing the functions of the processing unit in the present invention is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed, thereby controlling the benefit information. Processing may be performed. Note that the "computer system" herein includes hardware such as an OS and peripheral devices. Further, a "computer system" may include a plurality of computer devices connected via a network including the Internet, a WAN, a LAN, a communication line such as a dedicated line, etc. Furthermore, the term "computer-readable recording medium" refers to portable media such as flexible disks, magneto-optical disks, ROMs, and CD-ROMs, and storage devices such as hard disks built into computer systems. Furthermore, a ``computer-readable recording medium'' refers to a storage medium that retains a program for a certain period of time, such as volatile memory (RAM) inside a computer system that serves as a server or client when a program is transmitted via a network. This shall also include things. Moreover, the above-mentioned program may be for realizing a part of the above-mentioned functions. Furthermore, it may be a so-called difference file (difference program) that can realize the above-mentioned functions in combination with a program already recorded in the computer system.
また、上述した機能の一部または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。上述した各機能は個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。 Furthermore, some or all of the functions described above may be realized as an integrated circuit such as an LSI (Large Scale Integration). Each of the above-mentioned functions may be implemented as an individual processor, or some or all of them may be integrated into a processor. Further, the method of circuit integration is not limited to LSI, but may be implemented using a dedicated circuit or a general-purpose processor. Further, if an integrated circuit technology that replaces LSI emerges due to advances in semiconductor technology, an integrated circuit based on this technology may be used.
1 サーバシステム
10 OS
11 RAIDドライバ
12 RAID管理ユーティリティ
20 RAIDコントローラ
21 RAIDファームウェア
211 HDD情報収集部
212 統計情報解析部
213 故障HDD予測部
214 HDDコピー制御部
30 ディスクアレイ
HDD1~HDD3 物理ディスク
SHDD スタンバイディスク
1
11
Claims (7)
前記収集手段により収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断する動作状態判断手段と、
前記動作状態判断手段による判断結果に基づいて、故障リスクが最も高い記憶媒体を予測する予測手段と、
前記予測手段によって予測された、前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするコピー制御手段と、
を備えることを特徴とする記憶媒体管理装置。 a collection means for collecting operational states of a plurality of storage media constituting the RAID array;
operating state determining means for determining whether there is a relative difference in the operating states of the plurality of storage media collected by the collecting means;
prediction means for predicting a storage medium with the highest failure risk based on the determination result by the operating state determination means;
Copy control means for copying data of the storage medium with the highest failure risk predicted by the prediction means to a standby storage medium;
A storage medium management device comprising:
前記複数の記憶媒体の動作状態を収集するステップと、
前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、
前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、
前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、
を含むことを特徴とする記憶媒体管理方法。 A storage medium management method for managing a plurality of storage media constituting a RAID array, the method comprising:
collecting operational states of the plurality of storage media;
determining whether there is a relative difference in the operating states of the plurality of collected storage media;
predicting a storage medium with the highest failure risk based on the result of the determination;
Copying data of the storage medium with the predicted highest failure risk to a standby storage medium;
A storage medium management method characterized by comprising:
前記複数の記憶媒体の動作状態を収集するステップと、
前記収集された前記複数の記憶媒体の動作状態に相対的な差異があるか否かを判断するステップと、
前記判断の結果に基づいて、故障リスクが最も高い記憶媒体を予測するステップと、
前記予測された前記故障リスクが最も高い記憶媒体のデータを、スタンバイ記憶媒体にコピーするステップと、
を実行させることを特徴とする記憶媒体管理プログラム。 A computer of a storage medium management device that manages a plurality of storage media constituting a RAID array,
collecting operational states of the plurality of storage media;
determining whether there is a relative difference in the operating states of the plurality of collected storage media;
predicting a storage medium with the highest failure risk based on the result of the determination;
Copying data of the storage medium with the predicted highest failure risk to a standby storage medium;
A storage medium management program that executes.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022039539A JP2023134170A (en) | 2022-03-14 | 2022-03-14 | Storage medium management device, method for managing storage medium, and storage medium management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022039539A JP2023134170A (en) | 2022-03-14 | 2022-03-14 | Storage medium management device, method for managing storage medium, and storage medium management program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023134170A true JP2023134170A (en) | 2023-09-27 |
Family
ID=88143732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022039539A Pending JP2023134170A (en) | 2022-03-14 | 2022-03-14 | Storage medium management device, method for managing storage medium, and storage medium management program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023134170A (en) |
-
2022
- 2022-03-14 JP JP2022039539A patent/JP2023134170A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7502955B2 (en) | Disk array system and control method thereof | |
US7434097B2 (en) | Method and apparatus for efficient fault-tolerant disk drive replacement in raid storage systems | |
US7574623B1 (en) | Method and system for rapidly recovering data from a “sick” disk in a RAID disk group | |
JP4606455B2 (en) | Storage management device, storage management program, and storage system | |
US8370571B2 (en) | Transfer control of a storage volume between storage controllers in a cluster | |
US7975168B2 (en) | Storage system executing parallel correction write | |
US8127182B2 (en) | Storage utilization to improve reliability using impending failure triggers | |
JP2005322399A (en) | Maintenance method of track data integrity in magnetic disk storage device | |
US8566637B1 (en) | Analyzing drive errors in data storage systems | |
JP2005122338A (en) | Disk array device having spare disk drive, and data sparing method | |
CN104583930A (en) | Method of data migration, controller and data migration apparatus | |
JP2017091456A (en) | Control device, control program, and control method | |
US10346051B2 (en) | Storage media performance management | |
US10606490B2 (en) | Storage control device and storage control method for detecting storage device in potential fault state | |
US8782465B1 (en) | Managing drive problems in data storage systems by tracking overall retry time | |
RU2697961C1 (en) | System and method of assessing deterioration of data storage device and ensuring preservation of critical data | |
JP4775843B2 (en) | Storage system and storage control method | |
US20090177916A1 (en) | Storage system, controller of storage system, control method of storage system | |
US10915405B2 (en) | Methods for handling storage element failures to reduce storage device failure rates and devices thereof | |
JP2006079219A (en) | Disk array controller and disk array control method | |
US20120011317A1 (en) | Disk array apparatus and disk array control method | |
WO2019054434A1 (en) | Failure sign detection device, failure sign detection method, and recording medium in which failure sign detection program is stored | |
JP2023134170A (en) | Storage medium management device, method for managing storage medium, and storage medium management program | |
US11443826B2 (en) | Storage area retirement in a storage device | |
JP7288191B2 (en) | Storage controller and storage control program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230712 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240105 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240117 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20240216 |