JP2000293318A - ディスクアレイ装置およびメディアエラー救済方法 - Google Patents
ディスクアレイ装置およびメディアエラー救済方法Info
- Publication number
- JP2000293318A JP2000293318A JP11097328A JP9732899A JP2000293318A JP 2000293318 A JP2000293318 A JP 2000293318A JP 11097328 A JP11097328 A JP 11097328A JP 9732899 A JP9732899 A JP 9732899A JP 2000293318 A JP2000293318 A JP 2000293318A
- Authority
- JP
- Japan
- Prior art keywords
- error
- data
- time
- block
- media
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
るハードディスク装置の時間監視は、必ずしもハードデ
ィスク装置がリトライ処理を行う際に必要とする最大限
の時間が設定されているわけではない。システムで要求
される障害検出の応答性により監視時間が決定されるた
めハードディスク装置のリトライ処理進行中であるが処
理時間がコントローラの時間監視の設定値を超えてしま
い、リトライ処理で救済できるようなメディアエラーの
場合にもタイムアウトエラーとして検出される場合があ
る。 【解決手段】ハードディスク装置の時間監視の設定値を
段階的に増加させることでリトライ処理で救済できるメ
ディアエラーをタイムアウトエラーとして検出すること
を低減するディスクアレイ装置を提供する。
Description
アウトエラーとして検出されるメディアエラーを救済す
るディスクアレイ装置に関する。
する要求の強い大規模な装置に適用する記憶装置とし
て、冗長性を有するRAID(Redundant Arrays ofIndep
endent Disks)で構成されるディスクアレイ装置が開
発されている。ディスクアレイ装置では、ディスクアレ
イを構成する複数のハードディスク装置のうち何らかの
障害等により、仮にその中の一台が停止してしまっても
ディスクアレイを構成する残りのハードディスク装置の
データとパリティを使用して容易に元の状態に回復させ
ることができる。図1に一般的なディスクアレイ装置の
構成を示す。1はサーバ、2はディスクアレイ装置、3
はハードディスク装置を制御するディスクアレイコント
ローラ、4はデータが格納されているハードディスク装
置、5はハードディスク装置にあるデータを記憶するブ
ロックである。図8に従来のディスクアレイ装置の動作
を示すフローチャートを示す。ディスクアレイコントロ
ーラ3は、ハードディスク装置4のブロック5のエラー
を検出するために、サーバ1からのアクセスとは独自に
ハードディスク装置4にあるブロック5のメディアチェ
ック(監視)を行う(ステップ80)。
常動作へ戻る(ステップ83)。タイムアウトエラーに
はならなかったがブロック5にメディア系エラーが発生
した場合には、エラーが発生したブロック5の代替処理
を行い(ステップ85)、ディスクアレイコントローラ
3はエラーが発生したブロック5以外のデータを読み出
し、これらのデータからデータを復元するRAIDの機
能を使ってブロック5のデータを復元する(ステップ8
6)。ブロック5は代替処理されていて使用可能である
ので復元したデータを書き込み、ブロック5のデータを
復元し終了する(ステップ87)。ここでメディア系エ
ラーについて説明する。メディア系エラーにはメディア
エラーとリカバードエラーがある。ハードディスク装置
4のメディアにエラーが発生するとハードディスク装置
はエラーが発生したブロック5のリトライ処理を行う。
リトライ処理により救済されないとメディアエラーとな
り、リトライ処理により救済されるとリカバードエラー
となる。ブロック5のメディアチェックでハードディス
ク装置4から応答がなくタイムアウトエラーとなった場
合にはエラー終了する(ステップ84)。タイムアウト
エラーには、ハードディスク装置4のメディアエラーに
関する要因以外で監視時間によらずタイムアウトエラー
となった場合と、ハードディスク装置4がエラーの発生
したブロック5のリトライ処理を実施していて監視時間
の設定値よりもリトライ時の処理時間のほうが長くなっ
たため、ディスクアレイコントローラ3に読み出しがで
きずにタイムアウトエラーとなった場合がある。
レイコントローラ3によるハードディスク装置4の監視
時間は、必ずしもハードディスク装置がリトライ処理を
行う際に必要とする最大限の時間が設定されているわけ
ではない。システムで要求される障害検出の応答性によ
り監視時間が決定されるためハードディスク装置のリト
ライ処理進行中であるが処理時間がコントローラの時間
監視の設定値を超えてしまい、リトライ処理で救済でき
るようなメディアエラーの場合にもタイムアウトエラー
として検出される場合がある。
装置では、メディアエラー発生によるハードディスク故
障発生を低減するための、ハードディスク装置のメディ
アチェックの機能において、監視時間内にメディアエラ
ーのリトライ処理を完了できずにタイムアウトエラーと
して検出されてしまう。このためリトライ処理で救済で
きるメディアエラーを救済することができない。本発明
はハードディスク装置のリトライ処理で救済できるメデ
ィアエラーをタイムアウトエラーとして検出することを
低減して、その結果ハードディスク装置の故障となる現
象を低減させることを目的としている。
に本発明においてはデータを記録するデータ用記憶媒体
装置を複数持つディスクアレイ装置において、ホストか
らの要求とは独立してディスクアレイコントローラから
データ用記憶媒体装置のメディアエラーを検出するため
のメディアチェックを行う手段と、時間監視の値を延長
して再度メディアチェックを行う手段と、メディアエラ
ーが発生した領域のデータを復元する手段と、その領域
を代替処理する手段と、を設けたディスクアレイ装置を
提供する。
施形態を詳細に説明する。ディスクアレイ装置はRAID5
の方式である。図1に示すディスクアレイ装置におい
て、1はサーバ、2はディスクアレイ装置、3はアレイ
型ディスクを制御するディスクアレイコントローラ、4
はデータが格納されているハードディスク装置、5はハ
ードディスク装置内にありデータを記憶するブロックで
ある。次に本発明に関わるディスクアレイ装置の動作の
流れを図で説明する。ディスクアレイコントローラ3
は、サーバ1からのアクセスとは独自にハードディスク
装置4にあるブロック5のエラーを検出するためにブロ
ック5のディスクのトラックを読み込むメディアチェッ
ク(監視)を行う(ステップ70)。各ブロックはディ
スクアレイコントローラ3へ読み出しを行う。ブロック
5にメディアエラーが発生し、ハードディスク装置4が
エラーの発生したブロック5のリトライ処理を実施して
いてディスクアレイコントローラ3に読み出しができず
にタイムアウトエラー(ステップ71)となった場合に
は、ハードディスク装置4がリトライ処理を実施してい
るので通常のアクセス時間より長い時間が必要である。
監視時間を延長すれば監視時間内にリトライ処理が完了
しタイムアウトエラーを救済できるので、図3のように
ディスクアレイコントローラ3がタイムアウトエラーと
なると時間監視の設定値を増加させ(ステップ74)、
監視時間を延長して再びメディアチェックを行う(ステ
ップ70)。監視時間が最大延長時間を上回るまで時間
監視の設定値を段階的に増加させてメディアチェックを
繰り返し行う。監視時間を延長しているのでディスクア
レイコントローラへの読み出しができ、図4のようにタ
イムアウトエラーとならずメディア系エラーとなる。監
視時間の延長により読み出しはできたが、リトライ不可
のメディアエラーに発展する可能性があるので、図5の
ようにディスクアレイコントローラ3がブロック5のエ
ラーが発生したディスク領域を代替処理するように命令
する。ブロック5のエラーが発生したディスク領域はC
E領域にある代替領域を使って代替処理される(ステッ
プ77)。ディスクアレイコントローラ3は図6のよう
にエラーが発生したブロック5以外のデータを読み出
し、これらのデータからデータを復元するRAIDの機
能を使ってブロック5のデータを復元する(ステップ7
8)。ブロック5は代替処理されていて使用可能である
ので復元したデータを書き込み、ブロック5のデータを
復元し終了する(ステップ79)。
以外で故障し監視時間によらないでタイムアウトエラー
となった場合、図3のように監視時間が最大延長時間を
上回るまで時間監視の設定値を段階的に増加させて(ス
テップ74)メディアチェックを繰り返し行い(ステッ
プ70)、監視時間が最大延長時間を上回ったら時点で
エラー終了する(ステップ76)。タイムアウトエラー
にはならなかったが、ブロック5にメディアエラーが発
生しハードディスク装置4がエラーの発生したブロック
5のリトライ処理を実施したが救済できなかった場合に
は、ハードディスク装置4からディスクアレイコントロ
ーラ3にメディアエラー発生のエラー通知があり、図5
のようにディスクアレイコントローラ3がブロック5の
エラーが発生したディスク領域を代替処理するように命
令する。ブロック5のエラーが発生したディスク領域は
CE領域にある代替領域を使って代替処理される(ステ
ップ77)。ディスクアレイコントローラ3は図6のよ
うにエラーが発生したブロック5以外のデータを読み出
し、これらのデータからデータを復元するRAIDの機
能を使ってブロック5のデータを復元する(ステップ7
8)。プロックは代替処理されていて使用可能であるの
で、復元したデータを書き込みブロック5のデータを復
元し終了する(ステップ79)。
ブロック5にメディアエラーが発生しハードディスク装
置4がエラーの発生したブロック5のリトライ処理の実
施により救済できた場合には、ハードディスク装置4か
らディスクアレイコントローラ3にリカバードエラー発
生の通知があり、リカバードエラー発生の通知をされた
ブロック5でも将来的にはメディアエラーとなる可能性
が高いので、図5のようにディスクアレイコントローラ
3がエラーが発生したディスク領域を代替処理するよう
に命令する。ブロック5のエラーが発生したディスク領
域は補修領域を使って代替処理される(ステップ7
7)。ディスクアレイコントローラ3は図6のようにエ
ラーが発生したブロック5以外のデータを読み出し、こ
れらのデータからデータを復元するRAIDの機能を使
ってブロック5のデータを復元する(ステップ78)。
プロックは代替処理されていて使用可能であるので、復
元したデータを書き込みブロック5のデータを復元し終
了する(ステップ79)。ディスクアレイコントローラ
3からのメディアチェック(ステップ70)に対して、
ハードディスク装置4から正常に読み出しが行われれば
通常動作へ戻る(ステップ73)。
式で構成しても同等の効果が得られる。以上のことから
ハードディスク装置4の時間監視の設定値を段階的に増
加させることでリトライ処理で救済できるメディアエラ
ーをタイムアウトエラーとして検出することがなくな
る。またタイムアウト監視時間を延長することによりハ
ードディスク装置4のリトライ処理で救済された場合に
も、そのブロック5が将来メディアエラーとなる可能性
があり代替処理とデータの復元を行うため、メディアエ
ラー発生の確率がさらに低減する。
のメディアエラーが発生した場合、時間監視の値を延長
して再度メディアチェックすることによって、メディア
エラーが救済でき、データ用記憶媒体装置の故障による
システムへの悪影響を低減できる。
示す図。
ェックを示す図。
示す図。
図。
を示す図。
すフローチャート。
フローチャート。
Claims (3)
- 【請求項1】データを記憶する複数の記憶媒体と、前記
記憶媒体へのデータの書き込み及び読み出しを制御する
制御部を有するディスクアレイ装置において、前記制御
部は、前記記憶媒体にエラー領域があるか検出するエラ
ー検出手段と、前記エラー検出手段の検出動作終了を予
め定められた監視時間だけ監視するとともに、この監視
時間を経過すると、さらに一定時間だけ監視時間を延長
する監視手段とを具備することを特徴とするディスクア
レイ装置。 - 【請求項2】前記監視手段は、延長可能な時間が予め定
められており、この延長可能な時間を超えるとエラー信
号を出力することを特長とする請求項1記載のディスク
アレイ装置。 - 【請求項3】データを記憶する複数の記憶媒体と、前記
記憶媒体へのデータの書き込み及び読み出しを制御する
制御部を有するディスクアレイ装置において、前記記憶
媒体にエラー領域があるか検出するステップと、前記エ
ラー検出手段の検出動作終了を予め定められた監視時間
だけ監視するステップと、この監視時間を経過すると、
さらに一定時間だけ監視時間を延長するステップと、を
具備することを特徴とするメディアエラー救済方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09732899A JP4176908B2 (ja) | 1999-04-05 | 1999-04-05 | ディスクアレイ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09732899A JP4176908B2 (ja) | 1999-04-05 | 1999-04-05 | ディスクアレイ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000293318A true JP2000293318A (ja) | 2000-10-20 |
JP4176908B2 JP4176908B2 (ja) | 2008-11-05 |
Family
ID=14189428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09732899A Expired - Fee Related JP4176908B2 (ja) | 1999-04-05 | 1999-04-05 | ディスクアレイ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4176908B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590884B2 (en) | 2005-06-30 | 2009-09-15 | Fujitsu Limited | Storage system, storage control device, and storage control method detecting read error response and performing retry read access to determine whether response includes an error or is valid |
JP2009211162A (ja) * | 2008-02-29 | 2009-09-17 | Toshiba Corp | 情報処理装置および起動制御方法 |
WO2010044224A1 (ja) * | 2008-10-15 | 2010-04-22 | 三菱電機株式会社 | 情報記憶装置 |
JP4911800B2 (ja) * | 2008-10-16 | 2012-04-04 | 株式会社メンテック | クレープ剤組成物及びクレープ紙の製造方法 |
-
1999
- 1999-04-05 JP JP09732899A patent/JP4176908B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590884B2 (en) | 2005-06-30 | 2009-09-15 | Fujitsu Limited | Storage system, storage control device, and storage control method detecting read error response and performing retry read access to determine whether response includes an error or is valid |
JP2009211162A (ja) * | 2008-02-29 | 2009-09-17 | Toshiba Corp | 情報処理装置および起動制御方法 |
WO2010044224A1 (ja) * | 2008-10-15 | 2010-04-22 | 三菱電機株式会社 | 情報記憶装置 |
CN102171643A (zh) * | 2008-10-15 | 2011-08-31 | 三菱电机株式会社 | 信息存储装置 |
JP5153884B2 (ja) * | 2008-10-15 | 2013-02-27 | 三菱電機株式会社 | 情報記憶装置 |
US8631286B2 (en) | 2008-10-15 | 2014-01-14 | Mitsubishi Electric Corporation | Information storage device |
JP4911800B2 (ja) * | 2008-10-16 | 2012-04-04 | 株式会社メンテック | クレープ剤組成物及びクレープ紙の製造方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4176908B2 (ja) | 2008-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7543178B2 (en) | Low cost RAID with seamless disk failure recovery | |
US6397347B1 (en) | Disk array apparatus capable of dealing with an abnormality occurring in one of disk units without delaying operation of the apparatus | |
JP5078235B2 (ja) | 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法 | |
JP4886209B2 (ja) | アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法 | |
KR100257422B1 (ko) | 데이타 복원 방법 및 저장 시스템 운영 방법 | |
US7761660B1 (en) | Identifying suspect disks | |
JP2002108573A (ja) | ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体 | |
JP2006079418A (ja) | 記憶制御装置、制御方法及びプログラム | |
JP3284963B2 (ja) | ディスクアレイの制御装置及び制御方法 | |
US20070036055A1 (en) | Device, method and program for recovering from media error in disk array device | |
US20060215456A1 (en) | Disk array data protective system and method | |
US20100275066A1 (en) | Identifying a storage device as faulty for a first storage volume without identifying the storage device as faulty for a second storage volume | |
US20080148094A1 (en) | Managing storage stability | |
US20060015769A1 (en) | Program, method and apparatus for disk array control | |
JP2006079219A (ja) | ディスクアレイ制御装置およびディスクアレイ制御方法 | |
JP4176908B2 (ja) | ディスクアレイ装置 | |
JP5181795B2 (ja) | Raidシステム、及びエラーセクタの修復方法 | |
JP3120753B2 (ja) | ディスクアレイ装置の障害復旧装置 | |
JP4143040B2 (ja) | ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム | |
JP4947062B2 (ja) | 記憶装置、記録復旧方法、記録復旧プログラム | |
JP2009169469A (ja) | 計算機システム | |
JP2830840B2 (ja) | ディスクアレイ修復処理方式及び方法 | |
JPH08147112A (ja) | ディスクアレイ装置のエラー回復装置 | |
JPH0962461A (ja) | ディスクアレイ装置における自動データ復旧方法 | |
JPH1040022A (ja) | 磁気ディスク制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050131 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050322 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20050328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071106 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080819 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080821 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130829 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |