JP2000293318A - ディスクアレイ装置およびメディアエラー救済方法 - Google Patents

ディスクアレイ装置およびメディアエラー救済方法

Info

Publication number
JP2000293318A
JP2000293318A JP11097328A JP9732899A JP2000293318A JP 2000293318 A JP2000293318 A JP 2000293318A JP 11097328 A JP11097328 A JP 11097328A JP 9732899 A JP9732899 A JP 9732899A JP 2000293318 A JP2000293318 A JP 2000293318A
Authority
JP
Japan
Prior art keywords
error
data
time
block
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11097328A
Other languages
English (en)
Other versions
JP4176908B2 (ja
Inventor
Hiroyuki Kaneko
浩行 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP09732899A priority Critical patent/JP4176908B2/ja
Publication of JP2000293318A publication Critical patent/JP2000293318A/ja
Application granted granted Critical
Publication of JP4176908B2 publication Critical patent/JP4176908B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】従来のディスクアレイ装置のコントローラによ
るハードディスク装置の時間監視は、必ずしもハードデ
ィスク装置がリトライ処理を行う際に必要とする最大限
の時間が設定されているわけではない。システムで要求
される障害検出の応答性により監視時間が決定されるた
めハードディスク装置のリトライ処理進行中であるが処
理時間がコントローラの時間監視の設定値を超えてしま
い、リトライ処理で救済できるようなメディアエラーの
場合にもタイムアウトエラーとして検出される場合があ
る。 【解決手段】ハードディスク装置の時間監視の設定値を
段階的に増加させることでリトライ処理で救済できるメ
ディアエラーをタイムアウトエラーとして検出すること
を低減するディスクアレイ装置を提供する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】ハードディスク装置のタイム
アウトエラーとして検出されるメディアエラーを救済す
るディスクアレイ装置に関する。
【0002】
【従来の技術】従来、大記憶容量と共に、高信頼性に対
する要求の強い大規模な装置に適用する記憶装置とし
て、冗長性を有するRAID(Redundant Arrays ofIndep
endent Disks)で構成されるディスクアレイ装置が開
発されている。ディスクアレイ装置では、ディスクアレ
イを構成する複数のハードディスク装置のうち何らかの
障害等により、仮にその中の一台が停止してしまっても
ディスクアレイを構成する残りのハードディスク装置の
データとパリティを使用して容易に元の状態に回復させ
ることができる。図1に一般的なディスクアレイ装置の
構成を示す。1はサーバ、2はディスクアレイ装置、3
はハードディスク装置を制御するディスクアレイコント
ローラ、4はデータが格納されているハードディスク装
置、5はハードディスク装置にあるデータを記憶するブ
ロックである。図8に従来のディスクアレイ装置の動作
を示すフローチャートを示す。ディスクアレイコントロ
ーラ3は、ハードディスク装置4のブロック5のエラー
を検出するために、サーバ1からのアクセスとは独自に
ハードディスク装置4にあるブロック5のメディアチェ
ック(監視)を行う(ステップ80)。
【0003】ブロック5にメディアエラーがなければ通
常動作へ戻る(ステップ83)。タイムアウトエラーに
はならなかったがブロック5にメディア系エラーが発生
した場合には、エラーが発生したブロック5の代替処理
を行い(ステップ85)、ディスクアレイコントローラ
3はエラーが発生したブロック5以外のデータを読み出
し、これらのデータからデータを復元するRAIDの機
能を使ってブロック5のデータを復元する(ステップ8
6)。ブロック5は代替処理されていて使用可能である
ので復元したデータを書き込み、ブロック5のデータを
復元し終了する(ステップ87)。ここでメディア系エ
ラーについて説明する。メディア系エラーにはメディア
エラーとリカバードエラーがある。ハードディスク装置
4のメディアにエラーが発生するとハードディスク装置
はエラーが発生したブロック5のリトライ処理を行う。
リトライ処理により救済されないとメディアエラーとな
り、リトライ処理により救済されるとリカバードエラー
となる。ブロック5のメディアチェックでハードディス
ク装置4から応答がなくタイムアウトエラーとなった場
合にはエラー終了する(ステップ84)。タイムアウト
エラーには、ハードディスク装置4のメディアエラーに
関する要因以外で監視時間によらずタイムアウトエラー
となった場合と、ハードディスク装置4がエラーの発生
したブロック5のリトライ処理を実施していて監視時間
の設定値よりもリトライ時の処理時間のほうが長くなっ
たため、ディスクアレイコントローラ3に読み出しがで
きずにタイムアウトエラーとなった場合がある。
【0004】従来のディスクアレイ装置2のディスクア
レイコントローラ3によるハードディスク装置4の監視
時間は、必ずしもハードディスク装置がリトライ処理を
行う際に必要とする最大限の時間が設定されているわけ
ではない。システムで要求される障害検出の応答性によ
り監視時間が決定されるためハードディスク装置のリト
ライ処理進行中であるが処理時間がコントローラの時間
監視の設定値を超えてしまい、リトライ処理で救済でき
るようなメディアエラーの場合にもタイムアウトエラー
として検出される場合がある。
【0005】
【発明が解決しようとする課題】従来のディスクアレイ
装置では、メディアエラー発生によるハードディスク故
障発生を低減するための、ハードディスク装置のメディ
アチェックの機能において、監視時間内にメディアエラ
ーのリトライ処理を完了できずにタイムアウトエラーと
して検出されてしまう。このためリトライ処理で救済で
きるメディアエラーを救済することができない。本発明
はハードディスク装置のリトライ処理で救済できるメデ
ィアエラーをタイムアウトエラーとして検出することを
低減して、その結果ハードディスク装置の故障となる現
象を低減させることを目的としている。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明においてはデータを記録するデータ用記憶媒体
装置を複数持つディスクアレイ装置において、ホストか
らの要求とは独立してディスクアレイコントローラから
データ用記憶媒体装置のメディアエラーを検出するため
のメディアチェックを行う手段と、時間監視の値を延長
して再度メディアチェックを行う手段と、メディアエラ
ーが発生した領域のデータを復元する手段と、その領域
を代替処理する手段と、を設けたディスクアレイ装置を
提供する。
【0007】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。ディスクアレイ装置はRAID5
の方式である。図1に示すディスクアレイ装置におい
て、1はサーバ、2はディスクアレイ装置、3はアレイ
型ディスクを制御するディスクアレイコントローラ、4
はデータが格納されているハードディスク装置、5はハ
ードディスク装置内にありデータを記憶するブロックで
ある。次に本発明に関わるディスクアレイ装置の動作の
流れを図で説明する。ディスクアレイコントローラ3
は、サーバ1からのアクセスとは独自にハードディスク
装置4にあるブロック5のエラーを検出するためにブロ
ック5のディスクのトラックを読み込むメディアチェッ
ク(監視)を行う(ステップ70)。各ブロックはディ
スクアレイコントローラ3へ読み出しを行う。ブロック
5にメディアエラーが発生し、ハードディスク装置4が
エラーの発生したブロック5のリトライ処理を実施して
いてディスクアレイコントローラ3に読み出しができず
にタイムアウトエラー(ステップ71)となった場合に
は、ハードディスク装置4がリトライ処理を実施してい
るので通常のアクセス時間より長い時間が必要である。
監視時間を延長すれば監視時間内にリトライ処理が完了
しタイムアウトエラーを救済できるので、図3のように
ディスクアレイコントローラ3がタイムアウトエラーと
なると時間監視の設定値を増加させ(ステップ74)、
監視時間を延長して再びメディアチェックを行う(ステ
ップ70)。監視時間が最大延長時間を上回るまで時間
監視の設定値を段階的に増加させてメディアチェックを
繰り返し行う。監視時間を延長しているのでディスクア
レイコントローラへの読み出しができ、図4のようにタ
イムアウトエラーとならずメディア系エラーとなる。監
視時間の延長により読み出しはできたが、リトライ不可
のメディアエラーに発展する可能性があるので、図5の
ようにディスクアレイコントローラ3がブロック5のエ
ラーが発生したディスク領域を代替処理するように命令
する。ブロック5のエラーが発生したディスク領域はC
E領域にある代替領域を使って代替処理される(ステッ
プ77)。ディスクアレイコントローラ3は図6のよう
にエラーが発生したブロック5以外のデータを読み出
し、これらのデータからデータを復元するRAIDの機
能を使ってブロック5のデータを復元する(ステップ7
8)。ブロック5は代替処理されていて使用可能である
ので復元したデータを書き込み、ブロック5のデータを
復元し終了する(ステップ79)。
【0008】ブロック5がメディアエラーに関する要因
以外で故障し監視時間によらないでタイムアウトエラー
となった場合、図3のように監視時間が最大延長時間を
上回るまで時間監視の設定値を段階的に増加させて(ス
テップ74)メディアチェックを繰り返し行い(ステッ
プ70)、監視時間が最大延長時間を上回ったら時点で
エラー終了する(ステップ76)。タイムアウトエラー
にはならなかったが、ブロック5にメディアエラーが発
生しハードディスク装置4がエラーの発生したブロック
5のリトライ処理を実施したが救済できなかった場合に
は、ハードディスク装置4からディスクアレイコントロ
ーラ3にメディアエラー発生のエラー通知があり、図5
のようにディスクアレイコントローラ3がブロック5の
エラーが発生したディスク領域を代替処理するように命
令する。ブロック5のエラーが発生したディスク領域は
CE領域にある代替領域を使って代替処理される(ステ
ップ77)。ディスクアレイコントローラ3は図6のよ
うにエラーが発生したブロック5以外のデータを読み出
し、これらのデータからデータを復元するRAIDの機
能を使ってブロック5のデータを復元する(ステップ7
8)。プロックは代替処理されていて使用可能であるの
で、復元したデータを書き込みブロック5のデータを復
元し終了する(ステップ79)。
【0009】タイムアウトエラーにはならなかったが、
ブロック5にメディアエラーが発生しハードディスク装
置4がエラーの発生したブロック5のリトライ処理の実
施により救済できた場合には、ハードディスク装置4か
らディスクアレイコントローラ3にリカバードエラー発
生の通知があり、リカバードエラー発生の通知をされた
ブロック5でも将来的にはメディアエラーとなる可能性
が高いので、図5のようにディスクアレイコントローラ
3がエラーが発生したディスク領域を代替処理するよう
に命令する。ブロック5のエラーが発生したディスク領
域は補修領域を使って代替処理される(ステップ7
7)。ディスクアレイコントローラ3は図6のようにエ
ラーが発生したブロック5以外のデータを読み出し、こ
れらのデータからデータを復元するRAIDの機能を使
ってブロック5のデータを復元する(ステップ78)。
プロックは代替処理されていて使用可能であるので、復
元したデータを書き込みブロック5のデータを復元し終
了する(ステップ79)。ディスクアレイコントローラ
3からのメディアチェック(ステップ70)に対して、
ハードディスク装置4から正常に読み出しが行われれば
通常動作へ戻る(ステップ73)。
【0010】なお、ディスクアレイ装置2をRAID3の方
式で構成しても同等の効果が得られる。以上のことから
ハードディスク装置4の時間監視の設定値を段階的に増
加させることでリトライ処理で救済できるメディアエラ
ーをタイムアウトエラーとして検出することがなくな
る。またタイムアウト監視時間を延長することによりハ
ードディスク装置4のリトライ処理で救済された場合に
も、そのブロック5が将来メディアエラーとなる可能性
があり代替処理とデータの復元を行うため、メディアエ
ラー発生の確率がさらに低減する。
【0011】
【発明の効果】本発明によれば、データ用記憶媒体装置
のメディアエラーが発生した場合、時間監視の値を延長
して再度メディアチェックすることによって、メディア
エラーが救済でき、データ用記憶媒体装置の故障による
システムへの悪影響を低減できる。
【図面の簡単な説明】
【図1】一般的なディスクアレイ装置のブロック図。
【図2】本発明のディスクアレイ装置の読み出し動作を
示す図。
【図3】本発明のディスクアレイ装置の再度メディアチ
ェックを示す図。
【図4】本発明のディスクアレイ装置の読み出し動作を
示す図。
【図5】本発明のディスクアレイ装置の代替処理を示す
図。
【図6】本発明のディスクアレイ装置のデータ復元処理
を示す図。
【図7】本発明のディスクアレイ装置の動作の処理を示
すフローチャート。
【図8】従来のディスクアレイ装置の動作の処理を示す
フローチャート。
【符号の説明】
1…サーバ 2…ディスクアレイ装置 3…ディスクアレイコントローラ 4…ハードディスク装置 5…ブロック

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】データを記憶する複数の記憶媒体と、前記
    記憶媒体へのデータの書き込み及び読み出しを制御する
    制御部を有するディスクアレイ装置において、前記制御
    部は、前記記憶媒体にエラー領域があるか検出するエラ
    ー検出手段と、前記エラー検出手段の検出動作終了を予
    め定められた監視時間だけ監視するとともに、この監視
    時間を経過すると、さらに一定時間だけ監視時間を延長
    する監視手段とを具備することを特徴とするディスクア
    レイ装置。
  2. 【請求項2】前記監視手段は、延長可能な時間が予め定
    められており、この延長可能な時間を超えるとエラー信
    号を出力することを特長とする請求項1記載のディスク
    アレイ装置。
  3. 【請求項3】データを記憶する複数の記憶媒体と、前記
    記憶媒体へのデータの書き込み及び読み出しを制御する
    制御部を有するディスクアレイ装置において、前記記憶
    媒体にエラー領域があるか検出するステップと、前記エ
    ラー検出手段の検出動作終了を予め定められた監視時間
    だけ監視するステップと、この監視時間を経過すると、
    さらに一定時間だけ監視時間を延長するステップと、を
    具備することを特徴とするメディアエラー救済方法。
JP09732899A 1999-04-05 1999-04-05 ディスクアレイ装置 Expired - Fee Related JP4176908B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09732899A JP4176908B2 (ja) 1999-04-05 1999-04-05 ディスクアレイ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09732899A JP4176908B2 (ja) 1999-04-05 1999-04-05 ディスクアレイ装置

Publications (2)

Publication Number Publication Date
JP2000293318A true JP2000293318A (ja) 2000-10-20
JP4176908B2 JP4176908B2 (ja) 2008-11-05

Family

ID=14189428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09732899A Expired - Fee Related JP4176908B2 (ja) 1999-04-05 1999-04-05 ディスクアレイ装置

Country Status (1)

Country Link
JP (1) JP4176908B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590884B2 (en) 2005-06-30 2009-09-15 Fujitsu Limited Storage system, storage control device, and storage control method detecting read error response and performing retry read access to determine whether response includes an error or is valid
JP2009211162A (ja) * 2008-02-29 2009-09-17 Toshiba Corp 情報処理装置および起動制御方法
WO2010044224A1 (ja) * 2008-10-15 2010-04-22 三菱電機株式会社 情報記憶装置
JP4911800B2 (ja) * 2008-10-16 2012-04-04 株式会社メンテック クレープ剤組成物及びクレープ紙の製造方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590884B2 (en) 2005-06-30 2009-09-15 Fujitsu Limited Storage system, storage control device, and storage control method detecting read error response and performing retry read access to determine whether response includes an error or is valid
JP2009211162A (ja) * 2008-02-29 2009-09-17 Toshiba Corp 情報処理装置および起動制御方法
WO2010044224A1 (ja) * 2008-10-15 2010-04-22 三菱電機株式会社 情報記憶装置
CN102171643A (zh) * 2008-10-15 2011-08-31 三菱电机株式会社 信息存储装置
JP5153884B2 (ja) * 2008-10-15 2013-02-27 三菱電機株式会社 情報記憶装置
US8631286B2 (en) 2008-10-15 2014-01-14 Mitsubishi Electric Corporation Information storage device
JP4911800B2 (ja) * 2008-10-16 2012-04-04 株式会社メンテック クレープ剤組成物及びクレープ紙の製造方法

Also Published As

Publication number Publication date
JP4176908B2 (ja) 2008-11-05

Similar Documents

Publication Publication Date Title
US7543178B2 (en) Low cost RAID with seamless disk failure recovery
US6397347B1 (en) Disk array apparatus capable of dealing with an abnormality occurring in one of disk units without delaying operation of the apparatus
JP5078235B2 (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
JP4886209B2 (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
KR100257422B1 (ko) 데이타 복원 방법 및 저장 시스템 운영 방법
US7761660B1 (en) Identifying suspect disks
JP2002108573A (ja) ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
JP2006079418A (ja) 記憶制御装置、制御方法及びプログラム
JP3284963B2 (ja) ディスクアレイの制御装置及び制御方法
US20070036055A1 (en) Device, method and program for recovering from media error in disk array device
US20060215456A1 (en) Disk array data protective system and method
US20100275066A1 (en) Identifying a storage device as faulty for a first storage volume without identifying the storage device as faulty for a second storage volume
US20080148094A1 (en) Managing storage stability
US20060015769A1 (en) Program, method and apparatus for disk array control
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
JP4176908B2 (ja) ディスクアレイ装置
JP5181795B2 (ja) Raidシステム、及びエラーセクタの修復方法
JP3120753B2 (ja) ディスクアレイ装置の障害復旧装置
JP4143040B2 (ja) ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム
JP4947062B2 (ja) 記憶装置、記録復旧方法、記録復旧プログラム
JP2009169469A (ja) 計算機システム
JP2830840B2 (ja) ディスクアレイ修復処理方式及び方法
JPH08147112A (ja) ディスクアレイ装置のエラー回復装置
JPH0962461A (ja) ディスクアレイ装置における自動データ復旧方法
JPH1040022A (ja) 磁気ディスク制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050131

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050322

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20050328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080819

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080821

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees