JP2009217362A - ディスクアレイ装置および制御方法 - Google Patents

ディスクアレイ装置および制御方法 Download PDF

Info

Publication number
JP2009217362A
JP2009217362A JP2008058104A JP2008058104A JP2009217362A JP 2009217362 A JP2009217362 A JP 2009217362A JP 2008058104 A JP2008058104 A JP 2008058104A JP 2008058104 A JP2008058104 A JP 2008058104A JP 2009217362 A JP2009217362 A JP 2009217362A
Authority
JP
Japan
Prior art keywords
disk device
failure
raid
disk
primary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008058104A
Other languages
English (en)
Inventor
Kazuhiro Ogawa
和宏 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008058104A priority Critical patent/JP2009217362A/ja
Publication of JP2009217362A publication Critical patent/JP2009217362A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】故障の前兆のディスク装置を縮退させることなく、RAIDの冗長性を保ったまま、システムの性能低下を防ぐ制御方法等を提供すること。
【解決手段】RAID1構成のディスク装置からのコマンド応答時間を検出し、応答時間からディスクの故障の前兆を判断し、故障予測をしたときにプライマリ/セカンダリ制御により冗長性を保持する。
【選択図】図1

Description

本発明は、RAID1のシステムにおいてRAID1を構成しているディスク装置のレスポンスから故障の前兆を判断し、前兆があった場合は、縮退させずにRAIDの制御方法をロードバランスからプライマリ/セカンダリ制御に移行することで故障の前兆があるディスクに起因したリード性能の低下を防ぎ、RAID1の状態で冗長性を保つ技術に関する。
RAID1のリード処理は、RAIDを構成する2台のディスク装置にロードバランスしてI/Oを分散させるのが一般的である。もし、リード対象のティすく装置に故障の前兆があった場合、I/Oエラーやリトライが発生することがあり、そのためリード処理が完了するまでに時間がかかってしまい、システム性能が低下する問題がある。RAIDはリトライで救えるようなケースを故障と判断しないため、故障と判断してHDDを切り離すまでは、このシステム性能の低下が継続することになる。
関連技術として、プライマリ・ボリュームがオフラインになると、たとえディスク・システム内にいくつかのセカンダリ・ボリュームが備わっている場合であっても、そのオンライン・トランザクションを中止することが可能な技術が提案されている。その構成は、ディスクの複数グループとして組織化された複数の物理ドライブを包含するマルチ・ディスク・システム。各グループは、複数の論理ボリュームとしてアクセスされる。論理ドライブの1つはプライマリ・ボリュームと見なされ、そのほかの1ないしは複数の論理ボリュームはセカンダリ・ボリュームと見なされ、これらはともにミラーリング・グループを構成する。メモリ内に収められるデータが、これらの編成を記録している。プライマリ・ボリュームを含むディスク・グループに障害が発生すると、セカンダリ・ボリュームを選択するためにこのデータが参照される(例えば、特許文献1参照)。
特開2002−182862号公報
上述の問題を回避するためにディスク装置の故障を判断する基準を厳しくして切り離すようにすると、RAIDの縮退が頻繁に発生し、RAIDの冗長性が失われてしまう問題がある。
第1の課題は、ディスク故障の前兆は故障ではないため、縮退させないことである。
第2の課題は、縮退させないため、故障の前兆があるディスク装置に対してI/Oが発行され、システムの性能低下が発生することである。
第3の課題は、故障の前兆のディスク装置を縮退させると縮退は頻繁に発生し、RAIDの冗長性が失われてしまうことである。
本発明は、以上のような課題を解決するためになされたもので、故障の前兆のディスク装置を縮退させることなく、RAIDの冗長性を保ったまま、システムの性能低下を防ぐディスクアレイ装置および制御方法を提供することを目的とする。
本発明のディスクアレイ装置は、RAID1構成のディスク装置からのコマンド応答時間を検出する手段と、応答時間からディスクの故障の前兆を判断する手段と、故障予測をしたときにプライマリ/セカンダリ制御により冗長性を保持する手段を備えることを特徴とする。
また、本発明の制御方法は、RAID1構成のディスク装置からのコマンド応答時間を検出するステップと、応答時間からディスクの故障の前兆を判断するステップと、故障予測をしたときにプライマリ/セカンダリ制御により冗長性を保持するステップとを有することを特徴とする。
本発明によれば、故障の前兆のディスク装置を縮退させることなく、RAIDの冗長性を保ったまま、システムの性能低下を防ぐディスクアレイ装置および制御方法を提供することが可能となる。
以下、本発明の第一の実施の形態について図面を参照して詳細に説明する。図1にRAID1のシステムコンポーネント図として示す本実施の形態におけるRAID1の制御システムは、ディスク装置1(5)とディスク装置2(6)の2台のディスク装置から構成される。
(1)はオペレーティングシステム、(2)はRAIDコントローラ(3)を制御するドライバ、(3)はRAID1を制御するRAIDコントローラ、(4)はRAIDコントローラ上でRAIDの制御処理を行うRAID制御部、(5)はRAID1を構成するディスク装置1、(6)はRAID1を構成するディスク装置2である。
(7)はドライバ(2)からRAID1に対して発行されたI/O、(8)はRAID1に発行したI/Oのレスポンス、(9)はディスク装置(5)に発行されたI/O、(10)はディスク装置(6)に発行されたI/O、(11)はディスク装置(5)に発行されたI/Oのレスポンス、(12)はディスク装置(6)に発行されたI/Oのレスポンス、(13)はレスポンス((11)、(12))からディスク故障の前兆を判断する処理、(14)はRAID1の制御方法をロードバランスからプライマリ/セカンダリの制御に移行する処理を示す。
RAID1に対するI/Oは、オペレーティングシステム(1)上のドライバ(2)からRAIDコントローラ(3)のRAID制御部(4)に発行(7)される。リード処理のI/Oは、RAID制御部(4)がロードバランスしてディスク装置1(5)かディスク装置2(6)のどちらか((9)または(10))に発行する。そのレスポンス((11)または(12))はRAID制御部((14))からドライバ((12))に返る((8))。
以下に図面を参照して本実施の形態の動作を詳細に説明する。
図1において、ディスク装置1(5)に故障の前兆がある場合にディスク装置1(5)にリード処理(9)を発行すると、レスポンス(11)がエラーになったり、レスポンス(11)が返えるまでに時間がかかったりすることがある。レスポンス(11)が正常終了でない場合は、RAID制御部(4)のエラー処理としてリトライ(再度(9)を発行)などを実行する。そのため、ドライバ(2)にI/Oの完了が返る(8)までに時間がかかり、システム性能が低下する。RAID制御部(4)は、エラー処理が実行された場合でもエラー処理の結果が正常であれば、ディスク装置(5)を縮退させないため、再度、ディスク装置1(5)にリード処理のI/Oが発行(9)された場合、同様にシステム性能の低下が発生する。
関連技術では故障の前兆があるディスク装置1(5)を縮退させることになるが、縮退させた場合、RAIDの冗長性が失われてしまう。また故障の判断基準が厳しかった場合、頻繁に縮退が発生する可能性がある。
本実施の形態では、RAID制御部(4)に判断処理(13)とRAID制御移行処理(14)を組み込み、判断処理(13)でレスポンス((11)または(12))の状況から故障の前兆があるか判断する。前兆がある場合は縮退させずに、RAID制御移行処理(14)によりロードバランスを中止して、ディスク装置1(5)に故障の前兆がある場合は、ディスク装置1(5)をセカンダリ、残りのもう1台のディスク装置2(6)をプライマリとし、ディスク装置2(6)に故障の前兆がある場合は、ディスク装置2(6)をセカンダリ、残りのもう1台のディスク装置1(5)をプライマリとする、プライマリ/セカンダリ制御に移行する。プライマリ/セカンダリ制御移行後は、リード処理はプライマリのディスク装置のみに発行する。故障の前兆があるディスク装置はセカンダリとし、リード処理は発行しないため、システム性能の低下は発生しない。
図2は、本発明の処理の流れを示した図である。
ドライバはリード処理のI/OをRAIDコントローラに発行(1)する。I/OはRAIDコントローラ上のRAID制御部が受け取り、リード処理のI/Oを発行するディスク装置をロードバランスで決定(2)し、発行(3)する。ディスク装置で処理されたI/OはRAID制御部に返る(4)。RAID制御部では返ってきたレスポンスが正常か異常か判断(5)する。
判断(5)の結果が異常(6)の場合は、RAID制御移行処理でロードバランス制御からプライマリ/セカンダリ制御への変更、異常レスポンスが返ってきたディスク装置をセカンダリ、残りのディスク装置をプライマリに設定(7)する。プライマリ/セカンダリ制御にRAID制御が移行したことをRAID制御部で保持(8)する。その後、リード処理のI/O結果をドライバに返し(9)、ドライバでI/Oを受けて取り(11)、リード処理は終了する。
判断(5)の結果が正常(10)の場合は、RAID制御部からリード処理のI/O結果をドライバに返し(9)、ドライバでI/Oを受け取り(11)、リード処理は終了する。
プライマリ/セカンダリ制御に移行後は、ドライバから発行(12)されたリード処理のI/Oは、RAID制御部が受け取り、リード処理のI/Oをプライマリに設定されているディスク装置(13)に発行(14)する。プライマリのディスク装置で処理されたI/OはRAID制御部に返る(15)。RAID制御部はリード処理のI/O結果をドライバに返し(16)、ドライバでI/Oを受け取り(17)、リード処理は終了する。
以上説明したように、本実施の形態においては、以下に記載するような効果を奏する。
第1の効果は、ディスク装置の故障の前兆を判断し、前兆がある場合でも縮退させずにロードバランスからプライマリ/セカンダリの制御に移行することで、RAID1の冗長性を保つことである。
第2の効果は、ロードバランスからプライマリ/セカンダリの制御に移行しているので、故障の前兆のあるディスク装置がある場合でもシステムの性能低下が発生しないことである。
本発明の他の実施の形態として、他のRAIDレベルでも類似の効果を得られる。
例えば、RAID5はデータとパリティに分散してデータを記憶しており、1台のディスク装置に故障の前兆があった場合、故障のディスク装置にはリードを発行しないようにして、残りのディスク装置からデータ、パリティをリードしてデータを生成することで、同様の効果を得られる。ただし、データの生成処理の時間が余分に必要になるため、僅かではあるが性能は低下する。
なお、上述する各実施の形態は、本発明の好適な実施の形態であり、本発明の要旨を逸脱しない範囲内において種々変更実施が可能である。
本発明の実施の形態に係るシステム構成を示す図である。 本発明の実施の形態に係る処理動作を示すフローチャートである。
符号の説明
1 オペレーティングシステム
2 ドライバ
3 RAIDコントローラ
4 RAID制御部
5 ディスク装置1
6 ディスク装置2

Claims (6)

  1. RAID1構成のディスク装置からのコマンド応答時間を検出する手段と、応答時間からディスクの故障の前兆を判断する手段と、故障予測をしたときにプライマリ/セカンダリ制御により冗長性を保持する手段を備えることを特徴とするディスクアレイ装置。
  2. ディスク装置はRAID5構成を備えることを特徴とする請求項1記載のディスクアレイ装置。
  3. ディスク装置からのレスポンスから故障の前兆の有無を判断する判断処理手段を有し、前兆があった場合は縮退させずにRAID1の状態で冗長性を保ったまま、リード処理をロードバランスからプライマリ/セカンダリの制御に移行するRAID制御移行処理手段を有し、リード処理はプライマリのディスク装置からのみ実行することを特徴とする請求項1または2記載のディスクアレイ装置。
  4. RAID1構成のディスク装置からのコマンド応答時間を検出するステップと、応答時間からディスクの故障の前兆を判断するステップと、故障予測をしたときにプライマリ/セカンダリ制御により冗長性を保持するステップとを有することを特徴とする制御方法。
  5. ディスク装置はRAID5構成を備えることを特徴とする請求項4記載の制御方法。
  6. ディスク装置からのレスポンスから故障の前兆の有無を判断する判断処理ステップを有し、前兆があった場合は縮退させずにRAID1の状態で冗長性を保ったまま、リード処理をロードバランスからプライマリ/セカンダリの制御に移行するRAID制御移行処理ステップを有し、リード処理はプライマリのディスク装置からのみ実行することを特徴とする請求項4または5記載の制御方法。
JP2008058104A 2008-03-07 2008-03-07 ディスクアレイ装置および制御方法 Pending JP2009217362A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008058104A JP2009217362A (ja) 2008-03-07 2008-03-07 ディスクアレイ装置および制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008058104A JP2009217362A (ja) 2008-03-07 2008-03-07 ディスクアレイ装置および制御方法

Publications (1)

Publication Number Publication Date
JP2009217362A true JP2009217362A (ja) 2009-09-24

Family

ID=41189177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008058104A Pending JP2009217362A (ja) 2008-03-07 2008-03-07 ディスクアレイ装置および制御方法

Country Status (1)

Country Link
JP (1) JP2009217362A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012178017A (ja) * 2011-02-25 2012-09-13 Nec Corp 記録媒体制御システム、記録媒体制御方法、記録媒体制御プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05100801A (ja) * 1991-10-09 1993-04-23 Hitachi Ltd デイスクサブシステムの高信頼化方式
JPH07129331A (ja) * 1993-11-05 1995-05-19 Fujitsu Ltd ディスクアレイ装置
JP2002229867A (ja) * 2001-02-02 2002-08-16 Hitachi Ltd ディスク装置の故障予知装置
JP2004118397A (ja) * 2002-09-25 2004-04-15 Nec Soft Ltd 磁気ディスク装置の障害発生予測システム
JP2006154880A (ja) * 2004-11-04 2006-06-15 Hitachi Ltd 情報処理システム及びアクセス方法
JP2007241384A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 故障予測装置、画像形成装置、故障予測方法及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05100801A (ja) * 1991-10-09 1993-04-23 Hitachi Ltd デイスクサブシステムの高信頼化方式
JPH07129331A (ja) * 1993-11-05 1995-05-19 Fujitsu Ltd ディスクアレイ装置
JP2002229867A (ja) * 2001-02-02 2002-08-16 Hitachi Ltd ディスク装置の故障予知装置
JP2004118397A (ja) * 2002-09-25 2004-04-15 Nec Soft Ltd 磁気ディスク装置の障害発生予測システム
JP2006154880A (ja) * 2004-11-04 2006-06-15 Hitachi Ltd 情報処理システム及びアクセス方法
JP2007241384A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 故障予測装置、画像形成装置、故障予測方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012178017A (ja) * 2011-02-25 2012-09-13 Nec Corp 記録媒体制御システム、記録媒体制御方法、記録媒体制御プログラム

Similar Documents

Publication Publication Date Title
US8127182B2 (en) Storage utilization to improve reliability using impending failure triggers
JP4886209B2 (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
US20150234709A1 (en) Storage controller, storage system, and control method
JP6191346B2 (ja) ストレージ制御装置、ディスクアレイ装置の制御方法及びディスクアレイ装置の制御プログラム
US20090287880A1 (en) Online storage capacity expansion of a raid storage system
US8914577B2 (en) Disk array control apparatus
US9286174B2 (en) Disk array having mirror configuration and rebuilding method therefor
JP2005293363A (ja) ディスクアレイコントローラおよび情報処理装置
US20110202791A1 (en) Storage control device , a storage system, a storage control method and a program thereof
JP2007052509A (ja) ディスクアレイ装置における媒体エラーリカバリ装置、方法、及びプログラム
JP4862847B2 (ja) ディスクアレイのデータ復旧方法、ディスクアレイシステム及び制御プログラム
JP2009163562A (ja) ストレージシステム、ストレージシステムの制御部、ストレージシステムの制御方法
JP2006268502A (ja) アレイコントローラ、メディアエラー修復方法及びプログラム
JP5311211B2 (ja) ディスクアレイコントローラ及びディスクアレイの冗長化方法
JP2008217395A (ja) ディスクアレイ装置
JP2009217362A (ja) ディスクアレイ装置および制御方法
JP2006164304A (ja) ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法
WO2010092634A1 (ja) ストレージシステム
JP5505329B2 (ja) ディスクアレイ装置及びその制御方法
JP6799752B2 (ja) 光ディスク装置、光ディスク読み出し方法
JP2016057876A (ja) 情報処理装置、入出力制御プログラム、及び入出力制御方法
JP5729043B2 (ja) ストレージ装置および制御装置
JP2008197886A (ja) ストレージ装置及びその制御方法
JP2007128183A (ja) ストレージシステム
JP2014041523A (ja) データ管理装置、及び、データ管理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110215

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120425

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120821