JP3597086B2 - ディスクアレイ制御装置 - Google Patents
ディスクアレイ制御装置 Download PDFInfo
- Publication number
- JP3597086B2 JP3597086B2 JP21157199A JP21157199A JP3597086B2 JP 3597086 B2 JP3597086 B2 JP 3597086B2 JP 21157199 A JP21157199 A JP 21157199A JP 21157199 A JP21157199 A JP 21157199A JP 3597086 B2 JP3597086 B2 JP 3597086B2
- Authority
- JP
- Japan
- Prior art keywords
- hard disk
- area
- restoration
- disk array
- raid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
Description
【発明の属する技術分野】
本発明は、RAIDを構成しているディスクアレイ装置に係り、RAIDを構成しているハードディスク装置の1台に故障が発生したとき、別のRAIDを構成している論理ユニットの修復用の領域とユーザが使用している領域を備えているハードディスク装置を使用し、自動修復を可能とする制御をおこなうディスクアレイ制御装置に関する。
【0002】
【従来の技術】
従来この種のディスクアレイ装置において、RAIDを構成しているハードディスク装置の1台が故障時には、予備の修復専用ハードディスク装置を用い自動で修復をするような構成もしくは、予備用のハードディスク装置を有せず人手によるハードディスク装置の交換をする構成のどちらかであった。
【0003】
たとえば、特開平9−16343号公報には、ディスクアレイ装置内に、RAIDを構成しているハードディスク装置の1台が故障時にスペアディスクを設けて使用する技術が記載されている。
【0004】
また従来のディスクアレイ装置の一例が、特開平9−265435号公報に記載されている。この公報に記載された記憶装置システムは、ライトデータをRAID3形式で格納し、キャッシュの管理情報をRAID1形式で格納する。複数のクラスタで構成されるディスク制御装置の場合、それぞれのクラスタ内のデータ格納形式に冗長性を持たせ、保守処理をおこなうときに保守用のキャッシュメモリに新たなデータの格納はおこなわないようにして、保守をおこなうキャッシュメモリにそれまで格納していたデータをもう一方のクラスタのキャッシュメモリに書き込むか、またはディスク装置に書き込むようにする。
【0005】
【発明が解決しようとする課題】
上述の従来例は、RAIDを構成しているハードディスク装置の1台に故障が発生したときに自動的に修復処理を行うには、修復専用のハードディスク装置が必要になり、そのハードディスク装置を入れるスペースもディスクアレイ装置内に必要になってくる。また特開平9−265435号公報に記載の記憶装置システムは、保守のためにキャッシュメモリかまたはディスク装置にデータの格納領域を設ける必要があった。
【0006】
本発明の目的は、アレイを構成しているハードディスク装置を1台他のハードディスク装置の倍以上の容量のものとし、別のRAIDを構成している未使用の領域を使用して故障時に自動的に修復を行い、修復時に使用する専用のハードディスク装置を有さない状態でも、データの安全性を高めるディスクアレイ制御装置を提供することにある。
【0007】
【課題を解決するための手段】
本発明のディスクアレイ制御装置は、ユーザが使用する領域と、その領域と同じ容量以上の修復用領域の2つの領域を有する1台のハードディスク装置を含む複数台のハードディスクでRAIDを構成した論理ユニットを複数有するディスクアレイ制御装置であって、1つの論理ユニットのハードディスク装置の1台に故障が発生した時に、故障したハードディスク装置のデータを他の論理ユニットのハードディスク装置の修復用領域へ自動的に修復することを特徴とする。
【0008】
また、他の論理ユニットのハードディスク装置の修復用領域へ自動的に修復する時は、1台のハードディスク装置内の2つの領域をアクセスするために、RAIDを構成するハードディスク装置の構成管理テーブルを有し、構成管理テーブルの情報を用いて制御を行うことを特徴とする。
【0009】
また、1つの論理ユニットのハードディスク装置の1台に故障が発生し、論理ユニットの状態が縮退状態になったときから修復を経て元の構成状態に戻る間に、修復で使用される修復用領域を有するハードディスク装置に対して、先読みをするアクセス制御を行い、修復時の構成での上位装置からのアクセスに対する性能低下を軽減させることを特徴とする。
【0010】
【発明の実施の形態】
本発明のディスクアレイ制御装置は、ユーザが使用する領域と、その領域と同じ容量以上の修復用領域の2つの領域を持つハードディスク装置を含む複数台のハードディスク装置でRAIDを構成した論理ユニットを複数有する。
【0011】
別の論理ユニットを構成している修復用領域へ自動的に修復する時は、1台のハードディスク装置内の2つの領域をアクセスするためディスクアレイ制御部内にRAIDを構成しているハードディスク装置の構成管理テーブルを有し、その情報を用いて制御を行う機能を有する。
【0012】
別の論理ユニットを構成しているハードディスク装置に修復が始まった以後から、元の構成状態に戻るまでの構成状態の間、修復で使用されている領域を持っているハードディスク装置に対して、上位からのアクセスの性能低下を低減するために先読み制御を行う機能を有する。
【0013】
以下図面を用いて本発明の実施例を詳細に説明する。図1は、本発明のディスクアレイ制御にて制御する装置の全体構成の一実施例を示したシステム構成図である。
【0014】
ディスクアレイ制御部102は、複数のSCSI制御部103a,103b,103cにつながっているハードディスク105,106,107,108,109,110,111,112,113を制御しRAID(RedundantArrays of Inexpensive Disks)を構成している。
【0015】
RAIDの概念は、カリフォルニア大学バークレー校のD.Patterson、G.Gibson、and R.H.Kartzら3人のコンピュータ学者により、高速に大量のデータを多くのディスクにアクセスし、ディスク故障時におけるデータの冗長性を実現するディスクアレイ装置について、レベル1からレベル5まで分類付けを行って評価した論文を発表している。(ACMSIGMOD Conferance、 Chicago、Illiois、June 1988)
このデビット・A・パターソンらが提案したディスクアレイ装置を分類するレベル1から5まであり、RAID1から5と略称される。今回実施例で用いる構成は、RAID3を構成している。
【0016】
RAID3について簡単に説明すると、RAID3は、3台以上のハードディスク装置を一組として、比較的小さい単位(例えばバイト単位)でのストライピングを行うことで、1つのI/O要求に対して全ディスクドライブを並列(同時)にアクセスできるようにすると共に、ストライピングされたデータのパリティを専用のディスクドライブ(パリティ・ディスク)に格納する方式である。
【0017】
個々のハードディスク装置105,106,108,109,111,112は、ユーザが使用出来る領域105a,106a,108a,109a,111a,112aを持っており、ハードディスク装置107,110,113は、ユーザが使用できる領域107a,110a,113aと、ユーザ領域と同じ容量をもつ未使用領域107b,110b,113bの2つ領域をもっている。
【0018】
3台のハードディスク装置105,106,107でRAID3のディスクアレイ論理ユニット#0 114を構成し、ハードディスク装置108,109,110でディスクアレイ論理ユニット#1 115を構成し、ハードディスク装置111,112,113でディスクアレイ論理ユニット#2 116を構成している。論理ユニットとは、RAIDを構成しているハードディスク装置のかたまりをいう。
【0019】
RAID3のディスクアレイを構成している3台のハードディスク装置は、3つあるSCSI制御部103a,103b,103cにそれぞれ3台ずつ接続されている。
【0020】
SCSI制御部103aに接続されているハードディスク装置105,106,107はSCSIバス117aに接続されており、同じ様にSCSI制御部103bに接続されているハードディスク装置108,109,110はSCSIバス117bで接続構成され、SCSI制御部103cに接続されているハードディスク装置111,112,113はSCSIバス117cで接続構成されている。
【0021】
次に、図1を用いディスクアレイ制御方法の詳細について説明を以下に述べる。まず、ディスクアレイ装置のRAIDを構成している論理ユニットの状態について説明をする。RAIDを構成している論理ユニットの状態としては正常、縮退、異常、修復、未接続の5つの状態が存在する。正常状態とは、RAIDを構成しているハードディスク装置に異常が無い状態で、通常この状態で使用される。
【0022】
縮退状態とは、RAIDを構成しているハードディスク装置の1台に故障が発生し、そのハードディスク装置をRAIDを構成している論理ユニットから切り離した状態である。この縮退状態中には、同じ論理ユニット内の別のハードディスク装置に一台でも故障が発生するとデータが失われてしまうため、データが失われてしまう可能性が正常状態に比べ非常に高くなる。
【0023】
異常状態とは、RAIDを構成している論理ユニット内で2台以上のハードディスク装置が故障を起こしている状態である。この状態では、上位装置から異常状態の論理ユニットは使用できない。
【0024】
修復状態とは、2つの状態が存在する。1つは、正常状態に戻すため、縮退状態のRAIDを構成している論理ユニット内の正常なハードディスク装置からデータを生成し修復用のハードディスク装置の領域にデータを修復している状態である。もう1つは、修復が完了し正常状態になっている状態にて、故障が発生したハードディスク装置を新しいハードディスク装置に交換されたのを契機に、本来正常状態だったときの構成に戻すため、修復で使用しているハードディスク装置の修復用の領域を、交換された新しいハードディスク装置のユーザが使用する領域に書き戻す処理である。
【0025】
未接続状態は、RAIDを構成している論理ユニットが存在しない状態を示す。上位からのアクセス命令が論理ユニット#0 114に発行された時に、RAID3を構成しているSCSIバス117aに接続されるハードディスク装置105で故障が発生し縮退状態になった場合について以下に説明する。
【0026】
まず、故障が発生したハードディスク装置が接続されているSCSIバス以外から、修復に使用できるハードディスク装置を検索するする処理を行う。故障が発生したSCSIバスと違うSCSIバス上につながっているハードディスク装置の領域を割り当てる様にするのは、同一SCSIバス上のハードディスク装置に修復を行った場合、1台のハードディスク装置上にRAID3を構成している3台のハードディスク装置の内2台分のエリアが存在することになり、その1台のハードディスク装置が故障になったときは修復不可能な状態が発生するため、この状態に陥らないようにするためである。
【0027】
故障を起こしたハードディスク装置と違うSCSIバス117bに接続されているハードディスク装置をチェックし修復に用いる領域が使用中でないかをチェックする。RAID3を構成しているディスクアレイが3組以上ある場合には、既に他の修復用領域として使用中の可能性があるため、使用したい領域のチェックが必要である。
【0028】
論理ユニット#1 115のSCSIバス117b側に接続されているハードディスク装置110に修復で使用可能な領域110bが存在する。そこで、ディスクアレイ制御部102内にあるRAIDを構成しているハードディスク装置の構成管理テーブル情報を、論理ユニット#0を構成しているのは、ハードディスク装置106,107のユーザ領域106a,107aと、ハードディスク装置110の未使用領域110bを使用して構成しているように情報を更新する。
そして修復可能な領域110bに修復を開始する。
【0029】
修復を開始した後に、上位装置101からアクセス要求があった場合には、ディスクアレイ制御部102内にあるRAID3ディスクアレイを構成しているハードディスク装置の構成管理テーブル情報を元にハードディスク装置へのアクセスを行う。
【0030】
この時の処理の流れを以下に説明する。現在修復中の論理ユニット#0 に上位装置101から書き込み要求があった場合にディスクアレイ制御部102内のRAIDを構成しているハードディスク構成の管理テーブル情報を元にハードディスク装置106,107,110のアクセス領域106a,107a,110bにアクセスを行うようにする。修復中のハードディスク装置110に書き込む時には、ディスクアレイの構成を管理しているディスクアレイ制御部102内でのRAIDを構成しているハードディスク装置の管理テーブル情報を元にアクセスするハードディスク装置の領域113bを判断し、本来ハードディスク装置107aにアクセスするアドレスにユーザ使用領域分のアドレスを加算したアドレスにて、領域110bにアクセスを行う。
【0031】
故障が発生したハードディスク装置105が正常なハードディスク装置に交換された場合には、修復で使用したハードディスク装置110の領域110bを故障前の構成状態に戻す処理を行う。ハードディスク装置110bの領域をハードディスク装置105aに戻した後は、ディスクアレイ制御部102内のRAIDを構成しているハードディスク装置の構成管理テーブル情報を、論理ユニット#0を構成しているのは3台のハードディスク装置105,106,107で、修復に使用したハードディスク装置110の領域110bは未使用領域となるように更新する。
【0032】
RAID3を構成しているハードディスク装置にて故障が発生し、アレイの状態が縮退状態になった時から修復を経て元の構成状態に戻る間、修復に使用しているハードディスク装置のアクセス制御を変更する。これは、修復領域として使用されるハードディスク装置では通常使用している容量の2台分のアクセスが発生し、ハードディスク装置の負荷が増えていることと、修復には別のRAIDを構成している論理ユニットのハードディスク装置を使用することから、修復で使用されるハードディスク装置が接続されているSCSIバスでは、本来RAIDを構成している論理ユニットと、故障がおきたハードディスク装置で構成された論理ユニットのアクセスが発生するため、修復で使用しているハードディスク装置が接続されているSCSIバス上の負荷が増えた状態になっている。このことによる性能低下を押さえる目的で先読み制御を行う。
【0033】
図2に示すハードディスク装置へのコマンド発行の流れを示す図を用いて以下に詳細を説明する。
【0034】
ディスクアレイ制御部102より修復中のハードディスク装置113に▲1▼から▲7▼の発行順序にて読み込みコマンドが発行されてきた時のアクセスにて、コマンド実行の流れを説明する。発行されたコマンドで▲1▼、▲2▼、▲4▼、▲6▼については、論理ユニット#2 116へのアクセスで、▲3▼、▲5▼、▲7▼については修復構成の論理ユニットのアクセスである。
【0035】
修復状態のハードディスク装置のアクセスに対しては、ディスクアレイ制御部にてCacheに先読みに使用可能な領域があるかチェックし、領域があれば本来必要なアクセスサイズに対して倍のサイズにてアクセスを行うような制御を行う。
【0036】
アドレス5000を4Kbytes読む場合は、アドレス5000を倍の8Kbytesで読み込むようにする。この場合だと、4Kbytesの先読みを行ったことになる。
【0037】
先読み制御を行った場合には、先読み制御が無い場合にコマンド▲2▼を実行している時間 T2には、コマンド▲2▼はCache Hitをして処理を完了しておりハードディスク装置へのアクセスが発生しないため、修復した領域への別論理ユニットのアクセス要求コマンド▲3▼の処理を行うことが可能となる。
【0038】
このようにハードディスク装置へのコマンド発行処理を減らすことにより、SCSIバス上とハードディスク装置に対して負荷を減らすことを可能としている。
【0039】
【発明の効果】
本発明のディスクアレイ制御装置は、RAIDを構成しているハードディスク装置の故障時に、修復専用にハードディスク装置が必要でなくなり、そのため装置構成で修復時用のハードディスク装置のスペースを必要とせず、さらに修復専用のハードディスク装置を構成するディスクアレイ装置より、安価で同じ機能を持ちあわせることが可能となる。
【0040】
ディスクアレイ装置が修復状態の構成のときに、修復領域を持つハードディスク装置へのアクセス制御を行い、先読みの機能を追加することによる、ディスクアレイ装置の性能低下も軽減することが可能である。
【図面の簡単な説明】
【図1】本発明実施例の構成を示す構成図である。
【図2】本発明実施例のコマンド発行の流れを示す図である。
【符号の説明】
101 上位装置
102 ディスクアレイ制御部
103a、103b、103c SCSI制御部
104 ディスクアレイ装置
105、106、107、108、109、110、111、112、113ハードディスク装置
105a、106a、107a、108a、109a、110a、111a、112a、113a ユーザ使用領域
107b、110b、113b 故障時に使用する未使用領域
114、115、116 論理ユニット[ディスクアレイ(RAID 3)]
117a、117b、117c SCSIバス
Claims (6)
- ユーザが使用する領域と、その領域と同じ容量以上の修復用領域の2つの領域を有する1台のハードディスク装置を含む複数台のハードディスクでRAIDを構成した論理ユニットを複数有するディスクアレイ制御装置であって、
1つの論理ユニットのハードディスク装置の1台に故障が発生した時に、故障したハードディスク装置のデータを他の論理ユニットのハードディスク装置の修復用領域へ自動的に修復することを特徴とするディスクアレイ制御装置。 - 前記他の論理ユニットのハードディスク装置の修復用領域へ自動的に修復する時は、1台のハードディスク装置内の2つの領域をアクセスするために、前記RAIDを構成するハードディスク装置の構成管理テーブルを有し、前記構成管理テーブルの情報を用いて制御を行うことを特徴とする請求項1に記載のディスクアレイ制御装置。
- 前記1つの論理ユニットのハードディスク装置の1台に故障が発生し、論理ユニットの状態が縮退状態になったときから修復を経て元の構成状態に戻る間に、修復で使用される修復用領域を有する前記ハードディスク装置に対して、先読みをするアクセス制御を行い、修復時の構成での上位装置からのアクセスに対する性能低下を軽減させることを特徴とする請求項2に記載のディスクアレイ制御装置。
- 前記RAIDのレベルは、RAID3であることを特徴とする請求項1〜3のいずれかに記載のディスクアレイ制御装置。
- 前記複数台のハードディスク装置は、3台のハードディスク装置であることを特徴とする請求項4に記載のディスクアレイ制御装置。
- 前記3台のハードディスク装置の内の1台にユーザが使用するユーザ領域と同じ容量をもつ未使用領域を有することを特徴とする請求項5に記載のディスクアレイ制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21157199A JP3597086B2 (ja) | 1999-07-27 | 1999-07-27 | ディスクアレイ制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21157199A JP3597086B2 (ja) | 1999-07-27 | 1999-07-27 | ディスクアレイ制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001034424A JP2001034424A (ja) | 2001-02-09 |
JP3597086B2 true JP3597086B2 (ja) | 2004-12-02 |
Family
ID=16607990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21157199A Expired - Fee Related JP3597086B2 (ja) | 1999-07-27 | 1999-07-27 | ディスクアレイ制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3597086B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4831093B2 (ja) * | 2008-02-29 | 2011-12-07 | 日本電気株式会社 | ディスクアレイシステム、ディスクアレイ制御方法およびディスクアレイ制御プログラム |
-
1999
- 1999-07-27 JP JP21157199A patent/JP3597086B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001034424A (ja) | 2001-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3078972B2 (ja) | ディスクアレイ装置 | |
US7330931B2 (en) | Method and system for accessing auxiliary data in power-efficient high-capacity scalable storage system | |
US5566316A (en) | Method and apparatus for hierarchical management of data storage elements in an array storage device | |
US6006342A (en) | Failover and failback system for a direct access storage device | |
US7600152B2 (en) | Configuring cache memory from a storage controller | |
US8024516B2 (en) | Storage apparatus and data management method in the storage apparatus | |
US6061750A (en) | Failover system for a DASD storage controller reconfiguring a first processor, a bridge, a second host adaptor, and a second device adaptor upon a second processor failure | |
JP3742494B2 (ja) | 大容量記憶装置 | |
JP2912802B2 (ja) | ディスクアレイ装置の故障対処方法および装置 | |
US6591335B1 (en) | Fault tolerant dual cache system | |
US6604171B1 (en) | Managing a cache memory | |
US20070220316A1 (en) | Method and Apparatus for Power-Efficient High-Capacity Scalable Storage System | |
US8386837B2 (en) | Storage control device, storage control method and storage control program | |
JPH0619632A (ja) | コンピユータ・システムのストレージ装置及びデータのストア方法 | |
JP2006252126A (ja) | ディスクアレイ装置及びその再構築方法 | |
JPH06202817A (ja) | ディスクアレイ装置及びそのデータ更新方法 | |
CN102164165B (zh) | 一种网络存储系统的管理方法及装置 | |
US8402213B2 (en) | Data redundancy using two distributed mirror sets | |
US20050193273A1 (en) | Method, apparatus and program storage device that provide virtual space to handle storage device failures in a storage system | |
JPH09269871A (ja) | ディスクアレイ装置におけるデータ再冗長化方式 | |
JP2005539303A (ja) | 電力効率高容量なスケーラブルな記憶システムのための方法および装置 | |
US7130973B1 (en) | Method and apparatus to restore data redundancy and utilize spare storage spaces | |
JPH11184643A (ja) | ディスクアレイ装置の管理方法及びプログラムを記録した機械読み取り可能な記録媒体 | |
JP2002297322A (ja) | 冗長性を有するディスク記憶装置 | |
JP3597086B2 (ja) | ディスクアレイ制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040907 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S633 | Written request for registration of reclamation of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313633 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080917 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080917 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090917 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090917 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100917 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110917 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120917 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130917 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |