JP2007323251A - Raid装置における容量拡張方法およびraid装置 - Google Patents
Raid装置における容量拡張方法およびraid装置 Download PDFInfo
- Publication number
- JP2007323251A JP2007323251A JP2006151176A JP2006151176A JP2007323251A JP 2007323251 A JP2007323251 A JP 2007323251A JP 2006151176 A JP2006151176 A JP 2006151176A JP 2006151176 A JP2006151176 A JP 2006151176A JP 2007323251 A JP2007323251 A JP 2007323251A
- Authority
- JP
- Japan
- Prior art keywords
- disk
- group
- raid
- disks
- groups
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 41
- 230000004075 alteration Effects 0.000 abstract 1
- 238000003491 array Methods 0.000 abstract 1
- 238000013507 mapping Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Abstract
【解決手段】図3(a)の状態に図3(b)に示すように、ディスク2−10を追加し、セカンダリのディスク群2−5〜2−8を拡張する(この状態を中間状態という)。この段階ではプライマリのディスク群2−1〜2−4は変更がなく追加されたディスク2−10はミラーリングの関係にない。次に図3(c)に示すように、残りの一本のディスク2−9を追加してプライマリのディスク群2−1〜2−4を拡張し、追加したディスクをミラーリングさせる。このように、LDE処理全体の中間状態として、ディスク上のデータが、ミラーの一方を旧構成で、ミラーの一方を新構成で格納されている状態を作りあげることで、常にディスク上にデータが存在する状況が実現可能となる。
【選択図】 図3
Description
例えばRAID0はデータをブロック単位で分散して格納するストライピング構成を用いたものであり、RAID1は複数のディスクに同一のデータを格納するミラーリング構成を用いたものである。このストライピング構成とミラーリング構成を併用し、ストライピング構成のディスク群からなるプライマリディスク群とセカンダリディスク群の間にミラーリング関係を持たせたRAIDグループを、ここではRAID0+1という。
上記冗長度はユーザのシステム構成等に基づき設定するが、システム運用開始後、冗長度や容量、RAIDレベルを変更したいと場合も生ずる。
システムを停止すれば上記冗長度等の変更は容易に行うことが可能であるが、システムを停止することなく、活性状態(ホストからのI/Oを受け付けながら)で、冗長度や容量、RAIDレベルを変更する技術が従来から種々提案されている(例えば特許文献1、特許文献2等参照)。
より詳細にいうと、まさにWrite中の間は、実際のディスクにどこまで書き込まれたかが判らないため、ディスク上のWriteを要求した領域のデータは信用できないものになっているということである。やむおえない事情で、上記バッファが、停電時にバッテリーバックアップされない場合やハード的なメモリ故障の場合に、上述のディスクへのWriteが失敗すると上記バッファ内のデータが失われる恐れがある。
本発明は上述した従来の問題点を解決するためになされたものであって、本発明の目的は、RAID1あるいはRAID0+1といったミラーリングを行うRAIDグループから、偶数本のディスクを追加し、より容量の大きいRAID0+1への拡張を行うに際し、一時的にもディスク上にデータが存在しない状態をなくしてLDEを実行できるようにすることである。
(1)RAID1あるいはRAID0+1のRAIDグループである、2m本(mは自然数)のディスク群から構成され、m本のディスク群と他のm本のディスク群がミラーリング関係にあり、各m本のディスク群がストライピングされているディスク群からなるRAIDグループを有するRAID装置において、上記2m本のディスク群に2n本(nは自然数)のディスク群を以下のように追加し容量を拡張する。
旧構成のRAIDグループで、プライマリディスク群である上記m本のディスク群に、n本のディスクを追加して、新構成のRAIDグループでミラーリングの関係をもつディスク群の一方になるように処理を実施し、この処理完了後に、上述で処理を実施しなかったセカンダリディスク群であるその他のm本のディスクに、残りのn本のディスク群を追加し、上記プライマリディスク群に対してミラーリング関係を持つようにする。
RAID1あるいはRAID0+1では、ミラーリングしているので、ミラーの一方のデータが無くなってもRAIDグループとしては冗長性を失うだけで、ディスク上データは残っていることになる。
本発明ではこれを利用して、LDE処理全体の中間状態として、ディスク上のデータが、ミラーの一方を旧構成で、ミラーの一方を新構成で格納されている状態を作りあげることで、常にディスク上にデータが存在する状況を実現可能としている。
(2)上記(1)の容量拡張に際し、上記プライマリディスク群と、セカンダリディスク群が、同時に同一の論理ブロックアドレスについて拡張を行わないようにする。
(3)上記(2)において、プライマリディスク群の拡張を追いかけるように、セカンダリディスク群の拡張を行う。
(4)上記(2)において、プライマリディスク群を論理ブロックアドレスの小さい方もしくは大きい方から拡張し、セカンダリディスク群の拡張を、上記とは逆の論理ブロックアドレスが大きい方もしくは小さい方から行う。
(1)容量拡張に際し、LDE処理全体の中間状態として、ディスク上のデータが、ミラーの一方を旧構成で、ミラーの一方を新構成で格納されている状態を作りあげ、常にディスク上にデータが存在する状況を実現可能としているので、停電時にバッテリーバックアップされない場合やハード的なメモリ故障の場合、ディスクへのライトが失敗しても、データが失われることがない。
(2)上記容量拡張に際し、プライマリディスク群と、セカンダリディスク群が、同時に同一の論理ブロックアドレスについて拡張を行わないように、例えばプライマリディスク群の拡張を追いかけるようにセカンダリディスク群の拡張を行うことで、プライマリディスク群とセカンダリディスク群の拡張処理を同時に行うことができ、処理時間を短縮することができる。
同図において、1はRAIDコントローラ、2−1〜2−nはデータなどを記憶するディスクであり、RAIDコントローラ1は直接もしくはネットワーク機器を介してホスト3に接続され、ホスト3からのリード、ライト要求に応じて、大量のデータを高速かつランダムに上記ディスクに読み書きする。
RAIDコントローラ1は、データを読み書きする際に一時的にデータを格納するバッファ1aと、容量拡張時、容量拡張処理を行う容量拡張手段1bを備え、また、RAIDグループの構成情報1cの定義を保持する。なお、図1では本発明に係わる機能構成のみを示しているが、RAIDコントローラのハードウェア構成の詳細については、例えば前記特許文献1などを参照されたい。
例えば、図2(a)に示すように、ミラーリングされた一対のディスク2−1,2−2に2本のディスク2−3,2−4を追加して、がミラーリングされ、ストライピングされた各2本のディスク2−1,2−3および2−2,2−4からなるRAID0+1のRAIDグループを構成する。
あるいは、図2(b)に示すように、RAID0+1のRAIDグループに2本のディスク2−9,2−10を追加して、RAID0+1のRAIDグループを構成する。
図3は本発明の実施例のLDE処理を説明する図である。
図3(a)は、LDE前の状態を示し、プライマリのディスク群2−1〜2−4、およびセカンダリのディスク群2−5〜2−8がそれぞれストライピングされ、ディスク群2−1〜2−4とディスク群2−5〜2−8がミラーリング構成となっている。
この状態から図3(b)に示すように、追加ディスク2本の内、1本のディスク2−10を使って、セカンダリのディスク群2−5〜2−8を拡張する(この状態を中間状態という)。ここで、この段階では、プライマリのディスク群2−1〜2−4は変更がなく、追加されたディスク2−10はミラーリングの関係にない。
次に、図3(c)に示すように、2本の追加ディスクの内の残りの一本のディスク2−9を追加してプライマリのディスク群2−1〜2−4を拡張し、追加したディスクをミラーリングさせる。
まず、構成定義をセカンダリ拡張中の状態に変更する(ステップS1)。ついで、進捗を確認し(ステップS2)、拡張前の領域があれば、プライマリのディスク群2−1〜2−4から旧構成のマッピングでリードし、セカンダリのディスク群2−5〜2−8へ新構成のマッピングでライトする(ステップS3,S4)。
ついで進捗を更新し(ステップS5)、ステップS2に戻り、拡張前の領域がなくなるまでこの処理を繰り返す。
上記処理が最後まで終了したら、ステップS6に行き、構成定義をプライマリ拡張中の状態に変更する。ついで、進捗を確認し(ステップS7)、拡張前の領域があれば、セカンダリのディスク群2−5〜2−8から新構成のマッピングでリードし、プライマリのディスク群2−1〜2−4へ新構成のマッピングでライトする(ステップS8,S9)。ついで進捗を更新し(ステップS10)、ステップS7に戻り、拡張前の領域がなくなるまでこの処理を繰り返す。最後まで終了したら、構成定義を拡張語の状態に変更し、処理を終わる。
この実施例の概要は、ミラーリングの関係をもつディスク群の一方と他方が、同時に同一LBA(論理ブロックアドレス)について拡張を行わないように管理しながら、両ディスク群共、平行して拡張していくという方式である。
以下では、「後追い方式」と「前後方式」の二つを述べる。
プライマリのディスク群の拡張を追いかけるようにセカンダリのディスク群の拡張を行うようにし、これら両者が同一のLBA領域を処理しないように管理する方式である。図5に後追い方式による拡張処理の概要を示す。図5では、ミラーリング構成のディスク2−1,2−2からなるRAID1に2本のディスク2−3,2−4を追加してRAID0+1を構成する場合について示している。
まず、図5(a)に示すように追加ディスク2本の内、1本のディスク2−4を追加し領域R1を拡張する(領域R1は中間状態)。この段階では、ディスク2−1は変更がない。
さらに、上記と同様、図5(c)に示すように、追加されたディスク2−4の上記拡張された領域R2と、追加したディスク2−3の領域R2’をミラーリングさせる(領域R2,R2’は最終状態)。また、これと同時に、追加されたディスク2−4ついて領域R3を拡張する(領域R3は中間状態)。
以下、全ての領域の拡張処理が終わるまで、同様の処理を行う。
一つ目の方式は、あるLBA範囲についてプライマリのディスク群の拡張が終了した後で、プライマリとして、次のLBA範囲に処理を移るのと同時に、プライマリのディスク群で拡張が終了したのと同じLBA範囲についてセカンダリの拡張を開始させる方式である。
二つ目の方式は、プライマリのディスク群の拡張とセカンダリのディスク群の拡張についてそれぞれが進捗を独自に管理して平行に拡張を行っておくが、プライマリが拡張中のLBA領域についてセカンダリでも拡張を開始しようとした時に、セカンダリの処理開始を一定時間待ち合わせるという方式である。
この場合、待ち合わせた後で、また、該当するLBA領域がプライマリのディスク群で拡張中のかどうかを調べ、処理中であれば一定時間の待ち合わせを行い、処理中でなければセカンダリのディスク群の処理を開始させる。
プライマリのディスク群の拡張をLBAの小さい方から大きい方へ行い、セカンダリのディスク群の拡張をこの逆でLBAの大きい方から小さい方へ行う方式である。
図6に前後方式による拡張処理の概要を示す。図6では、図5と同様、ミラーリング構成のディスク2−1,2−2からなるRAID1に2本のディスク2−3,2−4を追加してRAID0+1を構成する場合について示している。
まず、図6(a)に示すように追加ディスク2本の内、1本のディスク2−4を追加し、LBAの大きな方から領域R1を拡張する(領域R1は中間状態)。この段階では、ディスク2−1は変更がない。
さらに、上記と同様、図6(c)に示すように、追加されたディスク2−3の上記拡張された領域R2と、追加したディスク2−4の領域R2’をミラーリングさせる(領域R2,R2’は最終状態)。また、これと同時に、追加されたディスク2−3について、LBAの大きな方から領域R3を拡張する(領域R3は中間状態)。
以下、全ての領域の拡張処理が終わるまで、同様の処理を行う。
なお、この場合、RAIDグループの中点付近でプライマリとセカンダリのディスク群が同一LBA範囲を処理しようとすることがあるので、プライマリとセカンダリのどちらかが処理しようとしているLBA範囲が、もう一方で拡張中であった場合には、それが終わるまで待ち合わせるという処理が必要となる。
1a バッファ
1b 容量拡張手段
1c 構成情報
2−1〜2−n ディスク
3 ホスト
Claims (5)
- 2m本(mは自然数)のディスク群から構成され、m本のディスク群と他のm本のディスク群がミラーリング関係にあり、各m本のディスク群がストライピングされているディスク群からなるRAIDグループに、2n(nは自然数)のディスク群を追加して、2(m+n)本のディスクから構成され、m+n本のディスク群と他のm+n本のディスク群がミラーリング関係にあり、各m+n本のディスク群がストライピングされているディスク群からなるRAIDグループに変換するRAID装置における容量拡張方法であって、
上記2m本のディスク群のうちのm本のディスク群にn本のディスクを追加し、n本のディスクにより容量を拡張する第1のステップと、
上記2m本の内の残りのm本のディスク群に、残りのn本のディスクを追加し、上記容量が拡張されたディスク群とミラーリング関係を持つようにする第2のステップを有することを特徴とするRAID装置における容量の拡張方法。 - 2m本(mは自然数)のディスク群から構成され、m本のディスク群と他のm本のディスク群がミラーリング関係にあり、各m本のディスク群がストライピングされているディスク群からなるRAIDグループを有するRAID装置であって、
上記RAID装置は、ディスク容量を拡張するための容量拡張手段を備え、
上記容量拡張手段は、上記2m本のディスク群に2n本(nは自然数)のディスク群を追加する際、まず、プライマリディスク群である上記m本のディスク群に、n本のディスクを追加してプライマリディスク群のディスク容量を拡張し、
セカンダリディスク群であるその他のm本のディスクに、残りのn本のディスク群を追加し、上記プライマリディスク群に対してミラーリング関係を持つようにする
ことを特徴とするRAID装置。 - 上記容量拡張手段は、上記プライマリディスク群と、セカンダリディスク群が、同時に同一の論理ブロックアドレスについて拡張を行わないようにした
ことを特徴とする請求項2のRAID装置。 - プライマリディスク群の拡張を追いかけるように、セカンダリディスク群の拡張を行う
ことを特徴とする請求項3のRAID装置。 - プライマリディスク群を論理ブロックアドレスの小さい方もしくは大きい方から拡張し、セカンダリディスク群の拡張を、上記とは逆の論理ブロックアドレスが大きい方もしくは小さい方から行う
ことを特徴とする請求項3のRAID装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006151176A JP4799277B2 (ja) | 2006-05-31 | 2006-05-31 | Raid装置における容量拡張方法およびraid装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006151176A JP4799277B2 (ja) | 2006-05-31 | 2006-05-31 | Raid装置における容量拡張方法およびraid装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007323251A true JP2007323251A (ja) | 2007-12-13 |
JP4799277B2 JP4799277B2 (ja) | 2011-10-26 |
Family
ID=38856019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006151176A Expired - Fee Related JP4799277B2 (ja) | 2006-05-31 | 2006-05-31 | Raid装置における容量拡張方法およびraid装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4799277B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009163719A (ja) * | 2007-12-31 | 2009-07-23 | Armorlink Sh Corp | Raidレベルマイグレーション方法とシステム |
JP2010211420A (ja) * | 2009-03-09 | 2010-09-24 | Fujitsu Ltd | ストレージ管理装置、ストレージ管理方法およびストレージシステム |
US8074106B2 (en) | 2008-09-08 | 2011-12-06 | Hitachi, Ltd. | Storage control device and RAID group extension method |
US20120011332A1 (en) * | 2009-03-27 | 2012-01-12 | Fujitsu Limited | Data processing apparatus, method for controlling data processing apparatus and memory control apparatus |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004213064A (ja) * | 2002-12-26 | 2004-07-29 | Fujitsu Ltd | Raid装置及びその論理デバイス拡張方法 |
JP2005107841A (ja) * | 2003-09-30 | 2005-04-21 | Toshiba Corp | ディスクアレイコントローラ及び容量拡張方法 |
-
2006
- 2006-05-31 JP JP2006151176A patent/JP4799277B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004213064A (ja) * | 2002-12-26 | 2004-07-29 | Fujitsu Ltd | Raid装置及びその論理デバイス拡張方法 |
JP2005107841A (ja) * | 2003-09-30 | 2005-04-21 | Toshiba Corp | ディスクアレイコントローラ及び容量拡張方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009163719A (ja) * | 2007-12-31 | 2009-07-23 | Armorlink Sh Corp | Raidレベルマイグレーション方法とシステム |
US8074106B2 (en) | 2008-09-08 | 2011-12-06 | Hitachi, Ltd. | Storage control device and RAID group extension method |
US8312315B2 (en) | 2008-09-08 | 2012-11-13 | Hitachi, Ltd. | Storage control device and RAID group extension method |
JP2010211420A (ja) * | 2009-03-09 | 2010-09-24 | Fujitsu Ltd | ストレージ管理装置、ストレージ管理方法およびストレージシステム |
JP4719802B2 (ja) * | 2009-03-09 | 2011-07-06 | 富士通株式会社 | ストレージ管理装置、ストレージ管理方法およびストレージシステム |
US8266475B2 (en) | 2009-03-09 | 2012-09-11 | Fujitsu Limited | Storage management device, storage management method, and storage system |
US20120011332A1 (en) * | 2009-03-27 | 2012-01-12 | Fujitsu Limited | Data processing apparatus, method for controlling data processing apparatus and memory control apparatus |
US8762673B2 (en) * | 2009-03-27 | 2014-06-24 | Fujitsu Limited | Interleaving data across corresponding storage groups |
Also Published As
Publication number | Publication date |
---|---|
JP4799277B2 (ja) | 2011-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5031341B2 (ja) | 記憶システム及びデータ管理方法 | |
US7127557B2 (en) | RAID apparatus and logical device expansion method thereof | |
JP2000508456A (ja) | 移動されたデータの完全性を維持しながらraidセットにおけるドライブ数の拡張 | |
JPH04205519A (ja) | データ復元中のライト方法 | |
JP2001356970A5 (ja) | ||
US10095585B1 (en) | Rebuilding data on flash memory in response to a storage device failure regardless of the type of storage device that fails | |
US20080091916A1 (en) | Methods for data capacity expansion and data storage systems | |
JP4491330B2 (ja) | ディスクアレイ装置とそのデータのリカバリ方法およびデータリカバリプログラム | |
JP4799277B2 (ja) | Raid装置における容量拡張方法およびraid装置 | |
JP2004348723A (ja) | Raid−1システムにおいてスペア処理するためのシステムおよび方法 | |
JP4788492B2 (ja) | ストレージ装置の容量拡張方法、プログラム、およびストレージ装置 | |
US7024585B2 (en) | Method, apparatus, and program for data mirroring with striped hotspare | |
JP2006252165A (ja) | ディスクアレイ装置、及びコンピュータシステム | |
JP6052288B2 (ja) | ディスクアレイ制御装置、ディスクアレイ制御方法及びディスクアレイ制御プログラム | |
JP4794357B2 (ja) | Raid装置におけるraidレベル変換方法およびraid装置 | |
JP2005099995A (ja) | 磁気ディスク装置のディスク共有方法及びシステム | |
JP2005107839A (ja) | アレイコントローラ及びディスクアレイ再構築方法 | |
JP5181795B2 (ja) | Raidシステム、及びエラーセクタの修復方法 | |
TW201339827A (zh) | 儲存系統和儲存系統的操作方法 | |
JP5505329B2 (ja) | ディスクアレイ装置及びその制御方法 | |
JP2005107675A (ja) | ディスクアレイコントローラ及びディスクドライブの複製方法 | |
JP2003108316A (ja) | ディスクアレイ装置およびホットスペア制御方法 | |
JP2004185256A (ja) | Raidシステム | |
JP2005346212A (ja) | ディスクアレイコントローラおよび情報処理装置 | |
JP4831093B2 (ja) | ディスクアレイシステム、ディスクアレイ制御方法およびディスクアレイ制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110802 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110802 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4799277 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |