JP2015191594A - ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法 - Google Patents
ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法 Download PDFInfo
- Publication number
- JP2015191594A JP2015191594A JP2014070146A JP2014070146A JP2015191594A JP 2015191594 A JP2015191594 A JP 2015191594A JP 2014070146 A JP2014070146 A JP 2014070146A JP 2014070146 A JP2014070146 A JP 2014070146A JP 2015191594 A JP2015191594 A JP 2015191594A
- Authority
- JP
- Japan
- Prior art keywords
- storage device
- stripe
- disk
- data
- configuration data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
- G06F11/1092—Rebuilding, e.g. when physically replacing a failing disk
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
【解決手段】ストレージ制御装置は、冗長化データを構成する各構成データが並列して格納装置群の各格納装置に格納される単位であるストライプ単位で構成データが分散して格納される格納装置群のうち、いずれかの格納装置を除く対象格納装置群から取得した複数のストライプのそれぞれについて、構成データの復元を行なう再構築処理を複数起動させ、再構築処理毎に、対象格納装置群の各格納装置へのアクセス負荷に応じて、次に再構築処理を行うストライプを決定し、再構築処理毎に、対象格納装置群から、決定したストライプに対応する構成データを取得し、再構築処理を実行して、取得した構成データから、除かれた格納装置に格納された構成データを復元することにより、上記課題の解決を図る。
【選択図】図1
Description
リビルド技術の一例として、図2に示すリビルド技術がある。図2(A)は、RAID1において、ミラーリングされた2つのディスクの1つが故障した場合のリビルドを説明するための図である。図2(B)は、RAID5において、いずれかのディスクが故障した場合のリビルドを説明するための図である。
図8は、本実施形態におけるストレージシステムの一例を示す。ストレージシステム11は、複数のディスク22を搭載したディスク記憶システムである。ホストコンピュータ(以下、ホストと称する)24からディスク22へのアクセスに関して、冗長化のために、各ディスク22に対して、2本のアクセスパスが存在している。またデータ自体についても、RAID技術を用いて複数台のディスクにデータが分散されて、冗長化した状態で保存されている。
DE21は、複数のディスク22を格納するコンポーネントであり、冗長性を考慮したRAID構成を有する。なお、ディスク22は、ハードディスクドライブ(HDD)に限らず、例えばSSD(Solid State Drive)や、光磁気ディスク等であってもよい。また、本実施形態では、記憶装置の一例として、ディスク22を用いたが、これに限定されず、ランダムアクセス及びシーケンシャルアクセスのいずれのアクセス方法も可能な記憶装置であればよい。
ユーザの指示に基づいて、RAID作成、ボリューム作成の順に操作がなされると、高速リビルドが可能なデータ配置が作成され、ホストI/Oが受付可能となる。その後、RAIDを構成しているディスクのうちの1つが故障すると、リビルド動作が開始される。
高速リビルドが可能なデータ分散配置を行うRAIDは、新規RAID種として定義する。新規RAID種をRAID5−FR(FR:Fast Rebuild)と呼称する。ユーザが、RAID種としてRAID5−FRを指定し、RAIDグループを構成するディスクを選択して作成指示することで、高速リビルドが可能なRAIDグループが作成される。
ユーザが、上記(1)で作成したRAIDグループに対して、ボリュームサイズを指定した上でボリューム作成指示を出すと、CM12において、指定したボリュームサイズに基づいて、ボリュームフォーマットが実行される。
ボリューム作成により、高速リビルドの為のデータ分散配置が行われると、CM12は、ディスク22に対する、ホスト24からの入力出(I/O)アクセスを受け付けることができる。
図12は、本実施形態におけるリビルド起動処理フローを示す。RAID5−FRを形成するディスクのうち、1つのディスクの故障が発生し、リビルド制御部16がその故障によるエラー情報を検出すると、リビルド制御部16はリビルドを開始する。リビルドの起動処理としては、図12のフローで各ストライプにおける故障ディスク上のデータの復元を行うリビルド個別処理が並列で起動させる。
ディスクグループ23の末尾まで復元が完了するまで、S11〜S15の処理が繰り返される(S16)。
なお、ここでは、分散値を評価値としたが、これに限定されず、標準偏差等の他の統計的方法を用いて算出した値を評価値としてもよい。
次に、ガロア拡大体の理論によって事前に作成される変換テーブル10について説明する。例えば、k(k:整数)本のディスクの集合(ディスクプール)にl(l:整数)本のメンバディスクで構成されるRAIDグループをm(m:整数)個と、HSをn(n:整数)本分散させることを考える。
RAIDグループのディスク数が素数の場合は、ガロア体に基づいてデータ配置方法を決定することで、少ないストライプのパターン数で分散配置が可能である。整数を素数(例えば5)で除算した余りの集合φ∈{0,1,2,3,4}は、要素が有限で四則演算が閉じた集合(ガロア体)となっている。
例えば、
4+4= 8 mod 5=3∈ φ
4×3=12 mod 5=2∈ φ
図17(A)にmod(5)加算の表、図17(B)にmod(5)積算の表を示す。ここで、図17(A)のmod(5)加算の表に注目する。シフト#nと表記した列が各ストライプのデータ配置に相当し、行が物理ディスクに相当する。各物理ディスクに着目して見ると、どの行についても各ストライプのデータ配置mod(5)はかぶらないことがわかる。つまり、どのシフト(ストライプ)間でも、データ配置がかぶることはない。
以上、5本のディスクに対してデータ配置の表を作成する手順を説明した。また、整数を任意の素数(k)で除算した余りの集合φ∈{0,1,2,3,k−1}についても同じように加算、乗算の表を作成し、ストライプのパターンとシフトを組み合わせてディスクの分散配置のテーブルを作成することができる。
上記ではガロア体を用いたデータ分散について記述したが、この方式は素数のディスク数のディスクプールにしか適用できない。その欠点を補うため、「ガロア拡大体」によるデータ配置を行うことで、素数のべき乗のディスク数のディスクプールにおいてもデータ分散を実現する。
原始多項式:f(α)=α2 +α +1
上記に基づいて、データ配置を求めると、図22(A)に示すように加算の表及び図22(B)に示すように積算の表が得られる。
2 ストレージ制御装置
3 起動部
4 決定部
5 実行部
6 格納装置群
6a,6b 格納装置
6c 対象格納装置群
10 変換テーブル
11 ストレージシステム
12 CM
13 CA
14 CPU
15 データ復元部
16 リビルド制御部
17 コマンド発行制御部
18 記憶部
19 DA
20 RT
21 DE
22 ディスク
23 RAIDグループ
24 ホスト
Claims (7)
- 冗長化されたデータを構成する構成データが並列して格納装置群の各格納装置に格納される単位であるストライプ単位で該構成データを分散して格納する該格納装置群のうち、いずれかの格納装置を除く対象格納装置群から取得した複数のストライプのそれぞれについて、該構成データの復元を行なう再構築処理を複数起動させる起動部と、
再構築処理毎に、前記対象格納装置群の各格納装置へのアクセス負荷に応じて、次に該再構築処理を行うストライプを決定する決定部と、
前記再構築処理毎に、前記対象格納装置群から、決定した該ストライプに対応する構成データを取得し、前記再構築処理を実行して、取得した該構成データから、除かれた前記格納装置に格納された構成データを復元する実行部と、
を備えることを特徴とするストレージ制御装置。 - 前記決定部は、前記再構築処理毎に、前記対象格納装置群の各格納装置へのアクセス数に基づいて算出した該各格納装置へのアクセス負荷に応じて、次に該再構築処理を行うストライプを決定する
ことを特徴とする請求項1に記載のストレージ制御装置。 - 前記決定部は、再構築処理毎に、前記対象格納装置群に含まれる各格納装置に対するアクセス数に基づいて、前記対象格納装置群に対するアクセス数の分散値または標準偏差を算出し、該分散値または該標準偏差に応じて次に該再構築処理を行うストライプを決定する
ことを特徴とする請求項2に記載のストレージ制御装置。 - 前記各格納装置は、前記ストライプに対応する前記構成データを格納する第1領域、または、前記ストライプに対応する、該冗長化データの復元の際に用いる第2領域を含み、
前記第1領域と前記第2領域は、前記ストライプと前記格納装置との論理的な組み合わせから、実際に格納する格納装置を特定する格納先特定情報に基づいて、ストライプ毎に分散されて、前記格納装置群の各格納装置に保持されている
ことを特徴とする請求項1〜3のうちいずれか1項に記載のストレージ制御装置。 - 前記格納先特定情報は、ガロア理論またはガロア拡大理論に基づいて作成されている
ことを特徴とする請求項4に記載のストレージ制御装置。 - コンピュータに、
冗長化されたデータを構成する各構成データが並列して格納装置群の各格納装置に格納される単位であるストライプ単位で該構成データを分散して格納する該格納装置群のうち、いずれかの格納装置を除く対象格納装置群から取得した複数のストライプのそれぞれについて、該構成データの復元を行なう再構築処理を複数起動し、
再構築処理毎に、前記対象格納装置群の各格納装置へのアクセス負荷に応じて、次に該再構築処理を行うストライプを決定し、
前記再構築処理毎に、前記対象格納装置群から、決定した該ストライプに対応する構成データを取得し、前記再構築処理を実行して、取得した該構成データから、除かれた前記格納装置に格納された構成データを復元する
処理を実行させることを特徴とするストレージ制御プログラム。 - コンピュータが、
冗長化されたデータを構成する各構成データが並列して格納装置群の各格納装置に格納される単位であるストライプ単位で該構成データを分散して格納する該格納装置群のうち、いずれかの格納装置を除く対象格納装置群から取得した複数のストライプのそれぞれについて、該構成データの復元を行なう再構築処理を複数起動し、
再構築処理毎に、前記対象格納装置群の各格納装置へのアクセス負荷に応じて、次に該再構築処理を行うストライプを決定し、
前記再構築処理毎に、前記対象格納装置群から、決定した該ストライプに対応する構成データを取得し、前記再構築処理を実行して、取得した該構成データから、除かれた前記格納装置に格納された構成データを復元する
ことを特徴とするストレージ制御方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014070146A JP6273970B2 (ja) | 2014-03-28 | 2014-03-28 | ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法 |
EP15158996.7A EP2924577A1 (en) | 2014-03-28 | 2015-03-13 | Storage control apparatus, storage control program, and storage control method |
US14/660,983 US9524213B2 (en) | 2014-03-28 | 2015-03-18 | Storage control apparatus, recording medium having stored therein storage control program and storage control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014070146A JP6273970B2 (ja) | 2014-03-28 | 2014-03-28 | ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015191594A true JP2015191594A (ja) | 2015-11-02 |
JP6273970B2 JP6273970B2 (ja) | 2018-02-07 |
Family
ID=52692466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014070146A Active JP6273970B2 (ja) | 2014-03-28 | 2014-03-28 | ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9524213B2 (ja) |
EP (1) | EP2924577A1 (ja) |
JP (1) | JP6273970B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018185757A (ja) * | 2017-04-27 | 2018-11-22 | 富士通株式会社 | ストレージ制御装置、ストレージ制御方法、およびストレージ制御プログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110058960B (zh) * | 2018-01-18 | 2023-05-16 | 伊姆西Ip控股有限责任公司 | 用于管理存储系统的方法、设备和计算机程序产品 |
CN109918225B (zh) * | 2019-02-18 | 2023-05-09 | 麒麟软件有限公司 | 基于飞腾平台的raid6数据恢复优化方法 |
US11592988B2 (en) * | 2021-01-12 | 2023-02-28 | EMC IP Holding Company LLC | Utilizing a hybrid tier which mixes solid state device storage and hard disk drive storage |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100115198A1 (en) * | 2008-10-31 | 2010-05-06 | Martin Jess | System and method for loose coupling between raid volumes and drive groups |
US8099623B1 (en) * | 2008-10-08 | 2012-01-17 | Netapp, Inc. | Efficient distributed hot sparing scheme in a parity declustered RAID organization |
US20140025990A1 (en) * | 2012-07-23 | 2014-01-23 | Hitachi, Ltd. | Storage system and data management method |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000276305A (ja) | 1999-03-23 | 2000-10-06 | Nec Corp | ディスクアレイ装置 |
JP3991947B2 (ja) | 2003-07-17 | 2007-10-17 | 日本電気株式会社 | 2種類のパリティと複数のデータ復旧方式とを有するディスクアレイ装置 |
US20060123312A1 (en) * | 2004-11-19 | 2006-06-08 | International Business Machines Corporation | Method and system for increasing parallelism of disk accesses when restoring data in a disk array system |
JP2006260446A (ja) | 2005-03-18 | 2006-09-28 | Hitachi Ltd | ディスクアレイ装置 |
US8726070B2 (en) * | 2010-09-27 | 2014-05-13 | Dell Products L.P. | System and method for information handling system redundant storage rebuild |
US9292389B2 (en) * | 2014-01-31 | 2016-03-22 | Google Inc. | Prioritizing data reconstruction in distributed storage systems |
-
2014
- 2014-03-28 JP JP2014070146A patent/JP6273970B2/ja active Active
-
2015
- 2015-03-13 EP EP15158996.7A patent/EP2924577A1/en not_active Withdrawn
- 2015-03-18 US US14/660,983 patent/US9524213B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8099623B1 (en) * | 2008-10-08 | 2012-01-17 | Netapp, Inc. | Efficient distributed hot sparing scheme in a parity declustered RAID organization |
US20100115198A1 (en) * | 2008-10-31 | 2010-05-06 | Martin Jess | System and method for loose coupling between raid volumes and drive groups |
WO2010051002A1 (en) * | 2008-10-31 | 2010-05-06 | Lsi Corporation | A loose coupling between raid volumes and drive groups for improved performance |
JP2012507786A (ja) * | 2008-10-31 | 2012-03-29 | エルエスアイ コーポレーション | 性能改善のためのraidボリュームとドライブ・グループとの間の疎結合 |
US20140025990A1 (en) * | 2012-07-23 | 2014-01-23 | Hitachi, Ltd. | Storage system and data management method |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018185757A (ja) * | 2017-04-27 | 2018-11-22 | 富士通株式会社 | ストレージ制御装置、ストレージ制御方法、およびストレージ制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20150278020A1 (en) | 2015-10-01 |
EP2924577A1 (en) | 2015-09-30 |
JP6273970B2 (ja) | 2018-02-07 |
US9524213B2 (en) | 2016-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10210045B1 (en) | Reducing concurrency bottlenecks while rebuilding a failed drive in a data storage system | |
CN107817952B (zh) | 存储系统 | |
US9552258B2 (en) | Method and system for storing data in raid memory devices | |
US8839028B1 (en) | Managing data availability in storage systems | |
US9063910B1 (en) | Data recovery after triple disk failure | |
JP5256149B2 (ja) | Hdd障害からの高速データ回復 | |
KR101307953B1 (ko) | Raid 그룹의 여러 스트라이핑을 갖는 메모리 및 그 수행방법 | |
JP6039699B2 (ja) | ストレージシステム及びデータ管理方法 | |
US20190129614A1 (en) | Load Balancing of I/O by Moving Logical Unit (LUN) Slices Between Non-Volatile Storage Represented by Different Rotation Groups of RAID (Redundant Array of Independent Disks) Extent Entries in a RAID Extent Table of a Mapped RAID Data Storage System | |
WO2016090541A1 (zh) | 数据存储系统和数据存储方法 | |
US10564865B2 (en) | Lockless parity management in a distributed data storage system | |
US10678470B2 (en) | Computer system,control method for physical storage device,and recording medium | |
WO2016142998A1 (ja) | 計算機システム | |
JP2018508073A (ja) | データ除去、割り当て、及び再構築 | |
JP6273970B2 (ja) | ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法 | |
JP6515458B2 (ja) | ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法 | |
US20200034235A1 (en) | Managing mapped raid extents in data storage systems | |
US20150154075A1 (en) | Storage system and method for controlling storage system | |
US20220027070A1 (en) | Storage system and storage management method | |
US10977130B2 (en) | Method, apparatus and computer program product for managing raid storage in data storage systems | |
JP6807457B2 (ja) | ストレージシステム及びストレージシステムの制御方法 | |
US11880278B2 (en) | Storage system and storage administration method | |
US11467904B2 (en) | Storage system and control method of the same | |
US20220283938A1 (en) | Storage system and storage management method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6273970 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |