JP6260193B2 - ストレージシステム、及びストレージプログラム - Google Patents
ストレージシステム、及びストレージプログラム Download PDFInfo
- Publication number
- JP6260193B2 JP6260193B2 JP2013218706A JP2013218706A JP6260193B2 JP 6260193 B2 JP6260193 B2 JP 6260193B2 JP 2013218706 A JP2013218706 A JP 2013218706A JP 2013218706 A JP2013218706 A JP 2013218706A JP 6260193 B2 JP6260193 B2 JP 6260193B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- disk
- parity
- disks
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0689—Disk arrays, e.g. RAID, JBOD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
- G06F11/1088—Reconstruction on already foreseen single or plurality of spare disks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/0644—Management of space entities, e.g. partitions, extents, pools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2211/00—Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
- G06F2211/10—Indexing scheme relating to G06F11/10
- G06F2211/1002—Indexing scheme relating to G06F11/1076
- G06F2211/1061—Parity-single bit-RAID4, i.e. RAID 4 implementations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Description
図2は、実施形態1に係る情報処理システムの構成の一例を示す。図2において、情報処理システムは、クライアントサーバ21、及び複数の管理サーバ22(22a〜22c)を含む。クライアントサーバ21は複数の管理サーバ22とネットワーク又はバスを介して接続される。そして各管理サーバ22には、複数のディスク23(23a〜23l)が接続されており、各管理サーバ22によりディスクに対するデータの入出力が行われる。
次に、管理サーバ22の構成について説明する。図6は、管理サーバ22のハードウェア構成の一例を示す。
(1)記憶装置403に予めインストールされている。
(2)着脱可能記憶媒体450により提供される。
(3)プログラムサーバ(図示せず)から通信インターフェース405を介して提供される。
実施形態2では、各ローカルパリティの計算範囲に含まれるデータディスクの数(計算範囲のサイズ)が均一となるように構成される。これにより、故障したデータディスクのデータを復旧する際に、どのローカルパリティから復旧する場合でも、復旧オーバヘッドが均一となる。よって、ワーストケースで見積もったRTO(Recovery Time Objective)を最小にすることができる。RTOは、ディスクが故障してから、復旧が完了するまでにかかる時間の目標値である。
実施形態3では、ローカルパリティは、計算範囲に含まれるすべてのデータディスクが互いに異なるように、複数のグループに分類される。また、データディスクのいずれも、各グループに含まれるローカルパリティの計算範囲のいずれかに含まれるように、ローカルパリティは分類される。
実施形態4では、ディスクアレイに含まれる全てのローカルパリティの計算範囲が等間隔でずれるように構成される。すなわち、全てのローカルパリティの計算範囲の最初のデータディスクが、(データディスク数)/(ローカルパリティ数)だけずらすように構成される。尚、kがpで割り切れる場合は、パリティの計算範囲の開始位置をデータディスク上で等間隔に配置されるが、そうでない場合は、k/pの値の前後の整数を使用し、ほぼ等間隔を満たすように配置される。例えば、k=10、p=6の場合は、kがpで割り切れないため(k/p=1.67)、開始位置の間隔を1または2とする。
故障したディスク数がローカルパリティの数より少ない場合、復旧に使用するローカルパリティの組み合わせには任意性が生じる。実施形態5では、復旧に使用するローカルパリティの組み合わせの選択において、組み合わせに含まれる全てのローカルパリティの計算範囲に含まれるデータディスクの集合としての和が最小になるように、組み合わせが選択される。
2 データディスク
3 パリティディスク
4 復元部
21 クライアントサーバ
22 管理サーバ
23 ディスク
31 制御部
32 復元部
33 パリティ生成部
34 記憶部
Claims (7)
- 情報を格納する複数のデータディスクと、
前記複数のデータディスクのうちの一部を含むディスクグループに対応し、該対応するディスクグループに含まれる前記データディスクのデータに基づいて生成されたパリティ情報を格納するパリティディスクを備え、
前記データディスクのいずれかは、複数の前記ディスクグループに含まれ、
前記複数のパリティディスクは、各パリティグループ内の任意のパリティディスクの対が、前記対応するディスクグループに同じデータディスクを含まないように、複数の該パリティグループに分類され、
前記複数のデータディスクのいずれも、前記パリティグループのそれぞれに含まれる前記パリティディスクに対応する前記ディスクグループのいずれかに含まれる
ことを特徴とするストレージシステム。 - 前記ディスクグループ間において、該ディスクグループに含まれる前記データディスクの数が等しい
ことを特徴とする請求項1に記載のストレージシステム。 - 前記データディスクのそれぞれはストライプのデータの格納順に昇順で識別番号が対応付けられており、前記パリティディスクのそれぞれに対応する前記ディスクグループに含まれる前記データディスクの識別番号の最小値が、データディスク数をパリティディスク数で割った数だけずれている
ことを特徴とする請求項1または2に記載のストレージシステム。 - 前記ストレージシステムは、さらに、
1以上の前記データディスクが故障した場合、故障した前記データディスクを含む前記ディスクグループに対応する前記パリティディスクを用いて、前記故障したデータディスクのデータを復元する復元部
を備えることを特徴とする請求項1〜3のうちいずれか1項に記載のストレージシステム。 - 前記復元部は、すべての前記故障したデータディスクが、選択する何れかのパリティディスクに対応する前記ディスクグループに含まれ、且つ、選択する全てのパリティディスクに対応する前記ディスクグループに1以上の前記故障したデータディスクを含むように、前記故障したデータディスクの数と等しい数のパリティディスクを選択し、選択した前記パリティディスクに基づいて、前記故障したデータディスクのデータを復元する
ことを特徴とする請求項4項に記載のストレージシステム。 - 前記復元部は、前記すべての故障したデータディスクが、選択する何れかのパリティディスクの前記ディスクグループに含まれ、且つ、選択する全てのパリティディスクに対応する前記ディスクグループに1以上の前記故障したデータディスクを含み、さらに、選択するパリティディスクに対応する前記ディスクグループに含まれる前記データディスクの集合としての和が最小となるように、前記故障したデータディスクの数と等しい数のパリティディスクを選択し、選択した前記パリティディスクに基づいて、前記故障したデータディスクのデータを復元する
ことを特徴とする請求項5に記載のストレージシステム。 - コンピュータに、
情報を格納する複数のデータディスクと、前記複数のデータディスクのうちの一部を含むディスクグループに対応し、該対応するディスクグループに含まれるデータディスクのデータに基づいて生成されたパリティ情報を格納するパリティディスクとを備え、前記データディスクのいずれかは、複数の前記ディスクグループに含まれるストレージシステムにおいて、1以上の前記データディスクが故障した場合、故障した前記データディスクを含むディスクグループに対応するパリティディスクを用いて、前記故障したデータディスクのデータを復元する
処理を実行させ、
前記複数のパリティディスクは、各パリティグループ内の任意のパリティディスクの対が、前記対応するディスクグループに同じデータディスクを含まないように、複数の該パリティグループに分類され、
前記複数のデータディスクのいずれも、前記パリティグループのそれぞれに含まれる前記パリティディスクに対応する前記ディスクグループのいずれかに含まれることを特徴とするストレージプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013218706A JP6260193B2 (ja) | 2013-10-21 | 2013-10-21 | ストレージシステム、及びストレージプログラム |
US14/488,419 US9400620B2 (en) | 2013-10-21 | 2014-09-17 | Storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013218706A JP6260193B2 (ja) | 2013-10-21 | 2013-10-21 | ストレージシステム、及びストレージプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015082150A JP2015082150A (ja) | 2015-04-27 |
JP6260193B2 true JP6260193B2 (ja) | 2018-01-17 |
Family
ID=52827274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013218706A Active JP6260193B2 (ja) | 2013-10-21 | 2013-10-21 | ストレージシステム、及びストレージプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9400620B2 (ja) |
JP (1) | JP6260193B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10055278B2 (en) * | 2015-10-30 | 2018-08-21 | International Business Machines Corporation | Autonomic parity exchange in data storage systems |
US10108470B2 (en) * | 2015-12-28 | 2018-10-23 | Sandisk Technologies Llc | Parity storage management |
US10372334B2 (en) | 2016-02-11 | 2019-08-06 | International Business Machines Corporation | Reclaiming free space in a storage system |
US10146652B2 (en) * | 2016-02-11 | 2018-12-04 | International Business Machines Corporation | Resilient distributed storage system |
CN109150398B (zh) * | 2018-08-06 | 2020-08-18 | 华南理工大学 | 基于udp自适应冗余编码的无线p2p传输方法及系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07200187A (ja) | 1993-12-30 | 1995-08-04 | Hitachi Ltd | ディスクアレイ装置 |
US6993701B2 (en) * | 2001-12-28 | 2006-01-31 | Network Appliance, Inc. | Row-diagonal parity technique for enabling efficient recovery from double failures in a storage array |
US7073115B2 (en) * | 2001-12-28 | 2006-07-04 | Network Appliance, Inc. | Correcting multiple block data loss in a storage array using a combination of a single diagonal parity group and multiple row parity groups |
US7080278B1 (en) * | 2002-03-08 | 2006-07-18 | Network Appliance, Inc. | Technique for correcting multiple storage device failures in a storage array |
JP3766079B2 (ja) * | 2003-07-23 | 2006-04-12 | 株式会社エヌ・ティ・ティ・データ | ディスクアレイ装置およびプログラム |
US7516354B2 (en) * | 2004-08-25 | 2009-04-07 | International Business Machines Corporation | Storing parity information for data recovery |
US7496785B2 (en) | 2006-03-21 | 2009-02-24 | International Business Machines Corporation | Enclosure-based raid parity assist |
US9122699B2 (en) * | 2012-12-14 | 2015-09-01 | Datadirect Networks, Inc. | Failure resilient distributed replicated data storage system |
US9244761B2 (en) * | 2013-06-25 | 2016-01-26 | Microsoft Technology Licensing, Llc | Erasure coding across multiple zones and sub-zones |
-
2013
- 2013-10-21 JP JP2013218706A patent/JP6260193B2/ja active Active
-
2014
- 2014-09-17 US US14/488,419 patent/US9400620B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9400620B2 (en) | 2016-07-26 |
US20150113319A1 (en) | 2015-04-23 |
JP2015082150A (ja) | 2015-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Greenan et al. | Flat XOR-based erasure codes in storage systems: Constructions, efficient recovery, and tradeoffs | |
US10191676B2 (en) | Scalable storage protection | |
CA2532766C (en) | Data storage array | |
US9552258B2 (en) | Method and system for storing data in raid memory devices | |
US7934120B2 (en) | Storing data redundantly | |
US9063910B1 (en) | Data recovery after triple disk failure | |
US7529970B2 (en) | System and method for improving the performance of operations requiring parity reads in a storage array system | |
KR101448192B1 (ko) | 메모리 관리 시스템 및 방법 | |
JP6260193B2 (ja) | ストレージシステム、及びストレージプログラム | |
US9063869B2 (en) | Method and system for storing and rebuilding data | |
US11748197B2 (en) | Data storage methods and systems | |
US20120198195A1 (en) | Data storage system and method | |
CN109358980B (zh) | 一种对数据更新和单磁盘错误修复友好的raid6编码方法 | |
US7870464B2 (en) | System and method for recovery of data for a lost sector in a storage system | |
US20050283652A1 (en) | Fault tolerance system and method for one or two failed disks in a disk array | |
JP2012518231A (ja) | 複数のディスクアレイのi/o動作を実行する方法及びシステム | |
Fu et al. | Device and placement aware framework to optimize single failure recoveries and reads for erasure coded storage system with heterogeneous storage devices | |
US7788525B2 (en) | Fault tolerance system and method for multiple failed disks in a disk array | |
JP3991947B2 (ja) | 2種類のパリティと複数のデータ復旧方式とを有するディスクアレイ装置 | |
JP2005209227A (ja) | ディスクアレイ装置 | |
CN104881252A (zh) | 一种基于e码的磁盘阵列布局结构 | |
CN116249969A (zh) | 具有内置冗余的数据存储系统以及恢复和存储数据的方法 | |
Deng et al. | Erasure codes in big data era | |
KR20220124182A (ko) | 저장 시스템에서의 데이터 복구를 위한 인코딩 | |
CN114153393A (zh) | 一种数据编码方法、系统、设备以及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6260193 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |