JP6452712B2 - 分散データ・ストレージ・システムにおけるデータ回復を向上させる方法、システム、およびコンピュータ・プログラム - Google Patents
分散データ・ストレージ・システムにおけるデータ回復を向上させる方法、システム、およびコンピュータ・プログラム Download PDFInfo
- Publication number
- JP6452712B2 JP6452712B2 JP2016553307A JP2016553307A JP6452712B2 JP 6452712 B2 JP6452712 B2 JP 6452712B2 JP 2016553307 A JP2016553307 A JP 2016553307A JP 2016553307 A JP2016553307 A JP 2016553307A JP 6452712 B2 JP6452712 B2 JP 6452712B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- loss
- vulnerable
- risk
- data storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1451—Management of the data involved in backup or backup restore by selection of backup contents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
- G06F11/1092—Rebuilding, e.g. when physically replacing a failing disk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1461—Backup scheduling policy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1456—Hardware arrangements for backup
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/84—Using snapshots, i.e. a logical point-in-time copy of the data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
- Retry When Errors Occur (AREA)
- Debugging And Monitoring (AREA)
Description
Claims (15)
- 分散データ・ストレージ・システムにおけるデータ回復を向上させる方法であって、
前記分散データ・ストレージ・システム中の複数のサーバの各々を独立して走査するステップと、
前記独立して走査された1つまたは複数のサーバ中のデータ・ストレージ媒体が利用不可能かどうかを判定するステップと、
前記1つまたは複数のデータ・ストレージ媒体が利用不可能なせいで損失のリスクがあるデータを決定するステップと、
前記サーバの各々の中で損失のリスクがあると決定された前記データのうちから、損失に対して非常に脆弱なデータを識別するステップであって、前記識別された損失のリスクがあるデータについて他の前記サーバ中の当該データの複製物があるかを判定することを含む、前記非常に脆弱なデータを識別するステップと、
前記識別された損失のリスクがあるデータについて他の前記サーバ中の当該データの複製物から、前記損失に対して非常に脆弱な前記データの、1つまたは複数の一時複製物を作成するステップとを含む方法。 - 損失のリスクがある前記データが、前記1つまたは複数の利用不可能なデータ・ストレージ媒体に記憶されたデータを含む、請求項1に記載の方法。
- 少なくとも1つの一時複製物が、外部ストレージ・デバイスまたは固体ストレージ・デバイス上に作成される、請求項1または2に記載の方法。
- 損失に対して非常に脆弱な前記データが、所定しきい値未満の数の複製物を有するデータを含む、請求項1ないし3のいずれかに記載の方法。
- 損失に対して非常に脆弱な前記データが、未来の障害イベント中に前記データが失われる確率を計算することに基づいて決定される、請求項1ないし4のいずれかに記載の方法。
- 損失に対して非常に脆弱な前記データが、未来の障害イベントの可能性に相関する1つまたは複数のファクタを考慮することに基づいて決定される、請求項1ないし5のいずれかに記載の方法。
- 前記1つまたは複数のファクタが、前記データが記憶されているディスクの寿命、前記分散データ・ストレージ・システム中のシステム・コンポーネントの寿命、前記データに対する実行可能な複製物の数、前記データの読取りに関連するエラー率、のうちの少なくとも1つを含む、請求項6に記載の方法。
- 前記1つまたは複数のファクタが、データ損失の確率、または前記データが前記データの1つもしくは複数の複製物から回復される可能性、に影響を及ぼす1つまたは複数のイベントを含む、請求項6または7に記載の方法。
- 前記データに対する複製物の数が所定しきい値まで復元されたと決定されるのに応答して、作成される前記一時複製物の数が削減される、請求項1ないし8のいずれかに記載の方法。
- データ損失から回復するために一時複製物が使用される、請求項1ないし9のいずれかに記載の方法。
- 分散データ・ストレージ・システムにおけるデータ回復を向上させるためのシステムであって、
前記分散データ・ストレージ・システム中の複数のサーバの各々を独立して走査するためのロジック・ユニットと、
前記独立して走査されたデータ・ストレージ・システム中の1つまたは複数のサーバ中のデータ・ストレージ媒体が利用不可能かどうかを判定するためのロジック・ユニットと、
前記1つまたは複数のデータ・ストレージ媒体が利用不可能なせいで損失のリスクがあるデータを決定するためのロジック・ユニットと、
前記サーバの各々の中で損失のリスクがあると決定された前記データのうちから、損失に対して非常に脆弱なデータを識別するためのロジック・ユニットとであって、前記識別された損失のリスクがあるデータについて他の前記サーバ中の当該データの複製物があるかを判定することを含む、前記非常に脆弱なデータを識別するためのロジック・ユニットと、
前記識別された損失のリスクがあるデータについて他の前記サーバ中の当該データの複製物から、前記損失に対して非常に脆弱な前記データの、1つまたは複数の一時複製物を作成するためのロジック・ユニットと、を備えるシステム。 - 損失のリスクがある前記データが、前記1つまたは複数の利用不可能なデータ・ストレージ媒体に記憶されたデータを含む、請求項11に記載のシステム。
- 少なくとも1つの一時複製物が、外部ストレージ・デバイスまたは固体ストレージ・デバイス上に作成される、請求項11または12に記載のシステム。
- 損失に対して非常に脆弱な前記データが、所定しきい値未満の数の複製物を有するデータを含む、請求項11ないし13のいずれかに記載のシステム。
- データ・ストレージ・システムにおけるデータ回復を向上させるためのコンピュータ・プログラムであって、
請求項1ないし10のいずれかに記載の方法を前記分散データ・ストレージ・システムに実行させるコンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/198,592 US9336091B2 (en) | 2014-03-06 | 2014-03-06 | Reliability enhancement in a distributed storage system |
US14/198,592 | 2014-03-06 | ||
PCT/IB2015/051266 WO2015132690A1 (en) | 2014-03-06 | 2015-02-19 | Reliabilty enhancement in a distributed storage system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017507427A JP2017507427A (ja) | 2017-03-16 |
JP6452712B2 true JP6452712B2 (ja) | 2019-01-16 |
Family
ID=54017485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016553307A Active JP6452712B2 (ja) | 2014-03-06 | 2015-02-19 | 分散データ・ストレージ・システムにおけるデータ回復を向上させる方法、システム、およびコンピュータ・プログラム |
Country Status (6)
Country | Link |
---|---|
US (3) | US9336091B2 (ja) |
JP (1) | JP6452712B2 (ja) |
CN (1) | CN106104460B (ja) |
DE (1) | DE112015000384B4 (ja) |
GB (1) | GB2538206A (ja) |
WO (1) | WO2015132690A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9264494B2 (en) * | 2013-10-21 | 2016-02-16 | International Business Machines Corporation | Automated data recovery from remote data object replicas |
US9336091B2 (en) | 2014-03-06 | 2016-05-10 | International Business Machines Corporation | Reliability enhancement in a distributed storage system |
US9891973B2 (en) | 2015-02-18 | 2018-02-13 | Seagate Technology Llc | Data storage system durability using hardware failure risk indicators |
US10275302B2 (en) | 2015-12-18 | 2019-04-30 | Microsoft Technology Licensing, Llc | System reliability by prioritizing recovery of objects |
CN109195859B (zh) * | 2016-05-24 | 2021-09-24 | 三菱电机株式会社 | 电子控制装置及其动作控制方法 |
US10437241B2 (en) | 2016-12-16 | 2019-10-08 | General Electric Company | Systems and methods for generating maintenance packages |
CN107589916A (zh) * | 2017-09-29 | 2018-01-16 | 郑州云海信息技术有限公司 | 一种基于纠删码的纠删池的创建方法及相关装置 |
CN109407975B (zh) * | 2018-09-19 | 2020-08-25 | 华为技术有限公司 | 写数据方法与计算节点以及分布式存储系统 |
CN113467703B (zh) * | 2020-03-31 | 2024-06-14 | 杭州海康存储科技有限公司 | 存储介质的管理方法、装置及设备 |
CN113726899B (zh) * | 2021-09-01 | 2022-10-04 | 内蒙古工业大学 | 一种基于OpenStack的高校高可用微型数据中心构建方法 |
CN115167782B (zh) * | 2022-07-28 | 2023-02-28 | 北京志凌海纳科技有限公司 | 临时存储副本管理方法、系统、设备和存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6516425B1 (en) | 1999-10-29 | 2003-02-04 | Hewlett-Packard Co. | Raid rebuild using most vulnerable data redundancy scheme first |
US6609212B1 (en) * | 2000-03-09 | 2003-08-19 | International Business Machines Corporation | Apparatus and method for sharing predictive failure information on a computer network |
JP4500063B2 (ja) * | 2004-02-06 | 2010-07-14 | 富士通株式会社 | 電子装置、予測方法および予測プログラム |
US9063881B2 (en) * | 2010-04-26 | 2015-06-23 | Cleversafe, Inc. | Slice retrieval in accordance with an access sequence in a dispersed storage network |
JP2007249441A (ja) * | 2006-03-15 | 2007-09-27 | Hitachi Ltd | 仮想化システム及び障害対処方法 |
US7743276B2 (en) | 2006-09-27 | 2010-06-22 | Hewlett-Packard Development Company, L.P. | Sufficient free space for redundancy recovery within a distributed data-storage system |
JP5075465B2 (ja) * | 2007-04-20 | 2012-11-21 | 株式会社東芝 | インシデント・アクシデントレポート分析装置、方法、およびプログラム |
US8019728B2 (en) | 2008-04-17 | 2011-09-13 | Nec Laboratories America, Inc. | Dynamically quantifying and improving the reliability of distributed data storage systems |
JP4843693B2 (ja) * | 2009-03-30 | 2011-12-21 | 株式会社東芝 | 記憶装置 |
WO2012017641A1 (ja) | 2010-08-03 | 2012-02-09 | パナソニック株式会社 | アレイ管理装置、方法、集積回路およびプログラム |
EP2439908A1 (en) * | 2010-09-20 | 2012-04-11 | Thomson Licensing | Method of data replication in a distributed data storage system and corresponding device |
US8732518B2 (en) | 2011-04-13 | 2014-05-20 | Netapp, Inc. | Reliability based data allocation and recovery in a storage system |
JP5887757B2 (ja) * | 2011-08-17 | 2016-03-16 | 富士通株式会社 | ストレージシステム、ストレージ制御装置およびストレージ制御方法 |
US20130212428A1 (en) | 2011-09-14 | 2013-08-15 | Yoshikazu Yamamoto | Information storage medium library array apparatus, information recording method and information recording program |
US8812902B2 (en) | 2012-02-08 | 2014-08-19 | Lsi Corporation | Methods and systems for two device failure tolerance in a RAID 5 storage system |
US8862948B1 (en) * | 2012-06-28 | 2014-10-14 | Emc Corporation | Method and apparatus for providing at risk information in a cloud computing system having redundancy |
US9635109B2 (en) * | 2014-01-02 | 2017-04-25 | International Business Machines Corporation | Enhancing reliability of a storage system by strategic replica placement and migration |
US9336091B2 (en) | 2014-03-06 | 2016-05-10 | International Business Machines Corporation | Reliability enhancement in a distributed storage system |
-
2014
- 2014-03-06 US US14/198,592 patent/US9336091B2/en not_active Expired - Fee Related
-
2015
- 2015-02-19 CN CN201580012223.2A patent/CN106104460B/zh active Active
- 2015-02-19 DE DE112015000384.3T patent/DE112015000384B4/de active Active
- 2015-02-19 WO PCT/IB2015/051266 patent/WO2015132690A1/en active Application Filing
- 2015-02-19 GB GB1615112.8A patent/GB2538206A/en not_active Withdrawn
- 2015-02-19 JP JP2016553307A patent/JP6452712B2/ja active Active
-
2016
- 2016-02-17 US US15/045,910 patent/US9946602B2/en active Active
-
2018
- 2018-03-16 US US15/922,944 patent/US10223207B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN106104460A (zh) | 2016-11-09 |
GB2538206A (en) | 2016-11-09 |
US10223207B2 (en) | 2019-03-05 |
US20160162361A1 (en) | 2016-06-09 |
US9336091B2 (en) | 2016-05-10 |
DE112015000384T5 (de) | 2016-09-29 |
US20180203769A1 (en) | 2018-07-19 |
DE112015000384B4 (de) | 2021-12-02 |
GB201615112D0 (en) | 2016-10-19 |
CN106104460B (zh) | 2019-04-12 |
US20150254140A1 (en) | 2015-09-10 |
WO2015132690A1 (en) | 2015-09-11 |
JP2017507427A (ja) | 2017-03-16 |
US9946602B2 (en) | 2018-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6452712B2 (ja) | 分散データ・ストレージ・システムにおけるデータ回復を向上させる方法、システム、およびコンピュータ・プログラム | |
US10877860B2 (en) | Copying data from mirrored storage to auxiliary storage arrays co-located with primary storage arrays | |
US9635109B2 (en) | Enhancing reliability of a storage system by strategic replica placement and migration | |
CN109725831B (zh) | 管理存储系统的方法、系统和计算机可读介质 | |
US8930749B2 (en) | Systems and methods for preventing data loss | |
US8676750B2 (en) | Efficient data synchronization in a distributed data recovery system | |
CN110058787B (zh) | 用于写入数据的方法、设备和计算机程序产品 | |
CN111818124B (zh) | 数据存储方法、装置、电子设备及介质 | |
US10437691B1 (en) | Systems and methods for caching in an erasure-coded system | |
CN109726036B (zh) | 一种存储系统中的数据重构方法和装置 | |
US11210003B2 (en) | Method, device and computer program product for restoring data based on replacing child node identifiers with parent node identifier | |
US10540103B1 (en) | Storage device group split technique for extent pool with hybrid capacity storage devices system and method | |
CN113377569B (zh) | 用于恢复数据的方法、设备和计算机程序产品 | |
US10002057B2 (en) | Method and apparatus for managing mismatches within a multi-threaded lockstep processing system | |
US9286163B2 (en) | Data recovery scheme based on data backup status | |
US10216562B2 (en) | Generating diagnostic data | |
US10997040B1 (en) | System and method for weight based data protection | |
US11275518B2 (en) | System and method for implementing heterogeneous media types with raid | |
US9898360B1 (en) | Preventing unnecessary data recovery | |
US9471409B2 (en) | Processing of PDSE extended sharing violations among sysplexes with a shared DASD | |
US20200133514A1 (en) | Proactive copy in a storage environment | |
US20190303243A1 (en) | Maintenance of storage devices with multiple logical units | |
CN107851127B (zh) | 利用不同数据存储器类型来存储主用和复制数据库目录的装置和方法 | |
US9218256B1 (en) | Systems and methods for shipping I/O operations to prevent replication failure | |
US11861201B2 (en) | System and method for inline recovery of a file system resource allocator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161014 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6452712 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |