CN107122269B - 用于保证映射独立磁盘冗余阵列的可靠性的方法和装置 - Google Patents

用于保证映射独立磁盘冗余阵列的可靠性的方法和装置 Download PDF

Info

Publication number
CN107122269B
CN107122269B CN201610103823.6A CN201610103823A CN107122269B CN 107122269 B CN107122269 B CN 107122269B CN 201610103823 A CN201610103823 A CN 201610103823A CN 107122269 B CN107122269 B CN 107122269B
Authority
CN
China
Prior art keywords
probability
redundant array
data loss
determining
independent disks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610103823.6A
Other languages
English (en)
Other versions
CN107122269A (zh
Inventor
韩耕
高健
董继炳
高宏坡
龚绍钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Priority to CN201610103823.6A priority Critical patent/CN107122269B/zh
Priority to US15/440,034 priority patent/US10540091B2/en
Publication of CN107122269A publication Critical patent/CN107122269A/zh
Priority to US16/748,175 priority patent/US11294569B2/en
Application granted granted Critical
Publication of CN107122269B publication Critical patent/CN107122269B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0607Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1092Rebuilding, e.g. when physically replacing a failing disk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0632Configuration or reconfiguration of storage systems by initialisation or re-initialisation of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)

Abstract

本公开的实施例提供了一种用于保证映射独立磁盘冗余阵列的可靠性的方法和装置。该方法包括:确定第一数据丢失概率,其中第一数据丢失概率指示传统独立磁盘冗余阵列的可靠性;确定第二数据丢失概率,其中第二数据丢失概率指示所述映射独立磁盘冗余阵列的可靠性;以及基于第二数据丢失概率与第一数据丢失概率,确定用于保证映射独立磁盘冗余阵列的可靠性的条件。与现有技术相比,本公开的实施例能够通过与传统独立磁盘冗余阵列进行比较来有效地预测映射独立磁盘冗余阵列的可靠性,从而能够确定传统独立磁盘冗余阵列和映射独立磁盘冗余阵列之间的可靠性关系,使得将传统独立磁盘冗余阵列扩展为映射独立磁盘冗余阵列时其可靠性不被降低。

Description

用于保证映射独立磁盘冗余阵列的可靠性的方法和装置
技术领域
本公开的实施例总体涉及数据存储,更具体地,涉及一种用于保证映射独立磁盘冗余阵列(mapped RAID)的可靠性的方法和装置。
背景技术
独立磁盘冗余阵列(RAID)是一种数据存储虚拟化技术,其出于数据冗余备份和/或性能改进的目的将多个物理磁盘驱动器组合成单个逻辑单元。根据所要求的冗余度和性能的级别,数据可以以若干方式(也被称为RAID级别,包括RAID 0、RAID 1……RAID 5等)之一(例如,RAID5)被分布在多个磁盘中。以RAID5为例,其可以由具有分布式校验信息的块级别条带构成。当单个磁盘发生故障时,后续的读取能够通过分布式校验信息来计算,使得没有数据被丢失。同时,热空闲盘将被选择以替代故障盘,并且故障盘上的所有数据将被重建并被写入到热空闲盘上。然而,随着新技术(例如,叠瓦式介质盘)的出现,磁盘能力逐年提升并且重建时间也相应地增加。如果不能够降低磁盘的重建时间,则可能会面临增加的双磁盘故障的风险,其将会导致数据丢失。RAID5的重建时间受制于热空闲盘的写带宽,其已经成为了传统RAID技术的瓶颈。
映射RAID技术可以被引入以解决上述问题。映射RAID可以由比传统RAID5更多的磁盘构成。在创建RAID条带时,可以从多个磁盘中随机选择若干磁盘区段,使得数据和校验信息被最终分布在所有磁盘中。当一个磁盘发生故障时,针对故障盘上的每个磁盘区段可以随机选择其他磁盘上的一个磁盘区段作为替代。因此,利用该技术,所有磁盘将被涉及到重建过程中。由于不存在单个热空闲盘并且多个磁盘区段的写入能够并行执行,整个重建时间将被降低。
然而,通过增加磁盘数来将传统RAID扩展为映射RAID可能影响其可靠性(例如,使得数据丢失概率增加)。现有技术中(例如,由《IEEE Transactions on Computers》,1996,45(3):367-373,Analytic Modeling of Clustered RAID with Mapping Based onNearly Random Permutation记载的)可以采用精确的数据建模的方法来预测映射RAID的各种实际性能。然而,建立这样的数学模型可能是十分复杂的,并且其可能不能够完全真实地反映具体的映射RAID的构造。因此,本领域中需要一种更为高效的方案来确定传统RAID和映射RAID之间的可靠性关系,从而保证相对于传统RAID而言映射RAID的可靠性不被降低。
发明内容
本公开的实施例旨在提供一种用于保证映射独立磁盘冗余阵列的可靠性的方法和装置,以解决上述问题。
根据本公开的一个方面,提供了一种用于保证映射独立磁盘冗余阵列的可靠性的方法,包括:确定第一数据丢失概率,其中所述第一数据丢失概率指示传统独立磁盘冗余阵列的可靠性;确定第二数据丢失概率,其中所述第二数据丢失概率指示所述映射独立磁盘冗余阵列的可靠性;以及基于所述第二数据丢失概率与所述第一数据丢失概率,确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件。
在一些实施例中,确定第一数据丢失概率包括:确定任何时刻的单个磁盘故障概率与独立磁盘冗余阵列中的磁盘数之间的第一关系;确定预定时间间隔内的单个磁盘故障概率与所述预定时间间隔的长度之间的第二关系;以及基于所述第一关系和所述第二关系来确定所述第一数据丢失概率。
在一些实施例中,所述第一关系指示任何时刻的所述单个磁盘故障概率与独立磁盘冗余阵列中的所述磁盘数大致成正比。
在一些实施例中,所述第二关系指示预定时间间隔内的所述单个磁盘故障概率与所述预定时间间隔的长度大致成正比。
在一些实施例中,确定第二数据丢失概率包括:基于所述第一关系和所述第二关系来确定所述第二数据丢失概率。
在一些实施例中,确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件包括:确定所述传统独立磁盘冗余阵列的重建时间与所述映射独立磁盘冗余阵列的重建时间之间的第三关系,以使得所述第二数据丢失概率不高于所述第一数据丢失概率。
在一些实施例中,确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件还包括:基于所述第三关系,确定所述映射独立磁盘冗余阵列的期望重建速率。
在一些实施例中,确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件还包括:基于所述映射独立磁盘冗余阵列的所述期望重建速率和实际重建速率,确定所述映射独立磁盘冗余阵列要使用的磁盘数。
根据本公开的另一方面,提供了一种用于保证映射独立磁盘冗余阵列的可靠性的装置,包括:第一概率确定模块,被配置为确定第一数据丢失概率,其中所述第一数据丢失概率指示传统独立磁盘冗余阵列的可靠性;第二概率确定模块,被配置为确定第二数据丢失概率,其中所述第二数据丢失概率指示所述映射独立磁盘冗余阵列的可靠性;以及条件确定模块,被配置为基于所述第二数据丢失概率与所述第一数据丢失概率,确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件。
在一些实施例中,所述第一概率确定模块还被配置为:确定任何时刻的单个磁盘故障概率与独立磁盘冗余阵列中的磁盘数之间的第一关系;确定预定时间间隔内的单个磁盘故障概率与所述预定时间间隔的长度之间的第二关系;以及基于所述第一关系和所述第二关系来确定所述第一数据丢失概率。
在一些实施例中,所述第一关系指示任何时刻的所述单个磁盘故障概率与独立磁盘冗余阵列中的所述磁盘数大致成正比。
在一些实施例中,所述第二关系指示预定时间间隔内的所述单个磁盘故障概率与所述预定时间间隔的长度大致成正比。
在一些实施例中,所述第二概率确定模块还被配置为:基于所述第一关系和所述第二关系来确定所述第二数据丢失概率。
在一些实施例中,所述条件确定模块还被配置为:确定所述传统独立磁盘冗余阵列的重建时间与所述映射独立磁盘冗余阵列的重建时间之间的第三关系,以使得所述第二数据丢失概率不高于所述第一数据丢失概率。
在一些实施例中,所述条件确定模块还被配置为:基于所述第三关系,确定所述映射独立磁盘冗余阵列的期望重建速率。
在一些实施例中,所述条件确定模块还被配置为:基于所述映射独立磁盘冗余阵列的所述期望重建速率和实际重建速率,确定所述映射独立磁盘冗余阵列要使用的磁盘数。
根据本公开的又一方面,提供了一种用于保证映射独立磁盘冗余阵列的可靠性的计算机程序产品,所述计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使得机器执行所述方法的任意步骤。
与现有技术相比,本公开的实施例能够通过与传统RAID进行比较来有效地预测映射RAID的可靠性,从而能够确定传统RAID和映射RAID之间的可靠性关系,使得将传统RAID扩展为映射RAID时其可靠性不被降低。
附图说明
通过参考附图阅读下文的详细描述,本公开的实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例而非限制性的方式示出了本公开的若干实施例,其中:
图1示出了适于用来实现本公开的实施例的示例性计算机系统/服务器12的框图;
图2图示了具有4个数据块和1个校验块的传统RAID5的示例性布局的示意图;
图3图示了传统RAID5的重建的示意图;
图4图示了映射RAID的示例性布局的示意图;
图5图示了映射RAID的重建的示意图;
图6图示了根据本公开的实施例的用于保证映射RAID的可靠性的方法600的流程图;
图7图示了根据本公开的实施例的用于确定RAID的数据丢失概率的方法700的流程图;以及
图8图示了根据本公开的实施例的用于保证映射独立磁盘冗余阵列的可靠性的装置800的框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考附图中示出的若干示例实施例来描述本公开的原理。应当理解,描述这些实施例仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。
图1示出了适于用来实现本公开的实施例的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开的各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
出于便于描述的目的,以下以具有4个数据块和1个校验块(4D+1P)的RAID5为例来详细地说明本公开的实施例。然而,应当理解的是,本公开的实施例的原理和方法可以应用于任何级别或布局的RAID而不仅限于以下所列举的示例,并且本公开的保护范围在此方面不受限制。
例如,图2图示了4D+1P的传统RAID5的示例性布局的示意图。RAID5由具有分布式校验信息的块级别条带构成,校验信息可以被分布在多个磁盘中。如图2所示,该RAID5一共使用了5个磁盘,分别为磁盘0、磁盘1、磁盘2、磁盘3和磁盘4。每个条带可以包括5个块,该5个块由4个数据块(即,D0-D3)和1个校验块(即,P)构成。当单个磁盘发生故障时,后续的读取能够通过分布式校验信息来计算,使得没有数据被丢失。同时,热空闲盘将被选择以替代故障盘,并且故障盘上的所有数据将被重建并被写入到热空闲盘上。图3图示了如图2所示的传统RAID5的重建的示意图。如图3所示,当磁盘3发生故障时,新磁盘(即,热空闲盘)可以被选择以替代磁盘3,并且磁盘3上的所有数据将被重建并被写入到该新磁盘上。
然而,随着新技术(例如,叠瓦式介质盘)的出现,磁盘能力逐年提升并且重建时间也相应地增加。如果不能够降低磁盘的重建时间,则可能会面临增加的双磁盘故障的风险,其将会导致数据丢失。RAID5的重建时间受制于热空闲盘的写带宽,热空闲盘的写带宽已经成为了传统RAID技术的瓶颈。
可以通过将传统RAID扩展为映射RAID来解决上述问题。映射RAID可以由比传统RAID更多的磁盘构成,并且每个磁盘可以被视为是连续的、非重叠的、固定大小的磁盘区段的集合。
例如,图4图示了映射RAID的示例性布局的示意图,其图示了在N个磁盘上创建4D+1P的RAID5的示例,其中N大于5。如图4所示,当创建RAID条带时,可以随机地从5个不同的磁盘选择5个磁盘区段。因此,数据和校验信息将最终被分布到所有磁盘中。此外,还可以在每个磁盘上预留一些磁盘区段作为热空闲磁盘区段,而不是像传统RAID5那样预留整个磁盘来作为热空闲盘。当一个磁盘发生故障时,针对故障盘上的每个磁盘区段可以随机选择其他磁盘上的一个磁盘区段作为替代。例如,图5图示了如图4所示的映射RAID的重建的示意图。如图5所示,当磁盘4发生故障时,针对磁盘4上的每个磁盘区段(即,D3所在的磁盘区段和D2所在的磁盘区段)可以随机选择其他磁盘上的一个磁盘区段作为替代(例如,D3中的数据被重建并被写入到磁盘3的一个空闲磁盘区段中,而D2中的数据被重建并被写入到磁盘N的一个空闲磁盘区段中)。对于磁盘区段选择的唯一限制是需要始终保证每个RAID条带必须跨越5个不同磁盘。因此,利用该技术,所有磁盘将被涉及到重建过程中。由于不存在单个热空闲盘并且多个磁盘区段的重建和写入能够并行执行,整个重建时间将被降低。
然而,通过增加磁盘数来将传统RAID扩展为映射RAID可能影响其可靠性(例如,使得数据丢失概率增加)。为了解决该问题,本公开的实施例提出了用于保证映射RAID的可靠性的技术方案。
图6图示了根据本公开的实施例的用于保证映射RAID的可靠性的方法600的流程图。例如,方法600可以由图1所示的计算机系统/服务器12来执行。方法600可以包括步骤S601至S603。
在步骤S601,确定第一数据丢失概率,其中第一数据丢失概率指示传统RAID的可靠性。以下仍以4D+1P的传统RAID5为例来详细描述如何确定其数据丢失概率。
例如,图7图示了根据本公开的实施例的用于确定RAID的数据丢失概率的方法700的流程图。方法700也可以由图1所示的计算机系统/服务器12来执行。方法700可以包括步骤S701至S703。
在步骤S701,确定任何时刻的单个磁盘故障概率与RAID中的磁盘数之间的第一关系。例如,假设P为任何时刻的单个磁盘故障概率,并且P(N)为在N个磁盘上在任何时刻的单个磁盘故障概率。因此,可以得出:
P(1)=P;
P(2)=2·P(1-P)=2P–2P2
P(3)=3·P(1-P)(1-P)=3P–6P2+3P3
……
P(N)=N·P·(1-P)N-1
考虑到针对商业盘的平均无故障时间(MTTF)可以长达5年,因此P可以是相对小的。因此,上述等式可以被近似地省略其中的高阶项,从而得出:
P(1)=P;
P(2)≈2P;
P(3)≈3P;
……
P(N)≈NP。
即,任何时刻的单个磁盘故障概率与RAID中的磁盘数大致成正比。
接下来,方法700进行至步骤S702,确定预定时间间隔内的单个磁盘故障概率与该预定时间间隔的长度之间的第二关系。例如,可以通过常识的方式来确定该第二关系。假设磁盘故障概率随时间的变化遵循分布函数p(t)并且MTTF大约为5年。考虑到预定时间间隔通常在天的数量级上,因此在该预定时间间隔中的分布函数曲线可以被近似地拟合为直线,即在该预定时间间隔内p(t)≈p0。可以将时间间隔T和T’内的单个磁盘故障概率记为P(T)和P(T’),并且T和T’从相同时间S开始,因此P(T)/P(T’)=(p0·T)/(p0·T’)=T/T’,即预定时间间隔内的单个磁盘故障概率与该预定时间间隔的长度大致成正比。此外,还可以通过数学方式来确定预定时间间隔内的单个磁盘故障概率与该预定时间间隔的长度之间的第二关系。假设磁盘故障概率随时间的变化遵循指数分布,并且假设概率密度函数PDF(t)=λe-λt,因此连续密度函数其中λ表示速率参数。因此,可以获得在时间间隔T、2T……nT中的单个磁盘故障概率:
P(T)=CDF(S+T)–CDF(S)=1-e-λ(S+T)-(1-e-λS)=e-λS-e-λ(S+T)
P(2T)=CDF(S+2T)–CDF(S)=1-e-λ(S+2T)-(1-e-λS)=e-λS-e-λ(S+2T)
P(3T)=CDF(S+3T)–CDF(S)=1-e-λ(S+3T)-(1-e-λS)=e-λS-e-λ(S+3T)
……
P(nT)=CDF(S+nT)–CDF(S)=1-e-λ(S+nT)-(1-e-λS)=e-λS-e-λ(S+nT)
通过将P(T)与P(2T)、P(3T)……P(nT)相比并且令y=e-λt可以得到:
Figure GDA0002247211070000101
当MTTF为5年并且时间以小时为单位时,λ=1/(5×365×24)≈2.28e-5,其是相当小的,即y=e-λt≈1。因此可以得出:
Figure GDA0002247211070000102
……,
Figure GDA0002247211070000103
即,预定时间间隔内的单个磁盘故障概率与该预定时间间隔的长度大致成正比。
接下来,方法700进行至步骤S703,基于第一关系和第二关系来确定RAID的数据丢失概率。以4D+1P的传统RAID5为例,假设在时间点S有一个磁盘发生故障导致重建过程被触发,并且假设在时间点S每个磁盘故障概率为P。基于上述第一关系,即任何时刻的单个磁盘故障概率与RAID中的磁盘数大致成正比,可以得到在时间点S在5个磁盘上一个磁盘发生故障的概率为5P。假设传统RAID的重建时间为T,如果在重建时间T内另一个磁盘也发生故障,则数据将被丢失。假设每个磁盘在时间T内的磁盘故障概率为P(T),因为除已发生故障的一个磁盘外还剩余4个磁盘,因此在时间T内另一个磁盘也发生故障的概率为4P(T)。从而可以得到4D+1P的传统RAID5的第一数据丢失概率P1=5·P·4P(T)=20P·P(T)。
返回图6,接下来,方法600进行至步骤S602,确定第二数据丢失概率,其中第二数据丢失概率指示映射RAID的可靠性。根据本公开的实施例,可以利用以上结合图7描述的方法700来确定第二数据丢失概率。例如,通过方法700的步骤S701已经确定了任何时刻的单个磁盘故障概率与RAID中的磁盘数之间的第一关系,即任何时刻的单个磁盘故障概率与RAID中的磁盘数大致成正比;通过方法700的步骤S702已经确定了预定时间间隔内的单个磁盘故障概率与该预定时间间隔的长度之间的第二关系,即预定时间间隔内的单个磁盘故障概率与该预定时间间隔的长度大致成正比。因此,通过方法700的步骤S703,可以基于第一关系和第二关系来确定映射RAID的数据丢失概率。对于映射RAID而言,假设在时间点S有一个磁盘发生故障导致重建过程被触发,并且假设在时间点S每个磁盘故障概率为P。基于上述第一关系,可以得到在时间点S在N个磁盘上一个磁盘发生故障的概率为NP。假设映射RAID的重建时间为T’,如果在重建时间T’内另一个磁盘也发生故障,则数据将被丢失。基于上述第二关系,可以得出在时间T’内另一个磁盘也发生故障的概率为(N-1)·(T′/T)·P(T)。从而可以得到N个磁盘上的4D+1P的映射RAID的第二数据丢失概率
Figure GDA0002247211070000111
接下来,方法600进行至步骤S603,基于第二数据丢失概率与第一数据丢失概率,确定用于保证映射RAID的可靠性的条件。
根据本公开的实施例,步骤S603可以包括确定传统RAID的重建时间与映射RAID的重建时间之间的第三关系,以使得第二数据丢失概率不高于第一数据丢失概率。例如,通过上述步骤S602和S603已经得出传统RAID的第一数据丢失概率P1和映射RAID的第二数据丢失概率P2,例如,P1=20P·P(T)并且为了使得P2≤P1(即,使得映射RAID的可靠性不低于传统RAID的可靠性),可以得出
Figure GDA0002247211070000121
Figure GDA0002247211070000122
因此,传统RAID的重建时间T与映射RAID的重建时间T’之间需要满足第三关系以使得映射RAID的可靠性不低于传统RAID的可靠性。换言之,如果想要保持与传统RAID相同的可靠性,扩展的映射RAID的重建速率需要提升至传统RAID的重建速率的
Figure GDA0002247211070000124
倍,其中N为映射RAID所使用的磁盘数。
根据本公开的实施例,步骤S603还可以包括基于第三关系(即,传统RAID的重建时间T与映射RAID的重建时间T’之间需要满足以使得映射RAID的可靠性不低于传统RAID的可靠性),确定映射RAID的期望重建速率。例如,表1给出了在4D+1P的传统RAID5的重建速率为35MB/s(例如,可以通过试验得到)的情况下,通过增加磁盘数(例如,如表1所示的磁盘数从6到20)将传统RAID5扩展为映射RAID时,为了保证映射RAID的可靠性而期望其达到的相应的重建速率下限值。
磁盘数 重建速率比例 重建速率下限(MB/S)
20 19.000000 665.00
19 17.100000 598.50
18 15.300000 535.50
17 13.600000 476.00
16 12.000000 420.00
15 10.500000 367.50
14 9.100000 318.50
13 7.800000 273.00
12 6.600000 231.00
11 5.500000 192.50
10 4.500000 157.50
9 3.600000 126.00
8 2.800000 98.00
7 2.100000 73.50
6 1.500000 52.50
表1映射RAID的期望重建速率
在实际应用中,上述期望重建速率可能不一定能够达到。因此,根据本公开的实施例,步骤S603还可以包括基于映射RAID的期望重建速率和实际重建速率,确定映射RAID要使用的磁盘数。例如,表2给出了在4D+1P的传统RAID5的重建速率为35MB/s的情况下,在某种特定配置下通过试验测量的映射RAID的实际重建速率的测试结果。
Figure GDA0002247211070000131
表2映射RAID的实际重建速率
通过比较表1和表2,可以发现如果映射RAID中的磁盘数量大于12,则不能够保证该特定配置下的映射RAID的可靠性。因此,为了保证该特定配置下的映射RAID不低于相应的传统RAID5的可靠性,可以在映射RAID组中至多配置12个磁盘。
图8图示了根据本公开的实施例的用于保证映射独立磁盘冗余阵列的可靠性的装置800的框图。装置800可以包括第一概率确定模块801,被配置为确定第一数据丢失概率,其中第一数据丢失概率指示传统RAID的可靠性。装置800还可以包括第二概率确定模块802,被配置为确定第二数据丢失概率,其中第二数据丢失概率指示映射RAID的可靠性。附加地,装置800还可以包括条件确定模块803,被配置为基于第二数据丢失概率与第一数据丢失概率,确定用于保证映射RAID的可靠性的条件。
根据本公开的实施例,第一概率确定模块801还可以被配置为确定任何时刻的单个磁盘故障概率与RAID中的磁盘数之间的第一关系;确定预定时间间隔内的单个磁盘故障概率与该预定时间间隔的长度之间的第二关系;以及基于第一关系和第二关系来确定第一数据丢失概率。其中,第一关系可以指示任何时刻的单个磁盘故障概率与RAID中的磁盘数大致成正比;并且第二关系可以指示预定时间间隔内的单个磁盘故障概率与该预定时间间隔的长度大致成正比。
根据本公开的实施例,第二概率确定模块802还可以被配置为基于第一关系和第二关系来确定第二数据丢失概率。
根据本公开的实施例,条件确定模块803还可以被配置为确定传统RAID的重建时间与映射独立RAID的重建时间之间的第三关系,以使得第二数据丢失概率不高于第一数据丢失概率。
根据本公开的实施例,条件确定模块803还可以被配置为基于第三关系来确定映射RAID的期望重建速率。
根据本公开的实施例,条件确定模块803还可以被配置为基于映射RAID的期望重建速率和实际重建速率,确定映射RAID要使用的磁盘数。
出于清楚的目的,在图8中没有示出装置800的某些可选模块。然而,应当理解,上文参考图1-8所描述的各个特征同样适用于装置800。而且,装置800的各个模块可以是硬件模块,也可以是软件模块。例如,在某些实施例中,装置800可以部分或者全部利用软件和/或固件来实现,例如被实现为包含在计算机可读介质上的计算机程序产品。备选地或附加地,装置800可以部分或者全部基于硬件来实现,例如被实现为集成电路(IC)、专用集成电路(ASIC)、片上系统(SOC)、现场可编程门阵列(FPGA)等。本公开的范围在此方面不受限制。
综上所述,本公开的实施例提供了一种用于保证映射独立磁盘冗余阵列的可靠性的方法和装置。与现有技术相比,本公开的实施例能够通过与传统独立磁盘冗余阵列进行比较来有效地预测映射独立磁盘冗余阵列的可靠性,从而能够确定传统独立磁盘冗余阵列和映射独立磁盘冗余阵列之间的可靠性关系,使得将传统独立磁盘冗余阵列扩展为映射独立磁盘冗余阵列时其可靠性不被降低。
本公开的实施例可以是方法、装置和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的实施例的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开的实施例操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言——诸如Smalltalk、C++等,以及常规的过程式编程语言——诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的实施例的各个方面。
这里参照根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的实施例的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所公开的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能够理解本文公开的各实施例。

Claims (15)

1.一种用于保证映射独立磁盘冗余阵列的可靠性的方法,包括:
确定第一数据丢失概率,其中所述第一数据丢失概率指示传统独立磁盘冗余阵列的可靠性;
确定第二数据丢失概率,其中所述第二数据丢失概率指示所述映射独立磁盘冗余阵列的可靠性;以及
基于所述第二数据丢失概率与所述第一数据丢失概率,确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件,
其中确定第一数据丢失概率包括:
确定任何时刻的单个磁盘故障概率与独立磁盘冗余阵列中的磁盘数之间的第一关系;
确定预定时间间隔内的单个磁盘故障概率与所述预定时间间隔的长度之间的第二关系;以及
基于所述第一关系和所述第二关系来确定所述第一数据丢失概率。
2.根据权利要求1所述的方法,其中所述第一关系指示任何时刻的所述单个磁盘故障概率与独立磁盘冗余阵列中的所述磁盘数成正比。
3.根据权利要求1所述的方法,其中所述第二关系指示预定时间间隔内的所述单个磁盘故障概率与所述预定时间间隔的长度成正比。
4.根据权利要求1所述的方法,其中确定第二数据丢失概率包括:
基于所述第一关系和所述第二关系来确定所述第二数据丢失概率。
5.根据权利要求1所述的方法,其中确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件包括:
确定所述传统独立磁盘冗余阵列的重建时间与所述映射独立磁盘冗余阵列的重建时间之间的第三关系,以使得所述第二数据丢失概率不高于所述第一数据丢失概率。
6.根据权利要求5所述的方法,其中确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件还包括:
基于所述第三关系,确定所述映射独立磁盘冗余阵列的期望重建速率。
7.根据权利要求6所述的方法,其中确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件还包括:
基于所述映射独立磁盘冗余阵列的所述期望重建速率和实际重建速率,确定所述映射独立磁盘冗余阵列要使用的磁盘数。
8.一种用于保证映射独立磁盘冗余阵列的可靠性的装置,包括:
第一概率确定模块,被配置为确定第一数据丢失概率,其中所述第一数据丢失概率指示传统独立磁盘冗余阵列的可靠性;
第二概率确定模块,被配置为确定第二数据丢失概率,其中所述第二数据丢失概率指示所述映射独立磁盘冗余阵列的可靠性;以及
条件确定模块,被配置为基于所述第二数据丢失概率与所述第一数据丢失概率,确定用于保证所述映射独立磁盘冗余阵列的可靠性的条件,
其中所述第一概率确定模块还被配置为:
确定任何时刻的单个磁盘故障概率与独立磁盘冗余阵列中的磁盘数之间的第一关系;
确定预定时间间隔内的单个磁盘故障概率与所述预定时间间隔的长度之间的第二关系;以及
基于所述第一关系和所述第二关系来确定所述第一数据丢失概率。
9.根据权利要求8所述的装置,其中所述第一关系指示任何时刻的所述单个磁盘故障概率与独立磁盘冗余阵列中的所述磁盘数成正比。
10.根据权利要求8所述的装置,其中所述第二关系指示预定时间间隔内的所述单个磁盘故障概率与所述预定时间间隔的长度成正比。
11.根据权利要求8所述的装置,其中所述第二概率确定模块还被配置为:
基于所述第一关系和所述第二关系来确定所述第二数据丢失概率。
12.根据权利要求8所述的装置,其中所述条件确定模块还被配置为:
确定所述传统独立磁盘冗余阵列的重建时间与所述映射独立磁盘冗余阵列的重建时间之间的第三关系,以使得所述第二数据丢失概率不高于所述第一数据丢失概率。
13.根据权利要求12所述的装置,其中所述条件确定模块还被配置为:
基于所述第三关系,确定所述映射独立磁盘冗余阵列的期望重建速率。
14.根据权利要求13所述的装置,其中所述条件确定模块还被配置为:
基于所述映射独立磁盘冗余阵列的所述期望重建速率和实际重建速率,确定所述映射独立磁盘冗余阵列要使用的磁盘数。
15.一种非瞬态计算机可读介质,所述非瞬态计算机可读介质包括机器可执行指令,所述机器可执行指令在被执行时使得机器执行根据权利要求1-7中任一项所述的方法的任意步骤。
CN201610103823.6A 2016-02-25 2016-02-25 用于保证映射独立磁盘冗余阵列的可靠性的方法和装置 Active CN107122269B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610103823.6A CN107122269B (zh) 2016-02-25 2016-02-25 用于保证映射独立磁盘冗余阵列的可靠性的方法和装置
US15/440,034 US10540091B2 (en) 2016-02-25 2017-02-23 Method and apparatus for maintaining reliability of a RAID
US16/748,175 US11294569B2 (en) 2016-02-25 2020-01-21 Method and apparatus for maintaining reliability of a RAID

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610103823.6A CN107122269B (zh) 2016-02-25 2016-02-25 用于保证映射独立磁盘冗余阵列的可靠性的方法和装置

Publications (2)

Publication Number Publication Date
CN107122269A CN107122269A (zh) 2017-09-01
CN107122269B true CN107122269B (zh) 2020-02-28

Family

ID=59679521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610103823.6A Active CN107122269B (zh) 2016-02-25 2016-02-25 用于保证映射独立磁盘冗余阵列的可靠性的方法和装置

Country Status (2)

Country Link
US (2) US10540091B2 (zh)
CN (1) CN107122269B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10198205B1 (en) 2016-12-19 2019-02-05 Pure Storage, Inc. Dynamically adjusting a number of storage devices utilized to simultaneously service write operations
CN109726033B (zh) * 2017-10-31 2022-05-06 伊姆西Ip控股有限责任公司 提供raid数据保护的方法、数据存储系统和计算机可读介质
US10649867B2 (en) * 2017-12-15 2020-05-12 Western Digital Technologies, Inc. RAID array rebuild assist from external array copy
CN110058960B (zh) * 2018-01-18 2023-05-16 伊姆西Ip控股有限责任公司 用于管理存储系统的方法、设备和计算机程序产品
CN110737401B (zh) * 2018-07-20 2023-10-20 伊姆西Ip控股有限责任公司 用于管理独立冗余磁盘阵列的方法、设备和计算机程序产品
CN111124260B (zh) * 2018-10-31 2023-09-08 伊姆西Ip控股有限责任公司 管理独立盘冗余阵列的方法、电子设备和计算机程序产品
CN109871186B (zh) * 2019-03-12 2021-12-07 北京计算机技术及应用研究所 面向可重组raid的多目标快速重构系统
CN109885263B (zh) * 2019-03-12 2022-02-01 北京计算机技术及应用研究所 面向可重组raid的多目标快速重构方法
US11797387B2 (en) * 2020-06-23 2023-10-24 Western Digital Technologies, Inc. RAID stripe allocation based on memory device health
CN112162708A (zh) * 2020-10-15 2021-01-01 天津津航计算技术研究所 一种硬盘阵列扫描频率计算方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8601313B1 (en) * 2010-12-13 2013-12-03 Western Digital Technologies, Inc. System and method for a data reliability scheme in a solid state memory
CN103544202A (zh) * 2012-07-10 2014-01-29 国际商业机器公司 用于安排数据处理的方法和系统
CN104111880A (zh) * 2013-04-16 2014-10-22 华中科技大学 一种容三盘失效纠删码的单数据盘失效快速重建方法
CN105353991A (zh) * 2015-12-04 2016-02-24 浪潮(北京)电子信息产业有限公司 一种磁盘阵列重建优化方法及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6516425B1 (en) * 1999-10-29 2003-02-04 Hewlett-Packard Co. Raid rebuild using most vulnerable data redundancy scheme first
US6996742B2 (en) * 2000-11-28 2006-02-07 Sedna Patent Services, Llc Method for regenerating and streaming content from a video server using RAID 5 data striping
US7669076B2 (en) * 2006-05-30 2010-02-23 Oracle International Corporation Estimating data availability on managed storage devices
US9652343B2 (en) * 2011-09-21 2017-05-16 Kevin Mark Klughart Raid hot spare system and method
US8880801B1 (en) * 2011-09-28 2014-11-04 Emc Corporation Techniques for reliability and availability assessment of data storage configurations
US20140215147A1 (en) * 2013-01-25 2014-07-31 Hewlett-Packard Development Company, L.P. Raid storage rebuild processing
US10180880B2 (en) * 2013-07-31 2019-01-15 International Business Machines Corporation Adaptive rebuilding rates based on sampling and inference
US20150046756A1 (en) * 2013-08-08 2015-02-12 Lsi Corporation Predictive failure analysis to trigger rebuild of a drive in a raid array
US9229796B1 (en) * 2013-09-25 2016-01-05 Emc Corporation System and method for determining disk failure indicator to predict future disk failures
US9244790B1 (en) * 2013-09-25 2016-01-26 Emc Corporation System and method for predicting future disk failures
CN105900067B (zh) * 2013-11-18 2018-10-23 惠普发展公司,有限责任合伙企业 指示储存器装置的重建状态
CN107526531B (zh) * 2016-06-21 2020-01-14 伊姆西公司 为映射独立盘冗余阵列(raid)选择raid级别的方法和设备
US11132256B2 (en) * 2018-08-03 2021-09-28 Western Digital Technologies, Inc. RAID storage system with logical data group rebuild
US11042452B1 (en) * 2019-03-20 2021-06-22 Pure Storage, Inc. Storage system data recovery using data recovery as a service
US11416324B2 (en) * 2019-05-23 2022-08-16 Oracle International Corporation Techniques for accurately estimating the reliability of storage systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8601313B1 (en) * 2010-12-13 2013-12-03 Western Digital Technologies, Inc. System and method for a data reliability scheme in a solid state memory
CN103544202A (zh) * 2012-07-10 2014-01-29 国际商业机器公司 用于安排数据处理的方法和系统
CN104111880A (zh) * 2013-04-16 2014-10-22 华中科技大学 一种容三盘失效纠删码的单数据盘失效快速重建方法
CN105353991A (zh) * 2015-12-04 2016-02-24 浪潮(北京)电子信息产业有限公司 一种磁盘阵列重建优化方法及装置

Also Published As

Publication number Publication date
US11294569B2 (en) 2022-04-05
US10540091B2 (en) 2020-01-21
CN107122269A (zh) 2017-09-01
US20170249089A1 (en) 2017-08-31
US20200159416A1 (en) 2020-05-21

Similar Documents

Publication Publication Date Title
CN107122269B (zh) 用于保证映射独立磁盘冗余阵列的可靠性的方法和装置
CN107526531B (zh) 为映射独立盘冗余阵列(raid)选择raid级别的方法和设备
US11106397B2 (en) Thin provisioning of raid storage
CN108733314B (zh) 用于独立冗余阵列(raid)重建的方法、设备和计算机可读存储介质
US11281536B2 (en) Method, device and computer program product for managing storage system
CN108228086B (zh) Raid重建的方法和设备
US10572345B2 (en) First responder parities for storage array
US9582363B2 (en) Failure domain based storage system data stripe layout
CN110413201B (zh) 用于管理存储系统的方法、设备和计算机程序产品
CN109213619B (zh) 用于管理存储系统的方法、设备和计算机程序产品
US20200264785A1 (en) Method and system for managing storage device
CN109725830B (zh) 管理独立磁盘冗余阵列的方法、设备和存储介质
CN107203442B (zh) 独立磁盘冗余阵列的重建性能的评估方法和设备
US10372368B2 (en) Operating a RAID array with unequal stripes
CN110413208B (zh) 用于管理存储系统的方法、设备和计算机程序产品
US11385823B2 (en) Method, electronic device and computer program product for rebuilding disk array
JP2022525919A (ja) コンピューティング・ストレージ環境におけるリビルド時間を減少させること
CN111858188A (zh) 存储管理的方法、设备和计算机程序产品
US11269745B2 (en) Two-node high availability storage system
US9690659B2 (en) Parity-layout generating method, parity-layout generating apparatus, and storage system
US11561859B2 (en) Method, device and computer program product for managing data
US11650737B2 (en) Disk offset-distance awareness data placement for storage system data protection
CN114168064A (zh) 用于重建存储系统的方法、设备和计算机程序产品
CN111857560B (zh) 用于管理数据的方法、设备和计算机程序产品
CN113590378A (zh) 存储管理的方法、设备和计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200117

Address after: Massachusetts, USA

Applicant after: Yimuxi IP holding limited liability company

Address before: Massachusetts, USA

Applicant before: Imsey Company

GR01 Patent grant
GR01 Patent grant