CN106933708B - 有助于进行存储系统恢复的方法、装置以及一种存储系统 - Google Patents

有助于进行存储系统恢复的方法、装置以及一种存储系统 Download PDF

Info

Publication number
CN106933708B
CN106933708B CN201511017523.8A CN201511017523A CN106933708B CN 106933708 B CN106933708 B CN 106933708B CN 201511017523 A CN201511017523 A CN 201511017523A CN 106933708 B CN106933708 B CN 106933708B
Authority
CN
China
Prior art keywords
disk
disk array
disks
storage system
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201511017523.8A
Other languages
English (en)
Other versions
CN106933708A (zh
Inventor
高宏坡
韩耕
董继炳
高健
龚绍钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Priority to CN201511017523.8A priority Critical patent/CN106933708B/zh
Priority to US15/384,364 priority patent/US10289490B2/en
Publication of CN106933708A publication Critical patent/CN106933708A/zh
Application granted granted Critical
Publication of CN106933708B publication Critical patent/CN106933708B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1084Degraded mode, e.g. caused by single or multiple storage removals or disk failures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1417Boot up procedures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

本发明的实施方式提供一种用于有助于进行存储系统恢复的方法,该存储系统包括用于存储该存储系统的系统信息的多个系统盘,以及与该多个系统盘关联、用于管理该多个系统盘的一个或多个磁盘阵列,该方法包括:响应于该多个系统盘中的一个或多个系统盘发生故障,确定该一个或多个磁盘阵列的性能劣化程度;以及响应于该一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第一级别,将该一个磁盘阵列的启动信息置为第一值,该第一值用于在该存储系统的启动过程中指示跳过对该一个磁盘阵列的创建。

Description

有助于进行存储系统恢复的方法、装置以及一种存储系统
技术领域
本发明的实施方式涉及存储系统领域,更具体地,涉及一种用于从故障中有助于进行存储系统恢复的方法和装置、一种启动存储系统的方法和装置、以及一种存储系统。
背景技术
存储系统是指计算机中由存放程序和数据的各种存储设备、控制部件及管理信息调度的设备和算法所组成的系统。在存储系统包括多个磁盘驱动(或简称为磁盘)的情况下,通常将一部分磁盘驱动用于存储存储系统的系统信息,由存储系统自身使用,这部分磁盘驱动在本文中被称为“系统盘驱动”(或简称为“系统盘”)。与之相对地,其余由用户用来存储数据的磁盘驱动被称为“用户盘驱动”(或简称为“用户盘”)。由于系统盘中存储的是与系统相关的信息,对于存储系统的运行来说至关重要,因此,对系统盘的管理以及在系统盘发生故障时,如何从故障中恢复系统盘、进而恢复存储系统成为存储系统领域的研究热点之一。
目前,独立磁盘冗余阵列(以下简称为“RAID”或“磁盘阵列”)广泛应用于管理存储系统的系统盘,其利用数据和设备的冗余度而防止由于磁盘或者存储设备的失效造成的数据丢失。根据保护程度需求的不同,定义有不同的RAID级别,例如RAID0、RAID1、RAID3、RAID5、RAID6、RAID10、三重镜像(Triple Mirror)等。然而,即便采用RAID来管理系统盘,如果发生故障的系统盘的数目过大(如针对RAID3或RAID5,两块系统盘发生故障),也无法依赖于RAID的冗余度而恢复系统盘数据。在这一情形下,现有技术的做法往往是将系统盘返回厂商、系统盘将被重新镜像到初始状态。这样造成的结果是,所有阵列中的数据都将丢失,系统将还原到出厂默认状态,既增加了成本效率也很低下。
发明内容
为了解决现有技术中存在的问题,本公开的各个实施方式提供一种有助于进行存储系统恢复的方案、相应的启动存储系统的方案以及该存储系统本身。
根据本发明的第一方面,提供一种有助于进行存储系统恢复的方法,该存储系统包括用于存储该存储系统的系统信息的多个系统盘,以及与该多个系统盘关联以用于管理该多个系统盘的一个或多个磁盘阵列,该方法包括:响应于该多个系统盘中的一个或多个系统盘发生故障,确定该一个或多个磁盘阵列的性能劣化程度;以及响应于该一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第一级别,将该一个磁盘阵列的启动信息置为第一值,该第一值用于在该存储系统的启动过程中指示跳过对该一个磁盘阵列的创建。
在本发明的可选实施方式中,该方法进一步包括响应于发生故障的系统盘中的一个系统盘被替换,确定该一个或多个磁盘阵列的性能劣化程度;以及响应于该一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第二级别,通知该一个磁盘阵列该一个系统盘的数据要被恢复。在本发明的进一步可选实施方式中,该第一级别劣于该第二级别。
在本发明的可选实施方式中,该方法进一步包括:当与该一个系统盘关联的所有磁盘阵列均被通知该一个系统盘的数据要被恢复时,将替换后的系统盘作为存储系统的一部分使用。在本发明的进一步可选实施方式中,该方法还包括从该存储系统的备份数据中恢复该被替换的系统盘的数据。
在本发明的可选实施方式中,在替换后的系统盘作为存储系统的一部分使用之后,该方法进一步包括:将其值为第一值的该启动信息修改为第二值,该第二值用于在该存储系统的启动过程中指示创建与之相应的磁盘阵列,且被创建的该磁盘阵列中的所有数据将被置零。
在本发明的可选实施方式中,该第一级别或该第二级别根据发生故障的系统盘的数量来确定。
在本发明的可选实施方式中,磁盘阵列包括RAID 3和RAID 5中的至少一种。
在本发明的可选实施方式中,该一个或多个系统盘发生故障包括两个系统盘发生故障。
根据本发明的第二方面,提供一种启动存储系统的方法,该存储系统包括用于存储该存储系统的系统信息的多个系统盘,以及与该多个系统盘关联以用于管理该多个系统盘由一个或多个磁盘阵列,该方法包括:读取该一个或多个磁盘阵列的相应启动信息;以及响应于该一个或多个磁盘阵列中的一个磁盘阵列的启动信息为第一值,跳过对该一个磁盘阵列的创建。
在本发明的可选实施方式中,该方法进一步包括:响应于该一个或多个磁盘阵列中的一个磁盘阵列的启动信息为不同于该第一值的第二值,创建该一个磁盘阵列。
根据本发明的第三方面,提供一种有助于进行存储系统恢复的装置,该存储系统包括用于存储该存储系统的系统信息的多个系统盘,以及与该多个系统盘关联以用于管理该多个系统盘的一个或多个磁盘阵列,该装置包括:第一确定装置,用于响应于该多个系统盘中的一个或多个系统盘发生故障,确定该一个或多个磁盘阵列的性能劣化程度;以及第一设置装置,用于响应于该一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第一级别,将该一个磁盘阵列的启动信息置为第一值,该第一值用于在该存储系统的启动过程中指示跳过对该一个磁盘阵列的创建。
在本发明的可选实施方式中,该装置进一步包括:第二确定装置,用于响应于发生故障的该系统盘中的一个系统盘被替换,确定该一个或多个磁盘阵列的性能劣化程度;以及通知装置,响应于该一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第二级别,通知该一个磁盘阵列该一个系统盘的数据要被恢复。在本发明的进一步可选实施方式中,该第一级别劣于该第二级别。
在本发明的可选实施方式中,该装置进一步包括:新盘上线装置,用于当与该一个系统盘关联的所有磁盘阵列均被通知该一个系统盘的数据要被恢复时,将替换后的该系统盘作为存储系统的一部分使用。在本发明的进一步可选实施方式中,该新盘上线装置进一步用于在替换后的系统盘作为存储系统的一部分使用之后,将其值为第一值的该启动信息修改为第二值。
在本发明的可选实施方式中,该装置进一步包括:恢复装置,用于从该存储系统的备份数据中恢复该被替换的系统盘的数据。
在本发明的可选实施方式中,该第一级别或该第二级别根据发生故障的该系统盘的数量来确定。
在本发明的可选实施方式中,该磁盘阵列包括RAID 3和RAID 5中的至少一种。
在本发明的可选实施方式中,该一个或多个系统盘发生故障包括两个系统盘发生故障。
根据本发明的第四方面,提供一种启动存储系统的装置,该存储系统包括用于存储系统信息的多个系统盘,以及与所述多个系统盘关联以用于管理该多个系统盘的一个或多个磁盘阵列,该装置包括:读取装置,用于读取该一个或多个磁盘阵列的相应启动信息;以及创建装置,用于响应于该一个或多个磁盘阵列中的一个磁盘阵列的启动信息为第一值,跳过对该一个磁盘阵列的创建。
在本发明的可选实施方式中,该创建装置进一步用于:响应于该一个或多个磁盘阵列中的一个磁盘阵列的启动信息为不同于该第一值的第二值,创建该一个磁盘阵列。
根据本发明的第五方面,提供一种存储系统,包括:多个系统盘,用于存储该存储系统的系统信息;以及一个或多个磁盘阵列,用于管理该多个系统盘;其中,该多个系统盘的一个或多个系统盘中存储有分别用于该一个或多个磁盘阵列的一个或多个启动信息,并且其中,当该启动信息的值为第一值时,指示在该存储系统的启动过程中跳过对相应磁盘阵列的创建。
根据本发明的上述实施方式,可以在一个或多个系统盘发生故障时,有助于使得新盘成功上线,从而能够低成本、高效地从故障中恢复存储系统。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1图示了一种典型的包括系统盘和用户盘的阵列。
图2图示了系统盘上的示意性存储区域布局。
图3图示了根据本发明示例实施方式的用于恢复存储系统的方法300。
图4图示了根据本发明示例实施方式的用于启动存储系统的方法400。
图5图示了根据本发明示例实施方式的用于恢复存储系统的装置500的示意性框图。
图6图示了根据本发明示例实施方式的用于启动存储系统的装置600的示意性框图。
图7示出了适于用来实践本发明示例实施方式的计算机系统700的示意性框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整的传达给本领域的技术人员。另外,贯穿附图,相似的标号表示相同或相似的部件。
图1图示了一种典型的包括系统盘和用户盘的阵列。如图1所示,第0-3号磁盘驱动为系统盘,而第4-n号磁盘驱动为用户盘。本领域技术人员应当理解,虽然图1仅示出系统盘包括4块磁盘驱动,然而,在实现中,根据具体需求,系统盘可以是任何其他数目,本发明在此方面不受限制。
为了便于说明,以下以系统盘包括4块磁盘驱动为例。图2图示了系统盘上的示意性存储区域布局。如图2所示,系统盘驱动0-3分别被划分成若干区域(如区域1、2、3、4…),其中每个区域由具有特定级别的RAID管理。例如,区域1由三重镜像RAID 201管理,区域2由级别为RAID 5的RAID 202管理,区域3由级别为RAID 3的RAID 203管理,等等。总体而言,每个系统盘驱动将会与一个或多个RAID相关。本领域技术人员也应当理解,虽然图2具体示出了三个区域的RAID 201-203,但在实现中,根据具体需要还可以包括其他各种RAID,本发明在此方面不受限制。
在如图2所示的布局中,如果仅一块系统盘0发生故障或丢失,由于各RAID均提供冗余数据,区域1-3的性能虽然会劣化,但仍能提供I/O服务。在两块系统盘0和1发生故障或丢失时,针对三重镜像RAID 201,由于丢失的数据仍然可以从剩余的盘中恢复,因此其性能虽然会劣化,但仍能提供I/O服务。然而,针对RAID 5 202或RAID 3 203,由于其所提供的冗余度已经无法支持对盘数据的恢复,因此RAID 5 202或RAID 3 203级别的区域(例如图2中的区域2和3)将为“损坏”状态(broken),并且无法提供I/O服务。此时,需要用新盘代替发生故障或丢失的系统盘,这样,三重镜像RAID 201能够从尚未损坏的系统数据中自动重构丢失的数据;而RAID 5 203或RAID 3 203则需要通过从备份数据中恢复丢失的数据。
无论哪种情形,都需要使得新盘能够被存储系统所接受,并能够作为存储系统的一部分来使用。为了便于说明,本文中将用新盘替换发生故障的系统盘、并作为存储系统的一部分使用的过程称为“新盘初始化”。每块新盘的初始化过程主要包括以下步骤:
1、将新盘的配置信息更新到存储系统中;
2、在已创建的(也即正在运行的)所有磁盘阵列中,通知其性能处于劣化但仍可从中恢复的磁盘阵列(例如,图2中,RAID 5 202或RAID 3 203在坏一块系统盘时可恢复;三重镜像RAID 201在坏一块或两块系统盘时可恢复)要恢复盘中的数据;
3、当与该新盘(或被替换掉的原有系统盘)相关联的所有已创建的磁盘阵列均被通知要恢复盘中的数据时,将该新盘加入到存储系统中,供存储系统使用。
可以看到,在已创建的磁盘阵列中,如果存在性能极端劣化——例如磁盘阵列处于“损坏”状态(例如,图2中,RAID 5 202或RAID 3 203在坏两块系统盘时为“损坏”状态)——的磁盘阵列,则步骤2不会通知该磁盘阵列要恢复盘中的数据,从而在步骤3中由于与该盘相关联的磁盘阵列(例如针对系统盘0,共有三重镜像RAID 201、RAID 5 202和RAID3 203与之关联)中存在磁盘阵列没有被通知要恢复盘中的数据(例如图2中,坏两块系统盘,RAID 5 202和RAID 3 203由于处于“损坏”状态而没有被通知)而不会进行,导致的结果是新盘初始化无法完成,该新盘不能作为存储系统的一部分来使用。
为了解决此问题,图3图示了根据本发明示例实施方式的有助于进行存储系统恢复的方法300。该存储系统包括用于存储该存储系统的系统信息的多个系统盘,以及与该多个系统盘关联以用于管理该多个系统盘的一个或多个磁盘阵列。该方法300包括步骤S301,响应于多个系统盘中的一个或多个系统盘发生故障,确定该一个或多个磁盘阵列的性能劣化程度。
如前所述,在系统盘发生故障时,与该系统盘关联以用于管理该系统盘的一个或多个磁盘阵列的性能会劣化。取决于故障的严重程度(例如所损坏的系统盘的数目),磁盘阵列的性能劣化程度也有所不同。例如,在一般的劣化情况下,磁盘阵列能够从中恢复,而在极端劣化的情况下,磁盘阵列可能处于“损坏”状态,磁盘阵列无法恢复。因此,步骤S301中所称的性能劣化既包括磁盘阵列能够从中恢复的一般劣化,也包括极端劣化下的“损坏”的情况。
接下来,方法300前进到步骤S302,响应于该一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第一级别,将该一个磁盘阵列的启动信息置为第一值,该第一值用于在存储系统启动过程中指示跳过对该一个磁盘阵列的创建。
应当理解,每个磁盘阵列均具有各自的启动信息。每次存储系统启动时,都要逐一创建各个磁盘阵列。在创建过程中,要参考其对应的启动信息以例如了解这次启动是正常启动创建RAID还是新盘上线后重新创建RAID。其中,在正常启动创建RAID和新盘上线后重新创建RAID的情况下均会创建相应的RAID,不同之处仅在于后者在RAID被创建之后,其中的数据将全被置为零。启动信息可以以例如三重镜像RAID的方式存储在系统盘中,供创建磁盘阵列时取用。
在根据本发明的示例实施方式中,除了上述正常启动创建和重新创建这两种创建磁盘阵列的指示之外,还可以例如提供另一种“不创建”指示。当启动信息为“不创建”指示时,表明在存储系统的启动过程中,跳过(或不进行)该启动信息所对应的磁盘阵列的创建,而进行下一磁盘阵列的创建环节。在根据本发明的实施方式的方法300的步骤S302中,控制使得处于预定级别(如第一级别)性能劣化程度的磁盘阵列不进行创建。
以图2的布局为例,在系统盘0和系统盘1均被损坏的情况下,根据图3的方法300可使得处于例如“损坏”状态的RAID 5 202和RAID 3 203的启动信息均被置为“不创建”,从而在启动存储系统时,RAID 5 202和RAID 3 203将均被跳过创建,而仅有三重镜像RAID 201被创建。也即,已创建或正在运行的磁盘阵列仅包括三重镜像RAID 201。这时,针对每一块发生故障的系统盘,在用新盘替换该系统盘、从而执行新盘初始化的过程中,已创建的磁盘阵列中并不包括RAID 5 202和RAID 3 203;而三重镜像RAID 201由于为劣化状态会被通知恢复盘中的数据,新盘初始化过程的步骤2就能够顺利执行。接着,由于与盘0和1相关联的已创建的磁盘阵列仅有三重镜像RAID 201,而该RAID又被通知要恢复盘中的数据,因此步骤3也能够顺利执行,从而能够完成新盘的初始化。
一旦新盘能够成功被初始化,存储系统就能够自动或手动地恢复原有系统盘的数据。例如,在图2中,针对三重镜像RAID 201,在替换两块系统盘0和1的情况下,可以从尚未被替换的系统盘2恢复数据;而针对RAID 5 202和RAID 3 203,可以从备份数据中恢复系统盘的数据。从而避免了将系统盘返回厂商造成全部数据的重新写入,节约了成本的同时提高了效率。
应当理解,虽然在对图3的说明中以图2的布局为例,针对RAID 5、RAID 3进行了详细描述,但本发明并不局限于此。例如,根据不同的磁盘阵列提供的冗余程度,步骤S302中的“第一级别”所代表的性能劣化程度或者损坏的系统盘的数目均可以有所不同。
此外,根据本发明的进一步实施方式,方法300还可以包括步骤:响应于发生故障的所述系统盘中的一个系统盘被替换,确定所述一个或多个磁盘阵列的性能劣化程度;以及响应于所述一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第二级别,通知所述一个磁盘阵列所述一个系统盘的数据要被恢复。
如前所述,在存储系统的系统盘发生故障后,要用新盘替换原有的故障盘。在新盘插入对应槽中时,触发前述的新盘初始化的过程。在该过程中,首先确定一个或多个磁盘阵列的性能劣化程度。本领域技术人员应当理解,这里所称的要被确定性能劣化程度的“一个或多个磁盘阵列”指的是已创建好的或当前正在运行的磁盘阵列。对于性能劣化程度为第二级别的磁盘阵列,通知该磁盘阵列该被替换的系统盘的数据要被恢复。需要注意的是,这里所称的“第二级别”的具体含义可以根据实际实现而有所差别,例如,其可以是指其性能处于劣化但仍可从中恢复的磁盘阵列(例如,图2中,RAID 5 202或RAID 3 203在坏一块系统盘时可以恢复;三重镜像RAID 201在坏一块或两块系统盘时可以恢复)。在根据本申请的一个具体实现中,劣化程度是处于第一级别还是第二级别可以根据发生故障的系统盘的数量来确定。例如,针对图2的布局,坏一块系统盘时,RAID 5 202、RAID 3 203和三重镜像RAID 201均处于一般劣化级别,而坏两块系统盘时,三重镜像RAID 201处于一般劣化级别,但RAID 5 202和RAID 3 203处于损坏级别。可选地,第一级别劣于第二级别。
另外,在本发明的可选实施方式中,方法300的步骤S301中一个或多个系统盘发生故障包括两块系统盘发生故障的情况,以便针对例如RAID 5或RAID 3的情形。
根据本发明的进一步实施方式,方法300还可以包括如下步骤:当与所述一个系统盘关联的所有磁盘阵列均被通知所述一个系统盘的数据要被恢复时,将替换后的系统盘作为存储系统的一部分使用。
需要注意的是,该步骤中的“与所述一个系统盘关联的所有磁盘阵列”是指在已经创建或正在运行的磁盘阵列中,与该系统盘关联的所有磁盘阵列,而并不包括原本与系统盘关联但由于某些原因(例如其启动信息被置为“不创建”)没有被实际创建的磁盘阵列。以图2所示的布局为例,在系统盘0和1损坏、更换系统盘0的情况下,虽然原本与系统盘0关联的磁盘阵列有三重镜像RAID 201、RAID 5 202和RAID 3 203,但如果RAID 5 202和RAID 3203因为启动信息被置为“不创建”而没有被创建,此时与系统盘0关联的磁盘阵列仅有三重镜像RAID 201。在三重镜像RAID 201被通知要恢复盘中的数据时,即可将新盘加入到存储系统中,供存储系统使用。进而,在根据本发明的进一步实施方式中,可以从存储系统的备份数据中恢复被替换的系统盘的数据。
此外,根据本申请的更进一步实施方式,在替换后的系统盘作为存储系统的一部分使用之后,方法300还可以包括:将其值为第一值的启动信息修改为第二值,该第二值用于在所述存储系统的启动过程中指示创建与之相应的磁盘阵列、且被创建的所述磁盘阵列中的所有数据将被置零。
由于在方法300中,为了使得新盘能够成功被初始化,可能跳过了某些磁盘阵列(例如性能劣化程度为第一级别)的创建。此时,在新盘被成功初始化之后,需要对先前跳过创建的磁盘阵列重新建立。为此,将先前被置为第一值的启动信息的值修改为不同于该第一值的第二值。例如,在实现中,第二值可以为“重新创建”或“创建”等等。该第二值会在下次存储系统的启动过程中,指示创建该启动信息对应的磁盘阵列。可选地,针对新盘刚被初始化的情况,可以将第二值置为诸如“重新创建”之类的值,从而指示在启动过程中,该磁盘阵列中的所有数据都将被置零。
至此,方法300结束。
以下参照附图4描述根据本发明示例实施方式的用于启动存储系统的方法400。该存储系统包括用于存储该存储系统的系统信息的多个系统盘,以及与该多个系统盘关联以用于管理该多个系统盘的一个或多个磁盘阵列。该方法400包括步骤S401,读取该一个或多个磁盘阵列的相应启动信息;以及步骤S402,响应于该一个或多个磁盘阵列中的一个磁盘阵列的启动信息为第一值,跳过对该磁盘阵列的创建。
本领域技术人员应当理解,方法400中的各术语的含义以及相关实现与前文参照图3描述的方法300类似。例如,根据方法300的步骤S302所描述的启动信息将用于方法400的步骤S401和S402中。因此,方法400的示例性实现细节参照方法300类似地执行,不再赘述。同样,通过方法400所描述的用于启动存储系统的方法,可以使得存储系统在启动过程中有选择地跳过创建某些性能劣化到一定程度的磁盘阵列,从而保证用新盘更换发生故障的系统盘的过程能够顺利进行,最终低成本且高效地恢复发生故障的存储系统。
接下来参照附图5描述根据本发明示例实施方式的用于恢复存储系统的装置500,该存储系统包括用于存储该存储系统的系统信息的多个系统盘以及与该多个系统盘关联以用于管理该多个系统盘的一个或多个磁盘阵列。如图5所示,该装置500包括:第一确定装置501,用于响应于该多个系统盘中的一个或多个系统盘发生故障,确定该一个或多个磁盘阵列的性能劣化程度;以及第一设置装置502,用于响应于该一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第一级别,将该一个磁盘阵列的启动信息置为第一值,该第一值用于在该存储系统的启动过程中指示跳过对该一个磁盘阵列的创建。
在本发明的可选实施方式中,该装置500进一步包括:第二确定装置,用于响应于发生故障的该系统盘中的一个系统盘被替换,确定该一个或多个磁盘阵列的性能劣化程度;以及通知装置,响应于该一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第二级别,通知该一个磁盘阵列该一个系统盘的数据要被恢复。在本发明的进一步可选实施方式中,该第一级别劣于该第二级别。
在本发明的可选实施方式中,该装置500进一步包括:新盘上线装置,用于当与该一个系统盘关联的所有磁盘阵列均被通知该一个系统盘的数据要被恢复时,将替换后的系统盘作为存储系统的一部分使用。在本发明的进一步可选实施方式中,该新盘上线装置进一步用于在替换后的系统盘作为存储系统的一部分使用之后,将其值为第一值的启动信息修改为第二值。
在本发明的可选实施方式中,该装置500进一步包括:恢复装置,用于从该存储系统的备份数据中恢复该被替换的系统盘的数据。
在本发明的可选实施方式中,该第一级别或第二级别根据发生故障的系统盘的数量来确定。
在本发明的可选实施方式中,该磁盘阵列包括RAID 3和RAID 5中的至少一种。
在本发明的可选实施方式中,该一个或多个系统盘发生故障包括两个系统盘发生故障。
以下参照附图6描述根据本发明示例实施方式的用于启动存储系统的装置600。该存储系统包括用于存储系统信息的多个系统盘,以及与该多个系统盘关联以用于管理该多个系统盘的一个或多个磁盘阵列,该装置600包括:读取装置601,用于读取该一个或多个磁盘阵列的相应启动信息;以及创建装置602,用于响应于该一个或多个磁盘阵列中的一个磁盘阵列的启动信息为第一值,跳过对该一个磁盘阵列的创建。
在本发明的可选实施方式中,该创建装置进一步用于:响应于该一个或多个磁盘阵列中的一个磁盘阵列的启动信息为不同于该第一值的第二值,创建该一个磁盘阵列。
下面参考图7,其示出了适于用来实现本发明示例实施方式的计算机系统700的示意性框图。例如,图7所示的计算机系统700可以用于实现如上文描述的用于恢复存储系统的装置500以及用于启动存储系统的装置600的各个部件,也可以用于固化或实现如上文描述的用于恢复存储系统的方法300以及用于启动存储系统的方法400的各个步骤。
如图7所示,计算机系统可以包括:CPU(中央处理单元)701、RAM(随机存取存储器)702、ROM(只读存储器)703、系统总线704、硬盘控制器705、键盘控制器706、串行接口控制器707、并行接口控制器708、显示控制器709、硬盘710、键盘711、串行外部设备712、并行外部设备713和显示器714。在这些设备中,与系统总线704耦合的有CPU 701、RAM 702、ROM 703、硬盘控制器705、键盘控制器706、串行控制器707、并行控制器708和显示控制器709。硬盘710与硬盘控制器705耦合,键盘711与键盘控制器706耦合,串行外部设备712与串行接口控制器707耦合,并行外部设备713与并行接口控制器708耦合,以及显示器714与显示控制器709耦合。应当理解,图7所述的结构框图仅仅为了示例的目的而示出,而不是对本发明范围的限制。在某些情况下,可以根据具体情况而增加或者减少某些设备。
如上所述,系统300可以实现为纯硬件,例如芯片、ASIC、SOC等。这些硬件可以集成在计算机系统700中。此外,本发明的实施方式也可以通过计算机程序产品的形式实现。例如,参考图3或4描述的方法300或400可以通过计算机程序产品来实现。该计算机程序产品可以存储在例如图7所示的RAM 702、ROM 703、硬盘710和/或任何适当的存储介质中,或者通过网络从适当的位置下载到计算机系统700上。计算机程序产品可以包括计算机代码部分,其包括可由适当的处理设备(例如,图7中示出的CPU 701)执行的程序指令。所述程序指令至少可以包括用于实现方法300的步骤的指令。这些指令例如包括:用于响应于所述多个系统盘中的一个或多个系统盘发生故障,确定所述一个或多个磁盘阵列的性能劣化程度的指令;以及用于响应于所述一个或多个磁盘阵列中的一个磁盘阵列的性能劣化程度为第一级别,将所述一个磁盘阵列的启动信息置为第一值的指令,所述第一值用于在所述存储系统的启动过程中指示跳过对所述一个磁盘阵列的创建。
上文已经结合若干具体实施方式阐释了本发明的精神和原理。根据本发明的用于恢复存储系统的方法和装置、以及用于启动存储系统的方法和装置相对于现有技术具有诸多优点。例如,本发明可以在存储系统的系统盘发生故障时,使得存储系统在启动过程中有选择地跳过创建某些性能劣化到一定程度的磁盘阵列,从而保证用新盘更换发生故障地系统盘的过程能够顺利进行,最终低成本且高效地恢复发生故障的存储系统。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
应当注意,尽管在上文详细描述中提及了设备的若干装置或子装置,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。虽然已经参考若干具体实施方式描述了本发明,但是应该理解,本发明并不限于所公开的具体实施方式。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释,从而包含所有这样的修改及等同结构和功能。

Claims (23)

1.一种有助于进行存储系统恢复的方法,所述存储系统包括用于存储所述存储系统的系统信息的多个系统盘,以及与所述多个系统盘关联以用于管理所述多个系统盘的至少一个磁盘阵列,所述方法包括:
响应于所述多个系统盘中的至少一个系统盘发生故障,确定所述至少一个磁盘阵列的性能劣化程度;以及
响应于所述至少一个磁盘阵列中的一个磁盘阵列的性能劣化程度为第一级别,将所述一个磁盘阵列的启动信息置为第一值,所述第一值用于在所述存储系统的启动过程中指示跳过对所述一个磁盘阵列的创建。
2.根据权利要求1所述的方法,进一步包括:
响应于发生故障的所述系统盘中的一个系统盘被替换,确定所述至少一个磁盘阵列的性能劣化程度;以及
响应于所述至少一个磁盘阵列中的一个磁盘阵列的性能劣化程度为第二级别,通知所述一个磁盘阵列所述一个系统盘的数据要被恢复。
3.根据权利要求2所述的方法,其中,所述第一级别劣于所述第二级别。
4.根据权利要求2所述的方法,进一步包括:
当与所述一个系统盘关联的所有磁盘阵列均被通知所述一个系统盘的数据要被恢复时,将替换后的系统盘作为存储系统的一部分使用。
5.根据权利要求4所述的方法,进一步包括:
从所述存储系统的备份数据中恢复所述被替换的系统盘的数据。
6.根据权利要求5所述的方法,其中,在替换后的系统盘作为存储系统的一部分使用之后,所述方法进一步包括:
将其值为第一值的所述启动信息修改为第二值,所述第二值用于在所述存储系统的启动过程中指示创建与之相应的磁盘阵列、且被创建的所述磁盘阵列中的所有数据将被置零。
7.根据权利要求2所述的方法,所述第一级别或所述第二级别根据发生故障的所述系统盘的数量来确定。
8.根据权利要求1所述的方法,其中,所述磁盘阵列包括RAID 3和RAID 5中的至少一种。
9.根据权利要求1所述的方法,其中,所述至少一个系统盘发生故障包括两个系统盘发生故障。
10.一种启动存储系统的方法,所述存储系统包括用于存储所述存储系统的系统信息的多个系统盘,以及与所述多个系统盘关联以用于管理所述多个系统盘的至少一个磁盘阵列,所述方法包括:
读取所述至少一个磁盘阵列的相应启动信息;以及
响应于所述至少一个磁盘阵列中的一个磁盘阵列的启动信息为第一值,跳过对所述一个磁盘阵列的创建。
11.根据权利要求10所述的方法,进一步包括:
响应于所述至少一个磁盘阵列中的一个磁盘阵列的启动信息为不同于所述第一值的第二值,创建所述一个磁盘阵列。
12.一种有助于进行存储系统恢复的装置,所述存储系统包括用于存储所述存储系统的系统信息的多个系统盘,以及与所述多个系统盘关联以用于管理所述多个系统盘的至少一个磁盘阵列,所述装置包括:
第一确定装置,用于响应于所述多个系统盘中的至少一个系统盘发生故障,确定所述至少一个磁盘阵列的性能劣化程度;以及
第一设置装置,用于响应于所述至少一个磁盘阵列中的一个磁盘阵列的性能劣化程度为第一级别,将所述一个磁盘阵列的启动信息置为第一值,所述第一值用于在所述存储系统的启动过程中指示跳过对所述一个磁盘阵列的创建。
13.根据权利要求12所述的装置,进一步包括:
第二确定装置,用于响应于发生故障的所述系统盘中的一个系统盘被替换,确定所述至少一个磁盘阵列的性能劣化程度;以及
通知装置,响应于所述至少一个磁盘阵列中的一个磁盘阵列的性能劣化程度为第二级别,通知所述一个磁盘阵列所述一个系统盘的数据要被恢复。
14.根据权利要求13所述的装置,其中,所述第一级别劣于所述第二级别。
15.根据权利要求13所述的装置,进一步包括:
新盘上线装置,用于当与所述一个系统盘关联的所有磁盘阵列均被通知所述一个系统盘的数据要被恢复时,将替换后的所述系统盘作为存储系统的一部分使用。
16.根据权利要求15所述的装置,进一步包括:
恢复装置,用于从所述存储系统的备份数据中恢复所述被替换的系统盘的数据。
17.根据权利要求15所述的装置,其中,新盘上线装置进一步用于在替换后的系统盘作为存储系统的一部分使用之后,将其值为第一值的所述启动信息修改为第二值。
18.根据权利要求13所述的装置,其中,所述第一级别或所述第二级别根据发生故障的所述系统盘的数量来确定。
19.根据权利要求12所述的装置,其中,所述磁盘阵列包括RAID 3和RAID 5中的至少一种。
20.根据权利要求12所述的装置,其中,所述至少一个系统盘发生故障包括两个系统盘发生故障。
21.一种启动存储系统的装置,所述存储系统包括用于存储所述存储系统的系统信息的多个系统盘,以及与所述多个系统盘关联以用于管理所述多个系统盘的至少一个磁盘阵列,所述装置包括:
读取装置,用于读取所述至少一个磁盘阵列的相应启动信息;以及
创建装置,用于响应于所述至少一个磁盘阵列中的一个磁盘阵列的启动信息为第一值,跳过对所述一个磁盘阵列的创建。
22.根据权利要求21所述的装置,所述创建装置进一步用于:
响应于所述至少一个磁盘阵列中的一个磁盘阵列的启动信息为不同于所述第一值的第二值,创建所述一个磁盘阵列。
23.一种存储系统,包括:
多个系统盘,用于存储所述存储系统的系统信息;以及
至少一个磁盘阵列,用于管理所述多个系统盘;
其中,所述多个系统盘的至少一个系统盘中存储有分别用于所述至少一个磁盘阵列的至少一个启动信息,并且其中,当所述启动信息的值为第一值时,指示在所述存储系统的启动过程中跳过对相应磁盘阵列的创建。
CN201511017523.8A 2015-12-29 2015-12-29 有助于进行存储系统恢复的方法、装置以及一种存储系统 Active CN106933708B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201511017523.8A CN106933708B (zh) 2015-12-29 2015-12-29 有助于进行存储系统恢复的方法、装置以及一种存储系统
US15/384,364 US10289490B2 (en) 2015-12-29 2016-12-20 Method and apparatus for facilitating storage system recovery and relevant storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511017523.8A CN106933708B (zh) 2015-12-29 2015-12-29 有助于进行存储系统恢复的方法、装置以及一种存储系统

Publications (2)

Publication Number Publication Date
CN106933708A CN106933708A (zh) 2017-07-07
CN106933708B true CN106933708B (zh) 2020-03-20

Family

ID=59088395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511017523.8A Active CN106933708B (zh) 2015-12-29 2015-12-29 有助于进行存储系统恢复的方法、装置以及一种存储系统

Country Status (2)

Country Link
US (1) US10289490B2 (zh)
CN (1) CN106933708B (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110058963B (zh) * 2018-01-18 2023-05-09 伊姆西Ip控股有限责任公司 用于管理存储系统的方法、设备和计算机程序产品
CN110389858B (zh) * 2018-04-20 2023-06-09 伊姆西Ip控股有限责任公司 存储设备的故障恢复方法和设备
WO2019222958A1 (en) 2018-05-24 2019-11-28 Alibaba Group Holding Limited System and method for flash storage management using multiple open page stripes
US11816043B2 (en) 2018-06-25 2023-11-14 Alibaba Group Holding Limited System and method for managing resources of a storage device and quantifying the cost of I/O requests
US11327929B2 (en) 2018-09-17 2022-05-10 Alibaba Group Holding Limited Method and system for reduced data movement compression using in-storage computing and a customized file system
US11061735B2 (en) 2019-01-02 2021-07-13 Alibaba Group Holding Limited System and method for offloading computation to storage nodes in distributed system
US10860223B1 (en) 2019-07-18 2020-12-08 Alibaba Group Holding Limited Method and system for enhancing a distributed storage system by decoupling computation and network tasks
US11617282B2 (en) 2019-10-01 2023-03-28 Alibaba Group Holding Limited System and method for reshaping power budget of cabinet to facilitate improved deployment density of servers
US11055190B1 (en) * 2020-01-03 2021-07-06 Alibaba Group Holding Limited System and method for facilitating storage system operation with global mapping to provide maintenance without a service interrupt
US11449455B2 (en) 2020-01-15 2022-09-20 Alibaba Group Holding Limited Method and system for facilitating a high-capacity object storage system with configuration agility and mixed deployment flexibility
US11379447B2 (en) 2020-02-06 2022-07-05 Alibaba Group Holding Limited Method and system for enhancing IOPS of a hard disk drive system based on storing metadata in host volatile memory and data in non-volatile memory using a shared controller
US11449386B2 (en) 2020-03-20 2022-09-20 Alibaba Group Holding Limited Method and system for optimizing persistent memory on data retention, endurance, and performance for host memory
US11301173B2 (en) 2020-04-20 2022-04-12 Alibaba Group Holding Limited Method and system for facilitating evaluation of data access frequency and allocation of storage device resources
US11385833B2 (en) 2020-04-20 2022-07-12 Alibaba Group Holding Limited Method and system for facilitating a light-weight garbage collection with a reduced utilization of resources
CN111538613B (zh) * 2020-04-28 2023-06-13 浙江大华技术股份有限公司 一种集群系统异常恢复处理方法及装置
US11281575B2 (en) 2020-05-11 2022-03-22 Alibaba Group Holding Limited Method and system for facilitating data placement and control of physical addresses with multi-queue I/O blocks
US11494115B2 (en) 2020-05-13 2022-11-08 Alibaba Group Holding Limited System method for facilitating memory media as file storage device based on real-time hashing by performing integrity check with a cyclical redundancy check (CRC)
US11461262B2 (en) 2020-05-13 2022-10-04 Alibaba Group Holding Limited Method and system for facilitating a converged computation and storage node in a distributed storage system
US11507499B2 (en) 2020-05-19 2022-11-22 Alibaba Group Holding Limited System and method for facilitating mitigation of read/write amplification in data compression
US11556277B2 (en) 2020-05-19 2023-01-17 Alibaba Group Holding Limited System and method for facilitating improved performance in ordering key-value storage with input/output stack simplification
US11263132B2 (en) 2020-06-11 2022-03-01 Alibaba Group Holding Limited Method and system for facilitating log-structure data organization
US11422931B2 (en) 2020-06-17 2022-08-23 Alibaba Group Holding Limited Method and system for facilitating a physically isolated storage unit for multi-tenancy virtualization
US11354200B2 (en) 2020-06-17 2022-06-07 Alibaba Group Holding Limited Method and system for facilitating data recovery and version rollback in a storage device
US11354233B2 (en) 2020-07-27 2022-06-07 Alibaba Group Holding Limited Method and system for facilitating fast crash recovery in a storage device
US11372774B2 (en) 2020-08-24 2022-06-28 Alibaba Group Holding Limited Method and system for a solid state drive with on-chip memory integration
US11487465B2 (en) 2020-12-11 2022-11-01 Alibaba Group Holding Limited Method and system for a local storage engine collaborating with a solid state drive controller
US11734115B2 (en) 2020-12-28 2023-08-22 Alibaba Group Holding Limited Method and system for facilitating write latency reduction in a queue depth of one scenario
US11416365B2 (en) 2020-12-30 2022-08-16 Alibaba Group Holding Limited Method and system for open NAND block detection and correction in an open-channel SSD
US11726699B2 (en) 2021-03-30 2023-08-15 Alibaba Singapore Holding Private Limited Method and system for facilitating multi-stream sequential read performance improvement with reduced read amplification
US11461173B1 (en) 2021-04-21 2022-10-04 Alibaba Singapore Holding Private Limited Method and system for facilitating efficient data compression based on error correction code and reorganization of data placement
US11476874B1 (en) 2021-05-14 2022-10-18 Alibaba Singapore Holding Private Limited Method and system for facilitating a storage server with hybrid memory for journaling and data storage

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101557320A (zh) * 2009-05-25 2009-10-14 杭州华三通信技术有限公司 容灾的实现方法及其通信设备
CN102147714A (zh) * 2011-03-17 2011-08-10 杭州宏杉科技有限公司 一种网络存储系统的管理方法及装置
CN102147713A (zh) * 2011-02-18 2011-08-10 杭州宏杉科技有限公司 一种网络存储系统的管理方法及装置
CN102158538A (zh) * 2011-02-18 2011-08-17 杭州宏杉科技有限公司 一种网络存储系统的管理方法及装置
CN102184129A (zh) * 2011-04-27 2011-09-14 杭州华三通信技术有限公司 磁盘阵列的容错方法和装置
CN103838643A (zh) * 2012-11-23 2014-06-04 杭州星纬物联技术有限公司 一种基于系统盘和raid相互备份的新型方法
CN103902474A (zh) * 2014-04-11 2014-07-02 华中科技大学 一种支持固态盘缓存动态分配的混合存储系统和方法
CN104461388A (zh) * 2014-12-04 2015-03-25 北京同有飞骥科技股份有限公司 一种存储阵列配置保存及仲裁方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7631219B2 (en) * 2004-10-22 2009-12-08 Broadcom Corporation Method and computer program product for marking errors in BIOS on a RAID controller
US20070088990A1 (en) * 2005-10-18 2007-04-19 Schmitz Thomas A System and method for reduction of rebuild time in raid systems through implementation of striped hot spare drives
US20080172571A1 (en) * 2007-01-11 2008-07-17 International Business Machines Corporation Method and system for providing backup storage capacity in disk array systems
US8359495B2 (en) * 2007-03-27 2013-01-22 Teradata Us, Inc. System and method for using failure casting to manage failures in computer systems
JP4747203B2 (ja) * 2009-01-30 2011-08-17 富士通株式会社 ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法
US8806268B2 (en) * 2011-09-29 2014-08-12 International Business Machines Corporation Communication of conditions at a primary storage controller to a host

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101557320A (zh) * 2009-05-25 2009-10-14 杭州华三通信技术有限公司 容灾的实现方法及其通信设备
CN102147713A (zh) * 2011-02-18 2011-08-10 杭州宏杉科技有限公司 一种网络存储系统的管理方法及装置
CN102158538A (zh) * 2011-02-18 2011-08-17 杭州宏杉科技有限公司 一种网络存储系统的管理方法及装置
CN102147714A (zh) * 2011-03-17 2011-08-10 杭州宏杉科技有限公司 一种网络存储系统的管理方法及装置
CN102184129A (zh) * 2011-04-27 2011-09-14 杭州华三通信技术有限公司 磁盘阵列的容错方法和装置
CN103838643A (zh) * 2012-11-23 2014-06-04 杭州星纬物联技术有限公司 一种基于系统盘和raid相互备份的新型方法
CN103902474A (zh) * 2014-04-11 2014-07-02 华中科技大学 一种支持固态盘缓存动态分配的混合存储系统和方法
CN104461388A (zh) * 2014-12-04 2015-03-25 北京同有飞骥科技股份有限公司 一种存储阵列配置保存及仲裁方法

Also Published As

Publication number Publication date
CN106933708A (zh) 2017-07-07
US10289490B2 (en) 2019-05-14
US20170185498A1 (en) 2017-06-29

Similar Documents

Publication Publication Date Title
CN106933708B (zh) 有助于进行存储系统恢复的方法、装置以及一种存储系统
US7340638B2 (en) Operating system update and boot failure recovery
US8171379B2 (en) Methods, systems and media for data recovery using global parity for multiple independent RAID levels
US8230255B2 (en) Blocking write acces to memory modules of a solid state drive
US6990611B2 (en) Recovering data from arrays of storage devices after certain failures
US8341386B2 (en) Method for updating basic input/output system and method for repairing thereof
US9798534B1 (en) Method and system to perform non-intrusive online disk firmware upgrades
US7536588B2 (en) Method for servicing storage devices in a bladed storage subsystem
JP4886209B2 (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
US8812910B2 (en) Pilot process method for system boot and associated apparatus
US20150378858A1 (en) Storage system and memory device fault recovery method
CN111143132B (zh) 一种bios恢复方法、装置、设备及可读存储介质
CN102831030A (zh) 数据备份与恢复系统及方法
US7000142B2 (en) Mirrored extensions to a multiple disk storage system
US9280431B2 (en) Prioritizing backups on a disk level within enterprise storage
CN103049407B (zh) 数据存储方法、装置及系统
WO2015045122A1 (ja) ストレージ装置、ストレージシステム、およびデータ管理方法
US20100138603A1 (en) System and method for preventing data corruption after power failure
KR101548452B1 (ko) 비휘발성 메모리 기반의 전자 장치의 메타 데이터 복원 방법 및 장치
CN108780411B (zh) 数据存储系统中的自主奇偶交换
US7457990B2 (en) Information processing apparatus and information processing recovery method
KR100853941B1 (ko) 멀티미디어 저장장치와 데이터 복구방법
KR101545077B1 (ko) 비휘발성 메모리 기반의 전자 장치의 메타 데이터 복원 방법 및 장치
CN110245036B (zh) 嵌入式系统中实现nand闪存存储器数据备份处理的系统及其方法
CN110908607B (zh) 板载raid数据重建方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200131

Address after: Massachusetts, USA

Applicant after: EMC IP Holding Company LLC

Address before: Massachusetts, USA

Applicant before: EMC Corp.

GR01 Patent grant
GR01 Patent grant