CN105183589A - 一种磁盘阵列容错装置 - Google Patents

一种磁盘阵列容错装置 Download PDF

Info

Publication number
CN105183589A
CN105183589A CN201510546906.8A CN201510546906A CN105183589A CN 105183589 A CN105183589 A CN 105183589A CN 201510546906 A CN201510546906 A CN 201510546906A CN 105183589 A CN105183589 A CN 105183589A
Authority
CN
China
Prior art keywords
unit
disk
data
disk array
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510546906.8A
Other languages
English (en)
Inventor
宋旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Ou Maite Digital Technology Ltd
Original Assignee
Anhui Ou Maite Digital Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Ou Maite Digital Technology Ltd filed Critical Anhui Ou Maite Digital Technology Ltd
Priority to CN201510546906.8A priority Critical patent/CN105183589A/zh
Publication of CN105183589A publication Critical patent/CN105183589A/zh
Pending legal-status Critical Current

Links

Abstract

本发明涉及一种磁盘阵列容错装置,包括替换单元、重建单元、记录单元、处理单元、修复单元和恢复单元;所述替换单元经重建单元与记录单元相连,所述记录单元通过修复单元与恢复单元相连,所述处理单元与记录单元相连,所述恢复单元,用于当磁盘修复数据出现错误或删除了标识错误时,将该数据恢复到修复之前的数据。本发明通过写方式修复该条带的重建读错误,尽快恢复磁盘阵列的冗余性,避免重建过程中多个磁盘出现故障而导致整个磁盘阵列失败的情况发生。在当前条带发生业务读错误时,可将该当前条带的标识记录到非易失性内存中,并控制该磁盘阵列继续提供业务读写,不仅保证了业务连续性而且避免了数据被丢失的风险。

Description

一种磁盘阵列容错装置
技术领域
本发明涉及磁盘存储技术领域,具体涉及一种磁盘阵列容错装置。
背景技术
独立磁盘冗余阵列,简称磁盘阵列,其将多个独立的磁盘结合成一个阵列,提供很好的冗余性和比单个磁盘更高的存储性能。在存储领域中,通过磁盘阵列自身的冗余性将数据直接或间接存储在多个单独的磁盘上,以达到当一个或多个磁盘故障时数据不丢失的目的,即实现了数据容错。
其中,当因为某些原因比如磁盘阵列中的磁盘故障等导致磁盘阵列失去冗余性时,该磁盘阵列会处于降级状态。以磁盘阵列中的磁盘故障导致磁盘阵列失去冗余性而使该磁盘阵列处于降级状态为例,则在现有技术中,为恢复该因磁盘故障而处于降级状态的磁盘阵列的冗余性,常用的方式为增加热备盘重建的方式,具体为:用热备盘替换故障的磁盘。但是,在该重建过程中,如果又发生了磁盘重建读错误,其中,重建读错误为重建过程中,重建I/O导致磁盘发生的读错误,则,停止重建,此时该磁盘阵列只能停留在降级状态,无法回到冗余状态。一旦该磁盘阵列中的其他磁盘再发生故障时,整个磁盘阵列就会失败,即关闭I/O通道,这不仅导致该磁盘阵列停止提供业务,还会导致该磁盘阵列之前存储的数据丢失。
另外,当对处于降级状态的磁盘阵列进行业务读时,如果发生业务读错误,其中,业务读错误为:业务读写过程中,业务I/O导致磁盘发生的读错误,则,此时该磁盘阵列失败,即关闭I/O通道,这导致该磁盘阵列停止提供业务,并导致之前存储的数据丢失。
发明内容
本发明的目的在于提供一种磁盘阵列容错装置,避免处于降级状态的磁盘阵列由于发生重建读错误或者业务读错误而引起的问题。
为实现上述目的,本发明采用了以下技术方案:包括替换单元、重建单元、记录单元、处理单元、修复单元和恢复单元;
所述替换单元,用于当磁盘阵列中的磁盘发生故障时,在所述磁盘阵列中增加热备盘,以替换该发生故障的磁盘;
所述重建单元,用于以条带为单位对增加了热备盘的磁盘阵列进行重建;
所述记录单元,用于在被所述重建单元重建的当前条带发生重建读错误时,将该当前条带的标识记录到非易失性内存中,并触发所述重建单元跳过当前条带,从下一个条带继续重建,直至完成磁盘阵列的重建;
所述处理单元,用于当需要向与所述非易失性内存中条带标识对应的条带所占用的热备盘读取数据时,不下发读命令,利用该条带所占用的除热备盘之外的其他磁盘中的数据计算出需要从热备盘读取的数据;当需要向与所述非易失性内存中条带标识对应的条带所占用的除热备盘之外的其他磁盘读取数据时,向该其他磁盘下发读命令,以根据该读命令读取数据;
所述修复单元,用于针对所述非易失性内存中记录的每一条带标识,通过写方式修复与该条带标识对应的条带的重建读错误,并在完成修复后从所述非易失性内存中删除该条带标识;
所述恢复单元,用于当磁盘修复数据出现错误或删除了标识错误时,将该数据恢复到修复之前的数据。
进一步的,所述修复单元通过向与该条带标识对应的整个条带写数据来修复与该条带标识对应的条带的业务读错误;或者,确定与该条带标识对应的条带所存储数据的重要程度,如果确定出该数据的重要程度小于设定阈值,则通过以下操作修复与该条带标识对应的条带的业务读错误:向与该条带标识对应的条带所占用的磁盘写入设定数据。
由上述技术方案可知,本发明通过写方式修复该条带的重建读错误,尽快恢复磁盘阵列的冗余性,避免重建过程中多个磁盘出现故障而导致整个磁盘阵列失败的情况发生。在当前条带发生业务读错误时,可将该当前条带的标识记录到非易失性内存中,并控制该磁盘阵列继续提供业务读写,不仅保证了业务连续性而且避免了数据被丢失的风险。
附图说明
图1是本发明的结构示意图。
具体实施方式
下面结合附图对本发明做进一步说明:
如图1所示,本实施例的磁盘阵列容错装置,包括替换单元、重建单元、记录单元、处理单元、修复单元和恢复单元;
替换单元,用于当磁盘阵列中的磁盘发生故障时,在磁盘阵列中增加热备盘,以替换该发生故障的磁盘;重建单元,用于以条带为单位对增加了热备盘的磁盘阵列进行重建;记录单元,用于在被重建单元重建的当前条带发生重建读错误时,将该当前条带的标识记录到非易失性内存中,并触发重建单元跳过当前条带,从下一个条带继续重建,直至完成磁盘阵列的重建;处理单元,用于当需要向与非易失性内存中条带标识对应的条带所占用的热备盘读取数据时,不下发读命令,利用该条带所占用的除热备盘之外的其他磁盘中的数据计算出需要从热备盘读取的数据;当需要向与非易失性内存中条带标识对应的条带所占用的除热备盘之外的其他磁盘读取数据时,向该其他磁盘下发读命令,以根据该读命令读取数据;修复单元,用于针对非易失性内存中记录的每一条带标识,通过写方式修复与该条带标识对应的条带的重建读错误,并在完成修复后从非易失性内存中删除该条带标识;恢复单元,用于当磁盘修复数据出现错误或删除了标识错误时,将该数据恢复到修复之前的数据。
本实施例中,修复单元通过向与该条带标识对应的整个条带写数据来修复与该条带标识对应的条带的业务读错误;或者,确定与该条带标识对应的条带所存储数据的重要程度,如果确定出该数据的重要程度小于设定阈值,则通过以下操作修复与该条带标识对应的条带的业务读错误:向与该条带标识对应的条带所占用的磁盘写入设定数据。
本实施例中,假设有三个磁盘,分别为磁盘1、磁盘2和磁盘3,当磁盘阵列中的磁盘比如磁盘3发生故障时,(在该磁盘阵列中增加热备盘,以替换该发生故障的磁盘3),以条带为单位对增加了热备盘的磁盘阵列进行重建。该磁盘阵列的重建过程中,如果当前被重建的条带发生重建读错误,则将该当前条带的标识记录到非易失性内存中,并跳过当前条带,从下一个条带继续重建,直至完成磁盘阵列的重建,而未被重建成功的条带磁盘,被记录在非易失性内存中,当磁盘出线重建错误时,其磁盘中的数据恢复为重建之前的数据进行再次重建。可以看出,本发明相比于现有技术,并非由于发生重建读错误的条带而影响磁盘阵列整体的重建,而是继续从下一条带继续重建,直至完成磁盘阵列的重建,这对磁盘故障少且该故障对业务影响不大的应用比如监控存储等,能尽量减少磁盘故障对整个系统带来的风险。
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (2)

1.一种磁盘阵列容错装置,其特征在于:包括替换单元、重建单元、记录单元、处理单元、修复单元和恢复单元;
所述替换单元,用于当磁盘阵列中的磁盘发生故障时,在所述磁盘阵列中增加热备盘,以替换该发生故障的磁盘;
所述重建单元,用于以条带为单位对增加了热备盘的磁盘阵列进行重建;
所述记录单元,用于在被所述重建单元重建的当前条带发生重建读错误时,将该当前条带的标识记录到非易失性内存中,并触发所述重建单元跳过当前条带,从下一个条带继续重建,直至完成磁盘阵列的重建;
所述处理单元,用于当需要向与所述非易失性内存中条带标识对应的条带所占用的热备盘读取数据时,不下发读命令,利用该条带所占用的除热备盘之外的其他磁盘中的数据计算出需要从热备盘读取的数据;当需要向与所述非易失性内存中条带标识对应的条带所占用的除热备盘之外的其他磁盘读取数据时,向该其他磁盘下发读命令,以根据该读命令读取数据;
所述修复单元,用于针对所述非易失性内存中记录的每一条带标识,通过写方式修复与该条带标识对应的条带的重建读错误,并在完成修复后从所述非易失性内存中删除该条带标识;
所述恢复单元,用于当磁盘修复数据出现错误或删除了标识错误时,将该数据恢复到修复之前的数据。
2.根据权利要求1所述的磁盘阵列容错装置,其特征在于:所述修复单元通过向与该条带标识对应的整个条带写数据来修复与该条带标识对应的条带的业务读错误;或者,确定与该条带标识对应的条带所存储数据的重要程度,如果确定出该数据的重要程度小于设定阈值,则通过以下操作修复与该条带标识对应的条带的业务读错误:向与该条带标识对应的条带所占用的磁盘写入设定数据。
CN201510546906.8A 2015-08-31 2015-08-31 一种磁盘阵列容错装置 Pending CN105183589A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510546906.8A CN105183589A (zh) 2015-08-31 2015-08-31 一种磁盘阵列容错装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510546906.8A CN105183589A (zh) 2015-08-31 2015-08-31 一种磁盘阵列容错装置

Publications (1)

Publication Number Publication Date
CN105183589A true CN105183589A (zh) 2015-12-23

Family

ID=54905683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510546906.8A Pending CN105183589A (zh) 2015-08-31 2015-08-31 一种磁盘阵列容错装置

Country Status (1)

Country Link
CN (1) CN105183589A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528342A (zh) * 2016-11-11 2017-03-22 安徽维德工业自动化有限公司 一种具有云服务器备份的磁盘阵列容错装置
CN107391042A (zh) * 2017-07-28 2017-11-24 郑州云海信息技术有限公司 一种磁盘阵列的设计方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101387975A (zh) * 2008-10-20 2009-03-18 中科院成都信息技术有限公司 一种磁盘阵列系统
CN102184129A (zh) * 2011-04-27 2011-09-14 杭州华三通信技术有限公司 磁盘阵列的容错方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101387975A (zh) * 2008-10-20 2009-03-18 中科院成都信息技术有限公司 一种磁盘阵列系统
CN102184129A (zh) * 2011-04-27 2011-09-14 杭州华三通信技术有限公司 磁盘阵列的容错方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528342A (zh) * 2016-11-11 2017-03-22 安徽维德工业自动化有限公司 一种具有云服务器备份的磁盘阵列容错装置
CN107391042A (zh) * 2017-07-28 2017-11-24 郑州云海信息技术有限公司 一种磁盘阵列的设计方法及系统

Similar Documents

Publication Publication Date Title
CN102184129B (zh) 磁盘阵列的容错方法和装置
US9189311B2 (en) Rebuilding a storage array
CN102023815B (zh) 在固态存储器中实现raid
CN102708019B (zh) 一种硬盘数据恢复方法、装置及系统
CN102012847B (zh) 一种磁盘阵列重建方法
US8601311B2 (en) System and method for using over-provisioned data capacity to maintain a data redundancy scheme in a solid state memory
CN101916173B (zh) 一种基于raid的数据读写方法及其系统
CN104035830A (zh) 一种数据恢复方法和装置
CN104484251A (zh) 一种硬盘故障的处理方法及装置
CN103718162A (zh) 用于ssd中灵活的raid的方法和设备
CN105549908A (zh) Raid磁盘阵列重新恢复冗余的方法
CN110399247B (zh) 一种数据恢复方法、装置、设备及计算机可读存储介质
CN101984400B (zh) 一种raid控制方法、装置及系统
CN103309775A (zh) 一种高可靠磁盘阵列的容错方法
CN103019894B (zh) 一种独立冗余磁盘阵列的重建方法
CN102508620A (zh) 一种处理raid5坏扇区的方法
US8886993B2 (en) Storage device replacement method, and storage sub-system adopting storage device replacement method
CN109032513B (zh) 基于ssd和hdd的raid架构及其备份、重建方法
CN105183590A (zh) 一种磁盘阵列的容错处理方法
CN103678025A (zh) 一种磁盘阵列中的磁盘故障处理方法
CN106528342A (zh) 一种具有云服务器备份的磁盘阵列容错装置
CN105117172B (zh) 一种磁盘阵列历史掉盘记录的保存方法
US20130179726A1 (en) Automatic remapping in redundant array of independent disks and related raid
CN105183589A (zh) 一种磁盘阵列容错装置
US20100138603A1 (en) System and method for preventing data corruption after power failure

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151223