CN113360312A - 一种硬盘故障处理方法、装置、设备及存储介质 - Google Patents

一种硬盘故障处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113360312A
CN113360312A CN202110706013.0A CN202110706013A CN113360312A CN 113360312 A CN113360312 A CN 113360312A CN 202110706013 A CN202110706013 A CN 202110706013A CN 113360312 A CN113360312 A CN 113360312A
Authority
CN
China
Prior art keywords
hard disk
data
reconstructed
array
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110706013.0A
Other languages
English (en)
Inventor
朱红玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202110706013.0A priority Critical patent/CN113360312A/zh
Publication of CN113360312A publication Critical patent/CN113360312A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种硬盘故障处理方法、装置、设备及存储介质,该方法包括:如果磁盘阵列中任意硬盘发生故障,则确定该任意硬盘为故障硬盘;确定所述故障硬盘中应包含的数据为待重构数据,并重构所述待重构数据至所述磁盘阵列包含的未发生故障的硬盘中;在完成所述待重构数据的重构后,对所述磁盘阵列未写有数据的区域进行初始化。本申请在磁盘阵列中任意磁盘发生故障后,对该任意磁盘中应写有的数据进行重构,而其他区域无需重构,从而保证了数据有效存储的同时,减少数据恢复的数据量,缩短数据恢复的时间,进而提高数据恢复的效率。

Description

一种硬盘故障处理方法、装置、设备及存储介质
技术领域
本发明涉及存储阵列技术领域,更具体地说,涉及一种硬盘故障处理方法、装置、设备及存储介质。
背景技术
在存储设备中,当RAID(Redundant Arrays of Independent Disks,独立冗余磁盘阵列,可简称为磁盘阵列)中的硬盘故障时通过恢复数据到替代的硬盘的方式作为恢复数据的手段之一被广泛使用。现有技术中如果硬盘发生故障则通常会将整个故障的硬盘的数据恢复到替代的硬盘,这导致需要恢复的数据量较大,数据恢复需要花费的时间较长,进而导致数据恢复的效率较低。
发明内容
本发明的目的是提供一种硬盘故障处理方法、装置、设备及存储介质,保证了数据有效存储的同时,减少数据恢复的数据量,缩短数据恢复的时间,进而提高数据恢复的效率。
为了实现上述目的,本发明提供如下技术方案:
一种硬盘故障处理方法,包括:
如果磁盘阵列中任意硬盘发生故障,则确定该任意硬盘为故障硬盘;
确定所述故障硬盘中应包含的数据为待重构数据,并重构所述待重构数据至所述磁盘阵列包含的未发生故障的硬盘中;
在完成所述待重构数据的重构后,对所述磁盘阵列未写有数据的区域进行初始化。
优选的,在完成所述待重构数据的重构后,在对所述磁盘阵列未写有数据的区域进行初始化之前,还包括:
如果所述故障硬盘的故障被修复成功,则将所述故障硬盘重新加入至所述磁盘阵列中,并将所述待重构数据回拷至所述故障硬盘中。
优选的,还包括:
确定出所述故障硬盘之后,在所述磁盘阵列的阵列成员视图中为所述故障硬盘添加相应标记,以在所述阵列成员视图中提示所述故障硬盘需要修复;所述阵列成员视图中包含的成员与所述磁盘阵列中包含的硬盘一一对应;
如果所述故障硬盘的故障被修复成功,则在所述阵列成员视图中为所述故障硬盘添加相应标记,以在所述阵列成员视图中提示所述故障硬盘已修复。
优选的,对所述磁盘阵列未写有数据的区域进行初始化,包括:
读取有效区域位图及初始化进度位图;其中,所述有效区域位图中标记有所述磁盘阵列中写有数据且未发生故障的区域;
遍历所述有效区域位图,并基于遍历的所述有效区域位图将所述磁盘阵列中未写有数据的区域和发生故障的区域在所述初始化进度位图中标记为需要初始化的区域;
遍历所述初始化进度位图,并基于遍历的所述初始化进度位图为需要初始化的区域进行初始化。
优选的,重构所述待重构数据至所述磁盘阵列包含的未发生故障的硬盘中,包括:
读取重构区域进度位图;其中,所述重构区域进度位图中标记有所述故障磁盘中全部的区域为需要重构的区域;
遍历所述重构区域进度位图,基于遍历的所述重构区域进度位图、重构需要重构的区域至所述磁盘阵列包含的未发生故障的硬盘中;并且在重构数据的过程中,遍历所述初始化进度位图,基于遍历的所述初始化进度位图确定无需重构需要初始化的区域。
优选的,将所述待重构数据回拷至所述故障硬盘中,包括:
读取回拷区域进度位图;其中,所述回拷区域进度位图中标记有所述故障磁盘中全部的区域为需要回拷的区域;
遍历所述回拷区域进度位图,基于遍历的所述回拷区域进度位图、回拷需要回拷的区域至所述故障硬盘中;并且在回拷的过程中,遍历所述初始化进度位图,基于遍历的所述初始化进度位图确定无需回拷需要初始化的区域。
优选的,还包括:
在所述磁盘阵列创建时,为所述磁盘阵列分配保电内存区域用于存储所述有效区域位图、初始化进度位图、重构区域进度位图及回拷区域进度位图。
一种硬盘故障处理装置,包括:
确定模块,用于:如果磁盘阵列中任意硬盘发生故障,则确定该任意硬盘为故障硬盘;
重构模块,用于:确定所述故障硬盘中应包含的数据为待重构数据,并重构所述待重构数据至所述磁盘阵列包含的未发生故障的硬盘中;
初始化模块,用于:在完成所述待重构数据的重构后,对所述磁盘阵列未写有数据的区域进行初始化。
一种硬盘故障处理设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上任一项所述硬盘故障处理方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述硬盘故障处理方法的步骤。
本发明提供了一种硬盘故障处理方法、装置、设备及存储介质,该方法包括:如果磁盘阵列中任意硬盘发生故障,则确定该任意硬盘为故障硬盘;确定所述故障硬盘中应包含的数据为待重构数据,并重构所述待重构数据至所述磁盘阵列包含的未发生故障的硬盘中;在完成所述待重构数据的重构后,对所述磁盘阵列未写有数据的区域进行初始化。本申请在磁盘阵列中任意磁盘发生故障后,对该任意磁盘中应写有的数据进行重构,而其他区域无需重构,从而保证了数据有效存储的同时,减少数据恢复的数据量,缩短数据恢复的时间,进而提高数据恢复的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种硬盘故障处理方法的流程图;
图2为本发明实施例提供的一种硬盘故障处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种硬盘故障处理方法的流程图,可以包括:
S11:如果磁盘阵列中任意硬盘发生故障,则确定该任意硬盘为故障硬盘。
磁盘阵列是由多个硬盘组成的,如果任意硬盘发生故障,则需要对该任意硬盘实现数据恢复,具体来说,本申请可以确定任意的发生故障的磁盘为故障磁盘,进而对故障磁盘进行相应的数据恢复操作。
S12:确定故障硬盘中应包含的数据为待重构数据,并重构待重构数据至磁盘阵列包含的未发生故障的硬盘中。
故障硬盘中一般包含两区域,一区域为写有数据的区域,另一区域则为未写有数据的区域。为了减少数据恢复的数据量,本申请实施例可以确定故障硬盘中写有数据的区域为需要实现数据重构的区域,进而重构这区域应写有的数据至替换的硬盘中,也即为将故障硬盘中应包含的数据作为待重构数据实现相应的数据重构。其中,替换的硬盘为磁盘阵列中包含的未发生故障的硬盘,从而保证重构所得数据的有效存储。另外,数据重构与现有技术中对应概念的含义相同,在此不再赘述。
S13:在完成待重构数据的重构后,对磁盘阵列未写有数据的区域进行初始化。
在完成数据重构后,还可以对磁盘阵列中未写有数据的区域进行初始化,而对任意的区域进行初始化可以为对该任意的区域进行写0操作,从而保证写有数据的区域一致性的同时,还可以保证未写有数据的区域的一致性,保证磁盘阵列的整体一致性。
本申请在磁盘阵列中任意磁盘发生故障后,对该任意磁盘中应写有的数据进行重构,而其他区域无需重构,从而保证了数据有效存储的同时,减少数据恢复的数据量,缩短数据恢复的时间,进而提高数据恢复的效率。
另外,本申请在完成数据重构后还会对磁盘阵列中未写有数据的区域进行初始化,从而保证磁盘阵列的整体一致性。
需要说明的是,在实际场景下实现本发明实施例提供的一种硬盘故障处理方法时,可以将算法整体划分为两个部分,第一个部分为阵列任务配置模块,负责感知磁盘阵列配置变动(事件处理)并完成阵列任务的配置,第二个部分为阵列任务执行模块,负责完成配置的阵列任务;其中,在第一个部分完成阵列任务的配置后,第二个部分根据阵列任务配置初始化任务运行配置,进而根据阵列任务执行的优先级:重构>回拷>初始化,选择优先级高的阵列任务,调用阵列任务的执行逻辑。
本发明实施例提供的一种硬盘故障处理方法,在完成待重构数据的重构后,在对磁盘阵列未写有数据的区域进行初始化之前,还可以包括:
如果故障硬盘的故障被修复成功,则将故障硬盘重新加入至磁盘阵列中,并将待重构数据回拷至故障硬盘中。
需要说明的是,本申请实施例对故障硬盘的故障进行修复可以是对该故障硬盘进行维修,也可以是利用新的不存在故障的硬盘替换故障硬盘,均在本发明的保护范围之内。在故障硬盘被修复成功能够正常工作之后,可以将故障硬盘重新加入至磁盘阵列中,然后将待重构数据回拷至故障硬盘中,以实现数据的有效恢复。而数据回拷与现有技术中对应概念的原理相同,在此不再赘述。
在一种具体实现方式中,本申请基于阵列任务控制状态机的算法可以为:如果重构任务完成且故障硬盘恢复,则配置将待重构数据回拷至恢复的故障硬盘中,否则,逻辑退出。
本发明实施例提供的一种硬盘故障处理方法,还可以包括:
确定出故障硬盘之后,在磁盘阵列的阵列成员视图中为故障硬盘添加相应标记,以在阵列成员视图中提示故障硬盘需要修复;阵列成员视图中包含的成员与磁盘阵列中包含的硬盘一一对应;
如果故障硬盘的故障被修复成功,则在阵列成员视图中为故障硬盘添加相应标记,以在阵列成员视图中提示故障硬盘已修复。
本申请实施例中可以为磁盘阵列设置阵列成员视图,该阵列成员视图中包含的成员与硬盘一一对应,因此在阵列成员视图中为任意成员添加的标记即为对相应硬盘的标记。需要说明的是,为了方便对相应硬盘的定位,本申请实施例在确定出故障硬盘后,可以在阵列成员视图中为相应成员添加硬盘发生故障需要修复的标记,而在故障硬盘被修复成功后,可以在阵列成员视图中为相应成员添加硬盘故障已修复成功的标记。在一种具体实现方式中,本申请基于上述的阵列任务控制状态机的算法可以为:
1.阵列成员视图转换,故障成员转换为热备成员;其中,故障成员即为故障硬盘对应成员,热备成员即为热备硬盘对应成员;
2.阵列任务配置,配置指定热备成员重构故障成员数据任务启动;
3.阵列任务配置,配置阵列初始化任务启动。
并在故障硬盘修复成功后,阵列成员视图转换,热备成员转换为已修复成员,已修复成员即为已修复的故障硬盘对应成员。
本发明实施例提供的一种硬盘故障处理方法,对磁盘阵列未写有数据的区域进行初始化,可以包括:
读取有效区域位图及初始化进度位图;其中,有效区域位图中标记有磁盘阵列中写有数据且未发生故障的区域;
遍历有效区域位图,并基于遍历的有效区域位图将磁盘阵列中未写有数据的区域和发生故障的区域在初始化进度位图中标记为需要初始化的区域;
遍历初始化进度位图,并基于遍历的初始化进度位图为需要初始化的区域进行初始化。
需要说明的是,本申请实施例可以设置有有效区域位图及初始化进度位图,有效区域位图中标记有磁盘阵列中写有数据且未发生故障的区域,而初始化进度位图用于标记磁盘阵列中需要初始化的区域;相应的,本申请在收到初始化任务启动的消息需要实现相应初始化时,可以配置初始化进度位图,指定磁盘阵列中非用户使用区域(即未写有数据的区域)为需要初始化的区域,进而逐位遍历初始化进度位图,对属于阵列成员视图中被标记有需要初始化的区域进行写0操作,从而保证初始化的准确实现。另外,配置初始化进度位图,指定非用户使用区域为需要初始化区域具体可以包括:
a)读取有效区域位图中的数据;
b)读取初始化进度位图中的数据;
c)逐位遍历有效区域位图,将无效(未写有数据)及包含故障硬盘的区域(发生故障的区域)标记到初始化进度位图中,以将其标记为需要初始化的区域。
本发明实施例提供的一种硬盘故障处理方法,重构待重构数据至磁盘阵列包含的未发生故障的硬盘中,可以包括:
读取重构区域进度位图;其中,重构区域进度位图中标记有故障磁盘中全部的区域为需要重构的区域;
遍历重构区域进度位图,基于遍历的重构区域进度位图、重构需要重构的区域至磁盘阵列包含的未发生故障的硬盘中;并且在重构数据的过程中,遍历初始化进度位图,基于遍历的初始化进度位图确定无需重构需要初始化的区域。
需要说明的是,本申请实施例可以设置有重构区域进度位图,其用于标记故障硬盘中需要进行数据重构的区域,且最初标记故障硬盘中全部的区域均为需要进行数据重构的区域;相应的,本申请在收到重构任务启动的消息需要实现相应数据重构时,可以配置重构区域进度位图,并配置相应的任务调度模块,逐位遍历重构区域进度位图,调度标记的区域执行重构任务,重构区域进度位图清空则重构任务完成,阵列冗余恢复,从而保证数据重构的准确实现;也即本申请在按照重构区域进度位图实现标记的区域重构的同时,还会遍历初始化区域进度位图,如果重构区域进度位图中标记的区域也在初始化区域进度位图中被标记,则直接跳过这部分区域而无需实现相应重构,并认为相应重构完成。另外,逐位遍历重构区域进度位图,调度标记的区域执行重构任务具体可以包括:
a)如果区域在初始化进度位图中被标记,则跳过重构并清除重构区域进度位图的标记为已完成相应区域的重构;
b)否则,执行磁盘阵列的冗余重构算法填充区域数据实现相应数据重构。本发明实施例提供的一种硬盘故障处理方法,将待重构数据回拷至故障硬盘中,可以包括:
读取回拷区域进度位图;其中,回拷区域进度位图中标记有故障磁盘中全部的区域为需要回拷的区域;
遍历回拷区域进度位图,基于遍历的回拷区域进度位图、回拷需要回拷的区域至故障硬盘中;并且在回拷的过程中,遍历初始化进度位图,基于遍历的初始化进度位图确定无需回拷需要初始化的区域。
需要说明的是,本申请实施例可以设置有回拷区域进度位图,其用于标记故障硬盘中需要进行数据回拷的区域,且最初标记故障硬盘中全部的区域均为需要进行数据回拷的区域;相应的,本申请在收到回拷任务启动的消息需要实现相应数据回拷时,可以配置回拷区域进度位图,并配置相应的任务调度模块,依据回拷区域进度位图调度全部标记的区域执行回拷任务,对需要执行回拷任务的区域但是在初始化进度位图中被标记的,不进行回拷而直接清除回拷区域进度位图标记视为完成回拷,回拷区域进度位图清空则回拷任务完成,阵列冗余恢复;也即本申请在按照回拷区域进度位图实现标记的区域回拷的同时,还会遍历初始化区域进度位图,如果回拷区域进度位图中标记的区域也在初始化区域进度位图中被标记,则直接跳过这部分区域而无需实现相应回拷,并认为相应回拷完成。
另外,本申请在基于任意进度位图实现相应操作时,每完成一处区域的操作则将相应进度位图上的标记清除,进度位图包括初始化进度位图、重构区域进度位图及回拷区域进度位图。
本发明实施例提供的一种硬盘故障处理方法,还可以包括:
在磁盘阵列创建时,为磁盘阵列分配保电内存区域用于存储有效区域位图、初始化进度位图、重构区域进度位图及回拷区域进度位图。
本申请实施例基于磁盘阵列维护的有效区域位图实现,从而保证对于磁盘阵列使用情况的准确获知,相应的有效区域位图维护的方式可以包括:
1.磁盘阵列创建时,为磁盘阵列分配保电内存区域用于存储有效区域位图,分配的空间大小为(阵列容量/有效区域位图粒度)比特位;
2.写入数据时,将写入数据的区域标记为有效区域;
3.用户将使用的数据删除,对应区域删除有效区域的标记。
在一种具体实现方式中,本发明实施例提供的一种硬盘故障处理方法具体可以按照下列方式实现:
基于上述的阵列任务控制状态机的方法可以为(硬盘故障事件):
1.阵列成员视图转换,故障成员转换为热备成员;
2.阵列任务配置,配置指定热备成员重构指定故障成员数据任务启动;
3.阵列任务配置,配置阵列初始化任务启动。
基于上述的阵列任务控制状态机的方法可以为(硬盘恢复事件):
1.检测阵列任务配置
a)如果重构任务完成,阵列成员视图转换,其中热备成员转换为恢复的成员,执行步骤2;
b)否则,逻辑退出;
2.阵列任务配置,配置指定恢复成员回拷指定热备成员数据任务启动。
基于上述的阵列任务控制状态机的方法可以为(重构完成事件):
1.检测阵列成员配置
a)如果故障成员恢复,阵列成员视图转换,其中热备成员转换为恢复的成员,执行步骤2;
b)否则,逻辑退出;
2.阵列任务配置,配置指定恢复成员回拷指定热备硬盘数据任务启动。
上述阵列任务执行的方法:
1.根据阵列任务配置初始化任务运行配置;
2.根据阵列任务执行的优先级:重构>回拷>初始化,选择优先级高的阵列任务,调用阵列任务的执行逻辑。
初始化任务的执行方法可以为:
1.收到初始化任务启动的消息;
2.配置初始化进度位图,指定非用户使用区域为需要初始化区域;
a)读取有效区域位图数据;
b)读取初始化进度位图数据;
c)逐位遍历有效区域位图,将无效且包含故障硬盘的区域标记到初始化进度位图中;
3.逐位遍历初始化进度位图,对被标记且属于阵列成员视图中的硬盘进行写0操作;
重构任务的执行方法可以为:
1.收到重构任务启动的消息;
2.配置重构区域进度位图(标记指示故障硬盘全部需要重构),配置任务调度模块;
3.逐位遍历重构区域进度位图,调度标记的区域执行重构任务:
a)如果区域在初始化进度位图中被标记的,跳过重构并清除重构区域进度位图标记;
b)否则,执行阵列的冗余重构算法填充区域数据;
4.重构区域进度位图清空则重构任务完成,阵列冗余恢复。
回拷任务的执行方法可以为:
1.收到回拷任务启动的消息;
2.配置回拷区域进度位图(全标记指示故障硬盘全部需要重构);
3.配置任务调度模块,依据回拷区域进度位图调度全部标记的区域执行回拷任务;
4.对需要执行回拷任务的区域但是在初始化进度位图中被标记的,不进行回拷而直接清除回拷区域进度位图标记视为完成回拷;
5.回拷区域进度位图清空则回拷任务完成,阵列冗余恢复。
有效区域位图的维护方位可以为:
1.阵列创建时,为阵列分配保电内存区域用于存储有效区域位图,分配的空间大小为(阵列容量/有效区域位图粒度)比特位;
2.写入数据时,将写入数据的区域标记为有效区域;
3.用户将使用的数据删除,对应区域删除有效区域的标记。
本申请删除有效区域标记时具体可以由调用者遵循该模式实现以及择机调用,该方法中非删除指定区域,而是删除指定区域扩展区域以删除相应整个存储单元避免边界问题。
另外,本发明中默认认为使用的元数据为持久化的,该功能基于该系统的掉电保护机制或者其它机制实现,进而仅在保证了该特性的元数据的设备中进行应用。本发明采用编程语言进行算法实现,编译后使用存储服务器或其他可运行冗余磁盘阵列逻辑的装置作为运行载体,可容易的配置在任意的支持初始化、重构、回拷的阵列逻辑中使用。从而基于重构、初始化、回拷流程的调度优先级设计实现阵列的局部区域重构,使得阵列不需要重构全部区域即可恢复冗余状态,提升阵列重构速度,优化阵列硬盘故障性能、恢复性能;且能够保持用户数据的完整性与阵列的一致性。
本发明实施例还提供了一种硬盘故障处理装置,如图2所示,可以包括:
确定模块11,用于:如果磁盘阵列中任意硬盘发生故障,则确定该任意硬盘为故障硬盘;
重构模块12,用于:确定故障硬盘中应包含的数据为待重构数据,并重构待重构数据至磁盘阵列包含的未发生故障的硬盘中;
初始化模块13,用于:在完成待重构数据的重构后,对磁盘阵列未写有数据的区域进行初始化。
本发明实施例提供的一种硬盘故障处理装置,还可以包括:
回拷模块,用于:在完成待重构数据的重构后,在对磁盘阵列未写有数据的区域进行初始化之前,如果故障硬盘的故障被修复成功,则将故障硬盘重新加入至磁盘阵列中,并将待重构数据回拷至故障硬盘中。
本发明实施例提供的一种硬盘故障处理装置,还可以包括:
添加模块,用于:确定出故障硬盘之后,在磁盘阵列的阵列成员视图中为故障硬盘添加相应标记,以在阵列成员视图中提示故障硬盘需要修复;阵列成员视图中包含的成员与磁盘阵列中包含的硬盘一一对应;以及用于:如果故障硬盘的故障被修复成功,则在阵列成员视图中为故障硬盘添加相应标记,以在阵列成员视图中提示故障硬盘已修复。
本发明实施例提供的一种硬盘故障处理装置,初始化模块可以包括:
初始化单元,用于:读取有效区域位图及初始化进度位图;遍历有效区域位图,并基于遍历的有效区域位图将磁盘阵列中未写有数据的区域和发生故障的区域在初始化进度位图中标记为需要初始化的区域;遍历初始化进度位图,并基于遍历的初始化进度位图为需要初始化的区域进行初始化;其中,有效区域位图中标记有磁盘阵列中写有数据且未发生故障的区域。
本发明实施例提供的一种硬盘故障处理装置,重构模块可以包括:
重构单元,用于:读取重构区域进度位图;遍历重构区域进度位图,基于遍历的重构区域进度位图、重构需要重构的区域至磁盘阵列包含的未发生故障的硬盘中;并且在重构数据的过程中,遍历初始化进度位图,基于遍历的初始化进度位图确定无需重构需要初始化的区域;其中,重构区域进度位图中标记有故障磁盘中全部的区域为需要重构的区域。
本发明实施例提供的一种硬盘故障处理装置,回拷模块可以包括:
回拷单元,用于:读取回拷区域进度位图;遍历回拷区域进度位图,基于遍历的回拷区域进度位图、回拷需要回拷的区域至故障硬盘中;并且在回拷的过程中,遍历初始化进度位图,基于遍历的初始化进度位图确定无需回拷需要初始化的区域;其中,回拷区域进度位图中标记有故障磁盘中全部的区域为需要回拷的区域。
本发明实施例提供的一种硬盘故障处理装置,还可以包括:
分配模块,用于:在磁盘阵列创建时,为磁盘阵列分配保电内存区域用于存储有效区域位图、初始化进度位图、重构区域进度位图及回拷区域进度位图。
本发明实施例还提供了一种硬盘故障处理设备,可以包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上任一项硬盘故障处理方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上任一项硬盘故障处理方法的步骤。
需要说明的是,本发明实施例提供的一种硬盘故障处理装置、设备及存储介质中相关区域的说明请参见本发明实施例提供的一种硬盘故障处理方法中对应区域的详细说明,在此不再赘述。另外,本发明实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的区域并未详细说明,以免过多赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种硬盘故障处理方法,其特征在于,包括:
如果磁盘阵列中任意硬盘发生故障,则确定该任意硬盘为故障硬盘;
确定所述故障硬盘中应包含的数据为待重构数据,并重构所述待重构数据至所述磁盘阵列包含的未发生故障的硬盘中;
在完成所述待重构数据的重构后,对所述磁盘阵列未写有数据的区域进行初始化。
2.根据权利要求1所述的方法,其特征在于,在完成所述待重构数据的重构后,在对所述磁盘阵列未写有数据的区域进行初始化之前,还包括:
如果所述故障硬盘的故障被修复成功,则将所述故障硬盘重新加入至所述磁盘阵列中,并将所述待重构数据回拷至所述故障硬盘中。
3.根据权利要求2所述的方法,其特征在于,还包括:
确定出所述故障硬盘之后,在所述磁盘阵列的阵列成员视图中为所述故障硬盘添加相应标记,以在所述阵列成员视图中提示所述故障硬盘需要修复;所述阵列成员视图中包含的成员与所述磁盘阵列中包含的硬盘一一对应;
如果所述故障硬盘的故障被修复成功,则在所述阵列成员视图中为所述故障硬盘添加相应标记,以在所述阵列成员视图中提示所述故障硬盘已修复。
4.根据权利要求3所述的方法,其特征在于,对所述磁盘阵列未写有数据的区域进行初始化,包括:
读取有效区域位图及初始化进度位图;其中,所述有效区域位图中标记有所述磁盘阵列中写有数据且未发生故障的区域;
遍历所述有效区域位图,并基于遍历的所述有效区域位图将所述磁盘阵列中未写有数据的区域和发生故障的区域在所述初始化进度位图中标记为需要初始化的区域;
遍历所述初始化进度位图,并基于遍历的所述初始化进度位图为需要初始化的区域进行初始化。
5.根据权利要求4所述的方法,其特征在于,重构所述待重构数据至所述磁盘阵列包含的未发生故障的硬盘中,包括:
读取重构区域进度位图;其中,所述重构区域进度位图中标记有所述故障磁盘中全部的区域为需要重构的区域;
遍历所述重构区域进度位图,基于遍历的所述重构区域进度位图、重构需要重构的区域至所述磁盘阵列包含的未发生故障的硬盘中;并且在重构数据的过程中,遍历所述初始化进度位图,基于遍历的所述初始化进度位图确定无需重构需要初始化的区域。
6.根据权利要求5所述的方法,其特征在于,将所述待重构数据回拷至所述故障硬盘中,包括:
读取回拷区域进度位图;其中,所述回拷区域进度位图中标记有所述故障磁盘中全部的区域为需要回拷的区域;
遍历所述回拷区域进度位图,基于遍历的所述回拷区域进度位图、回拷需要回拷的区域至所述故障硬盘中;并且在回拷的过程中,遍历所述初始化进度位图,基于遍历的所述初始化进度位图确定无需回拷需要初始化的区域。
7.根据权利要求6所述的方法,其特征在于,还包括:
在所述磁盘阵列创建时,为所述磁盘阵列分配保电内存区域用于存储所述有效区域位图、初始化进度位图、重构区域进度位图及回拷区域进度位图。
8.一种硬盘故障处理装置,其特征在于,包括:
确定模块,用于:如果磁盘阵列中任意硬盘发生故障,则确定该任意硬盘为故障硬盘;
重构模块,用于:确定所述故障硬盘中应包含的数据为待重构数据,并重构所述待重构数据至所述磁盘阵列包含的未发生故障的硬盘中;
初始化模块,用于:在完成所述待重构数据的重构后,对所述磁盘阵列未写有数据的区域进行初始化。
9.一种硬盘故障处理设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述硬盘故障处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述硬盘故障处理方法的步骤。
CN202110706013.0A 2021-06-24 2021-06-24 一种硬盘故障处理方法、装置、设备及存储介质 Withdrawn CN113360312A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110706013.0A CN113360312A (zh) 2021-06-24 2021-06-24 一种硬盘故障处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110706013.0A CN113360312A (zh) 2021-06-24 2021-06-24 一种硬盘故障处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113360312A true CN113360312A (zh) 2021-09-07

Family

ID=77536174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110706013.0A Withdrawn CN113360312A (zh) 2021-06-24 2021-06-24 一种硬盘故障处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113360312A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115657965A (zh) * 2022-11-16 2023-01-31 苏州浪潮智能科技有限公司 一种元数据的配置方法、装置及介质
CN117112310A (zh) * 2023-10-18 2023-11-24 苏州元脑智能科技有限公司 后台任务进度保存和恢复方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329641A (zh) * 2008-06-11 2008-12-24 华中科技大学 一种磁盘阵列的数据重建方法
CN102567214A (zh) * 2011-12-01 2012-07-11 浪潮电子信息产业股份有限公司 一种用于raid5快速初始化位图页面管理的方法
CN102609223A (zh) * 2012-02-13 2012-07-25 浪潮(北京)电子信息产业有限公司 一种独立冗余磁盘阵列系统及其初始化方法
CN102981936A (zh) * 2012-11-15 2013-03-20 浪潮电子信息产业股份有限公司 一种磁盘阵列数据重构的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329641A (zh) * 2008-06-11 2008-12-24 华中科技大学 一种磁盘阵列的数据重建方法
CN102567214A (zh) * 2011-12-01 2012-07-11 浪潮电子信息产业股份有限公司 一种用于raid5快速初始化位图页面管理的方法
CN102609223A (zh) * 2012-02-13 2012-07-25 浪潮(北京)电子信息产业有限公司 一种独立冗余磁盘阵列系统及其初始化方法
CN102981936A (zh) * 2012-11-15 2013-03-20 浪潮电子信息产业股份有限公司 一种磁盘阵列数据重构的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115657965A (zh) * 2022-11-16 2023-01-31 苏州浪潮智能科技有限公司 一种元数据的配置方法、装置及介质
CN117112310A (zh) * 2023-10-18 2023-11-24 苏州元脑智能科技有限公司 后台任务进度保存和恢复方法、装置、设备及存储介质
CN117112310B (zh) * 2023-10-18 2024-02-20 苏州元脑智能科技有限公司 后台任务进度保存和恢复方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US9053075B2 (en) Storage control device and method for controlling storages
US7721143B2 (en) Method for reducing rebuild time on a RAID device
JP6064608B2 (ja) ストレージ装置、バックアッププログラム、およびバックアップ方法
CN102999564B (zh) 写入数据的方法、装置和设备
CN107562578B (zh) 一种存储数据的快照创建方法、装置、设备及存储介质
CN102460401B (zh) 利用变化跟踪进行系统恢复的技术
CN105531677A (zh) Raid奇偶校验条带重建
JPH07500203A (ja) ロールバックのためのデータ・バックアップ・システム
JP2008204041A (ja) ストレージ装置及びデータ配置制御方法
JPH06274409A (ja) 一括消去型不揮発性メモリ
CN113360312A (zh) 一种硬盘故障处理方法、装置、设备及存储介质
US9785438B1 (en) Media cache cleaning based on workload
CN104077375A (zh) 一种cc-numa系统中节点的错误目录的处理方法和节点
US9378092B2 (en) Storage control apparatus and storage control method
CN106339276A (zh) 一种基于数据备份状态的数据恢复方法及系统
US8639968B2 (en) Computing system reliability
WO2024103977A1 (zh) 一种元数据的配置方法、装置及非易失性可读存储介质
CN105408869A (zh) 调用错误处理程序来处理无法纠正的错误
CN104461791A (zh) 一种信息处理方法及处理装置
CN110046065A (zh) 一种存储阵列重建方法、装置、设备及存储介质
CN109445982A (zh) 实现数据可靠读写的数据存储装置
CN104407806A (zh) 独立磁盘冗余阵列组硬盘信息的修改方法和装置
KR20150094292A (ko) 비휘발성 메모리 기반의 전자 장치의 메타 데이터 복원 방법 및 장치
CN110362432B (zh) 一种备份方法、装置、设备及存储介质
CN109375869A (zh) 实现数据可靠读写的方法以及系统、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210907

WW01 Invention patent application withdrawn after publication