CN107861829A - 一种磁盘故障检测的方法、系统、装置及存储介质 - Google Patents

一种磁盘故障检测的方法、系统、装置及存储介质 Download PDF

Info

Publication number
CN107861829A
CN107861829A CN201711078538.4A CN201711078538A CN107861829A CN 107861829 A CN107861829 A CN 107861829A CN 201711078538 A CN201711078538 A CN 201711078538A CN 107861829 A CN107861829 A CN 107861829A
Authority
CN
China
Prior art keywords
disk
target
storage device
probability
sector count
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711078538.4A
Other languages
English (en)
Inventor
李大生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201711078538.4A priority Critical patent/CN107861829A/zh
Publication of CN107861829A publication Critical patent/CN107861829A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/073Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种磁盘健康状态检测方法,接收检测指令;获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数;利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率;以利用所述最终失效概率确定所述目标磁盘的健康状态。可见,本发明公开的一种磁盘健康状态检测方法,仅仅通过目标磁盘的可重新分配扇区数与存储设备的历史磁盘信息就可以计算得到目标磁盘的失效概率,从而可以从失效概率判断目标磁盘是否健康,因此可以在目标磁盘故障前就能够提前预防故障的发生,提前做好措施,避免磁盘故障带来的影响。本发明还公开一种磁盘状态健康检测系统、装置及计算机可读存储系统,同样可以实现上述有益效果。

Description

一种磁盘故障检测的方法、系统、装置及存储介质
技术领域
本发明涉及硬盘技术领域,更具体地说,涉及一种磁盘故障检测的方法、系统、装置及计算机可读存储介质。
背景技术
随着数据存储需求的日益增长,数据中心中存储系统也随之快速增长,目前,硬盘是企业级存储中最重要的存储介质。硬盘在数据存储中处于核心的地位,同时,硬盘也是存储系统中最容易损坏的一种硬件。
现在存储系统依赖于RAID(冗余磁盘阵列)这样的冗余机制来应对磁盘的故障,也就是少量磁盘损坏的情况下,保证数据存储以及系统的正常运行,然而,多块磁盘在相近的时间内发生故障时,此方法便不适用,也就是当多块磁盘在相近的时间内发生故障时,硬盘便不能保证磁盘的正常工作。
因此,如何避免硬盘发生故障,是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种磁盘故障检测的方法、系统、装置及计算机可读存储介质,以避免硬盘发生故障。
为实现上述目的,本发明实施例提供了如下技术方案:
一种磁盘健康状态检测方法,包括:
接收检测指令;
获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数;
利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率;以利用所述最终失效概率确定所述目标磁盘的健康状态。
其中,所述检测指令是间隔预设时间触发的检测指令。
其中,所述获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数,包括:
获取存储设备的历史磁盘数据;
利用所述目标磁盘的实时扇区信息获取所述目标磁盘的第一可重新分配扇区计数。
其中,利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率,包括:
利用所述历史磁盘数据确定所述存储设备中已失效磁盘的第二可重新分配扇区计数,利用所述第二可重新分配扇区计数确定所述已失效磁盘的失效概率;
利用所述历史磁盘数据确定所述存储设备中所有磁盘的第三可重新分配扇区计数,利用所述第三可重新分配扇区计数确定所述存储设备的综合失效概率;
利用所述第一可重新分配扇区计数确定所述目标磁盘的初始失效概率;
利用所述失效概率、所述综合失效概率、所述初始失效概率确定所述目标磁盘的最终失效概率。
一种磁盘健康状态检测系统,,包括:
接收模块,用于接收检测指令;
获取模块,用于获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数;
计算模块,用于利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率;以利用所述最终失效概率确定所述目标磁盘的健康状态。
其中,所述检测指令是间隔预设时间触发的检测指令。
其中,所述获取模块,包括:
第一获取单元,用于获取存储设备的历史磁盘数据;
第二获取单元,用于利用所述目标磁盘的实时扇区信息获取所述目标磁盘的第一可重新分配扇区计数。
其中,所述计算模块,包括:
第一计算单元,用于利用所述历史磁盘数据确定所述存储设备中已失效磁盘的第二可重新分配扇区计数,利用所述第二可重新分配扇区计数确定所述已失效磁盘的失效概率;
第二计算单元,用于利用所述历史磁盘数据确定所述存储设备中所有磁盘的第三可重新分配扇区计数,利用所述第三可重新分配扇区计数确定所述存储设备的综合失效概率;
第三计算单元,用于利用所述第一可重新分配扇区计数确定所述目标磁盘的初始失效概率;
第四计算单元,用于利用所述失效概率、所述综合失效概率、所述初始失效概率确定所述目标磁盘的最终失效概率。
一种磁盘健康状态检测装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述磁盘健康状态检测方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述磁盘健康状态检测方法的步骤。
通过以上方案可知,本发明实施例提供的一种磁盘健康状态检测方法,接收检测指令;获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数;利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率;以利用所述最终失效概率确定所述目标磁盘的健康状态。
由此可见,本发明实施例提供的一种磁盘健康状态检测方法,可以仅仅通过目标磁盘的可重新分配扇区数与存储设备的历史磁盘信息就可以计算得到目标磁盘的失效概率,从而可以从失效概率判断目标磁盘是否健康,因此可以在目标磁盘故障前就能够提前预防故障的发生,提前做好措施,避免磁盘故障带来的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例公开的一种磁盘健康状态检测方法流程图;
图2为本发明实施例公开的一种具体的磁盘健康状态检测方法流程图;
图3为本发明实施例公开的一种磁盘健康状态检测系统结构示意图;
图4为本发明实施例公开的一种具体的磁盘健康状态检测系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种磁盘故障检测的方法、系统、装置及计算机可读存储介质,以避免硬盘发生故障。
参见图1,本发明实施例提供的一种磁盘健康状态检测方法,具体包括:
S101,接收检测指令。
在本实施例中,检测指令可以是周期性自动触发的,即定时对磁盘进行检测;也可以是根据检测需求即时触发的,即需要对磁盘的健康状态进行检测时,再控制存储设备检测磁盘。
S102,获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数。
具体地,在接收到检测指令后,获取存储设备的历史磁盘数据,以及待检测的目标磁盘的第一可重新分配扇区计数,可重新分配扇区是磁盘中的替换扇区,当磁盘中的扇区损坏不能继续使用时,将可重新分配扇区映射到磁盘,以使磁盘正常使用,而此时,对应此块磁盘的可重新分配扇区就会相应减少,因此可以利用可重新分配扇区计数计算出初步的此块磁盘的失效概率。
需要说明的是,存储设备通常为一个集群,包括多个磁盘,存储设备维护所有磁盘的数据,这些数据中包括存储设备中可重新分配扇区计数不为零但已经故障的磁盘的可重新分配扇区数,以及存储设备中所有磁盘(包括故障磁盘、非故障磁盘)的总数以及所有磁盘可重新分配扇区计数的总数,因此也可以利用历史磁盘数据计算出上述故障的磁盘的失效概率以及存储设备在不考虑具体是故障或非故障磁盘的情况下的失效概率。
S103,利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率;以利用所述最终失效概率确定所述目标磁盘的健康状态。
具体地,利用历史磁盘数据和第一可重新分配扇区计数即可计算出目标磁盘的失效概率,具体计算方法在下述实施例中详细介绍,此处不再赘述。得到目标磁盘的失效概率即可利用失效概率判定目标磁盘是否故障,从而判断是否需要提前更换目标磁盘,以防止目标磁盘故障带来的影响。
需要说明的是,在检测到具体的目标磁盘的失效概率后,可以根据预先设定的阈值进行比较,阈值来限定是否报警,当超过阈值时,可以进行告警,提示磁盘即将失效。
由此可见,本发明实施例提供的一种磁盘健康状态检测方法,可以仅仅通过目标磁盘的可重新分配扇区数与存储设备的历史磁盘信息就可以计算得到目标磁盘的失效概率,从而可以从失效概率判断目标磁盘是否健康,因此可以在目标磁盘故障前就能够提前预防故障的发生,提前做好措施,避免磁盘故障带来的影响。
下面对本发明实施例提供的一种具体的磁盘健康状态检测方法进行介绍,区别于上述实施例,本发明实施例对上述实施例中的检测指令做了进一步的限定和说明,其他步骤内容与上述实施例大致相同,具体可以参考上述实施例,此处不再赘述。
具体地,检测指令时间隔预设时间触发的检测指令。
需要说明的是,对于磁盘健康状态的检测,可以是周期性进行,例如间隔一天、12小时触发一次检测指令,具体间隔时间根据具体情况而定,此处不做限定。触发检测指令后进而确定目标磁盘的失效概率,实现对磁盘的周期性检测。
对存储设备的磁盘进行周期性检测,一旦存储设备的磁盘失效概率较高,即将出现问题时,就能及时的掌握磁盘的失效信息,以进行预防处理,从而保证了存储设备的稳定性。显然,对于检测指令的触发条件不局限于根据预设的时间周期进行,可以根据待检测的磁盘状态即时的发出检测需求,从而触发检测指令进行检测,不必等到预设时间点才能获取到失效概率。
本发明实施例提供一种具体的磁盘健康状态检测方法,区别于上述实施例,本发明实施例对上述实施例中S102做了进一步的限定和说明,其他步骤内容与上述实施例大致相同,具体可以参考上述实施例,此处不再赘述。具体地,S102包括:
获取存储设备的历史磁盘数据;
利用所述目标磁盘的实时扇区信息获取所述目标磁盘的第一可重新分配扇区计数。
具体地,存储设备中,每个磁盘都会维护智能信息,智能信息中包括可重新分配扇区计数,智能信息可以通过智能接口进行查询和检索。在接收到检测指令后,首先获取历史的磁盘数据,以及磁盘智能信息中的可重新分配扇区计数,以便后续计算目标磁盘的失效概率。
本发明实施例提供一种具体的磁盘健康状态检测方法,区别于上述实施例,本发明实施例对上述实施例中S103做了进一步的限定和说明,其他步骤内容与上述实施例大致相同,具体可以参考上述实施例,此处不再赘述。具体地,参考图2,S103包括:
S201,利用所述历史磁盘数据确定所述存储设备中已失效磁盘的第二可重新分配扇区计数,利用所述第二可重新分配扇区计数确定所述已失效磁盘的失效概率。
具体地,首先根据历史磁盘数据确定存储设备中已失效的一个磁盘的重新分配扇区计数,利用这个重新分配扇区计数可以计算得到这个已失效磁盘的失效概率P(fail)。
S202,利用所述历史磁盘数据确定所述存储设备中所有磁盘的第三可重新分配扇区计数,利用所述第三可重新分配扇区计数确定所述存储设备的综合失效概率。
具体地,获取到存储设备的历史磁盘数据后,确定所有磁盘的第三可重新分配扇区计数,其中所有磁盘即不区分磁盘的状态的磁盘,包括正常磁盘和失效磁盘,利用第三可重新分配扇区计数得到系统总体的失效概率P(RS)。
S203,利用所述第一可重新分配扇区计数确定所述目标磁盘的初始失效概率。
具体地,获取到目标磁盘的第一可重新分配扇区计数后,计算得到目标磁盘的初始的失效概率P(RS|fail)。
S204,利用所述失效概率、所述综合失效概率、所述初始失效概率确定所述目标磁盘的最终失效概率。
具体地,利用失效概率、综合失效概率、初始失效概率确定目标磁盘的最终失效概率,具体实现为最终失效概率P(fail|RS)=P(RS|fail)*P(fail)/P(RS)。
可见,本发明实施例在确定可重新分配扇区计数的情况下即可计算出目标磁盘的失效概率,进而利用失效概率就可确定磁盘的健康状态,从而可以提前做好预防措施,以备磁盘的损坏。
下面对本发明实施例提供的一种磁盘健康状态检测系统进行介绍,下文描述的一种磁盘健康状态检测系统与上文描述的一种磁盘健康状态检测方法可以相互参照。
参见图3,本发明实施例提供的一种磁盘健康状态检测系统,具体包括:
接收模块301,用于接收检测指令。
在本实施例中,检测指令可以是周期性自动触发的,即定时对磁盘进行检测;也可以是根据检测需求即时触发的,即需要对磁盘的健康状态进行检测时,再控制存储设备检测磁盘。
获取模块302,用于获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数。
具体地,在接收模块301接收到检测指令后,获取模块302获取存储设备的历史磁盘数据,以及待检测的目标磁盘的第一可重新分配扇区计数,可重新分配扇区是磁盘中的替换扇区,当磁盘中的扇区损坏不能继续使用时,将可重新分配扇区映射到磁盘,以使磁盘正常使用,而此时,对应此块磁盘的可重新分配扇区就会相应减少,因此可以利用可重新分配扇区计数计算出初步的此块磁盘的失效概率。
需要说明的是,存储设备通常为一个集群,包括多个磁盘,存储设备维护所有磁盘的数据,这些数据中包括存储设备中可重新分配扇区计数不为零但已经故障的磁盘的可重新分配扇区数,以及存储设备中所有磁盘(包括故障磁盘、非故障磁盘)的总数以及所有磁盘可重新分配扇区计数的总数,因此也可以利用历史磁盘数据计算出上述故障的磁盘的失效概率以及存储设备在不考虑具体是故障或非故障磁盘的情况下的失效概率。
计算模块303,用于利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率;以利用所述最终失效概率确定所述目标磁盘的健康状态。
具体地,计算模块303利用历史磁盘数据和第一可重新分配扇区计数即可计算出目标磁盘的失效概率,具体计算方法在下述实施例中详细介绍,此处不再赘述。得到目标磁盘的失效概率即可利用失效概率判定目标磁盘是否故障,从而判断是否需要提前更换目标磁盘,以防止目标磁盘故障带来的影响。
需要说明的是,在检测到具体的目标磁盘的失效概率后,可以根据预先设定的阈值进行比较,阈值来限定是否报警,当超过阈值时,可以进行告警,提示磁盘即将失效。
由此可见,本发明实施例提供的一种磁盘健康状态检测方法,计算模块303可以仅仅通过目标磁盘的可重新分配扇区数与存储设备的历史磁盘信息就可以计算得到目标磁盘的失效概率,从而可以从失效概率判断目标磁盘是否健康,因此可以在目标磁盘故障前就能够提前预防故障的发生,提前做好措施,避免磁盘故障带来的影响。
下面对本发明实施例提供的一种具体的磁盘健康状态检测系统进行介绍,区别于上述实施例,本发明实施例对上述实施例中的检测指令做了进一步的限定和说明,其他步骤模块与上述实施例大致相同,具体可以参考上述实施例,此处不再赘述。
具体地,检测指令时间隔预设时间触发的检测指令。
需要说明的是,对于磁盘健康状态的检测,可以是周期性进行,例如间隔一天、12小时触发一次检测指令,具体间隔时间根据具体情况而定,此处不做限定。触发检测指令后进而确定目标磁盘的失效概率,实现对磁盘的周期性检测。
对存储设备的磁盘进行周期性检测,一旦存储设备失效概率较高,即将出现问题时,就能及时的掌握磁盘的失效信息,以进行预防处理,从而保证了存储设备的稳定性。显然,对于检测指令的触发条件不局限于根据预设的时间周期进行,可以根据待检测的磁盘状态即时的发出检测需求,从而触发检测指令进行检测,不必等到预设时间点才能获取到失效概率。
本发明实施例提供一种具体的磁盘健康状态检测系统,区别于上述实施例,本发明实施例对上述实施例中获取模块302了进一步的限定和说明,其他步骤内容与上述实施例大致相同,具体可以参考上述实施例,此处不再赘述。具体地,获取模块302包括:
第一获取单元,用于获取存储设备的历史磁盘数据;
第二获取单元,用于利用所述目标磁盘的实时扇区信息获取所述目标磁盘的第一可重新分配扇区计数。
具体地,存储设备中,每个磁盘都会维护智能信息,智能信息中包括可冲分配扇区计数,智能信息可以通过智能接口进行查询和检索。在接收到检测指令后,首先第一获取单元获取历史的磁盘数据,第二获取单元从磁盘智能信息中获取目标磁盘的可重新分配扇区计数,以便后续计算目标磁盘的失效概率。
本发明实施例提供一种具体的磁盘健康状态检测系统,区别于上述实施例,本发明实施例对上述实施例中计算模块303做了进一步的限定和说明,其他步骤内容与上述实施例大致相同,具体可以参考上述实施例,此处不再赘述。具体地,参考图4,计算模块303包括:
第一计算单元401,用于利用所述历史磁盘数据确定所述存储设备中已失效磁盘的第二可重新分配扇区计数,利用所述第二可重新分配扇区计数确定所述已失效磁盘的失效概率。
具体地,第一计算单元401首先根据历史磁盘数据确定存储设备中已失效的一个磁盘的重新分配扇区计数,利用这个重新分配扇区计数可以计算得到这个已失效磁盘的失效概率P(fail)。
第二计算单元402,用于利用所述历史磁盘数据确定所述存储设备中所有磁盘的第三可重新分配扇区计数,利用所述第三可重新分配扇区计数确定所述存储设备的综合失效概率。
具体地,获取到存储设备的额历史磁盘数据后,第二计算单元402确定所有磁盘的第三可重新分配扇区计数,其中所有磁盘即不区分磁盘的状态,包括正常磁盘和失效磁盘,利用第三可重新分配扇区计数得到系统总体的失效概率P(RS)。
第三计算单元403,用于利用所述第一可重新分配扇区计数确定所述目标磁盘的初始失效概率。
具体地,获取到目标磁盘的额第一可重新分配扇区计数后,第三计算单元403计算得到目标磁盘的初始的失效概率P(RS|fail)。
第四计算单元404,用于利用所述失效概率、所述综合失效概率、所述初始失效概率确定所述目标磁盘的最终失效概率。
具体地,第四计算单元404利用失效概率、综合失效概率、初始失效概率确定所述目标磁盘的最终失效概率,具体实现为最终失效概率P(fail|RS)=P(RS|fail)*P(fail)/P(RS)。
可见,本发明实施例在确定可重新分配扇区计数的情况下即可利用三个计算单元计算出目标磁盘的失效概率,进而利用失效概率就可确定磁盘的健康状态,从而可以提前做好预防措施,以备磁盘的损坏。
下面对本发明实施例提供的一种磁盘健康状态检测装置进行描述,下文描述的一种磁盘健康状态检测装置与上文描述的一种磁盘健康状态检测方法可以相互参照。
一种磁盘健康状态检测装置,具体包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述实施例所述磁盘健康状态检测方法的步骤。
下面对本发明实施例提供的一种计算机可读存储介质进行描述,下文描述的一种计算机可读存储介质与上文描述的一种磁盘健康状态检测方法可以相互参照。
具体地,一种计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例所述磁盘健康状态检测方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种磁盘健康状态检测方法,其特征在于,包括:
接收检测指令;
获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数;
利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率;以利用所述最终失效概率确定所述目标磁盘的健康状态。
2.根据权利要求1所述的方法,其特征在于,所述检测指令是间隔预设时间触发的检测指令。
3.根据权利要求1所述的方法,其特征在于,所述获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数,包括:
获取存储设备的历史磁盘数据;
利用所述目标磁盘的实时扇区信息获取所述目标磁盘的第一可重新分配扇区计数。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率,包括:
利用所述历史磁盘数据确定所述存储设备中已失效磁盘的第二可重新分配扇区计数,利用所述第二可重新分配扇区计数确定所述已失效磁盘的失效概率;
利用所述历史磁盘数据确定所述存储设备中所有磁盘的第三可重新分配扇区计数,利用所述第三可重新分配扇区计数确定所述存储设备的综合失效概率;
利用所述第一可重新分配扇区计数确定所述目标磁盘的初始失效概率;
利用所述失效概率、所述综合失效概率、所述初始失效概率确定所述目标磁盘的最终失效概率。
5.一种磁盘健康状态检测系统,其特征在于,包括:
接收模块,用于接收检测指令;
获取模块,用于获取存储设备的历史磁盘数据与目标磁盘的第一可重新分配扇区计数;
计算模块,用于利用所述历史磁盘数据与所述第一可重新分配扇区计数确定所述目标磁盘的最终失效概率;以利用所述最终失效概率确定所述目标磁盘的健康状态。
6.根据权利要求5所述的系统,其特征在于,所述检测指令是间隔预设时间触发的检测指令。
7.根据权利要求5所述的系统,其特征在于,所述获取模块,包括:
第一获取单元,用于获取存储设备的历史磁盘数据;
第二获取单元,用于利用所述目标磁盘的实时扇区信息获取所述目标磁盘的第一可重新分配扇区计数。
8.根据权利要求5至7中任意一项所述的系统,其特征在于,所述计算模块,包括:
第一计算单元,用于利用所述历史磁盘数据确定所述存储设备中已失效磁盘的第二可重新分配扇区计数,利用所述第二可重新分配扇区计数确定所述已失效磁盘的失效概率;
第二计算单元,用于利用所述历史磁盘数据确定所述存储设备中所有磁盘的第三可重新分配扇区计数,利用所述第三可重新分配扇区计数确定所述存储设备的综合失效概率;
第三计算单元,用于利用所述第一可重新分配扇区计数确定所述目标磁盘的初始失效概率;
第四计算单元,用于利用所述失效概率、所述综合失效概率、所述初始失效概率确定所述目标磁盘的最终失效概率。
9.一种磁盘健康状态检测装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述磁盘健康状态检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述磁盘健康状态检测方法的步骤。
CN201711078538.4A 2017-11-06 2017-11-06 一种磁盘故障检测的方法、系统、装置及存储介质 Pending CN107861829A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711078538.4A CN107861829A (zh) 2017-11-06 2017-11-06 一种磁盘故障检测的方法、系统、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711078538.4A CN107861829A (zh) 2017-11-06 2017-11-06 一种磁盘故障检测的方法、系统、装置及存储介质

Publications (1)

Publication Number Publication Date
CN107861829A true CN107861829A (zh) 2018-03-30

Family

ID=61701076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711078538.4A Pending CN107861829A (zh) 2017-11-06 2017-11-06 一种磁盘故障检测的方法、系统、装置及存储介质

Country Status (1)

Country Link
CN (1) CN107861829A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111124271A (zh) * 2018-10-31 2020-05-08 伊姆西Ip控股有限责任公司 用于针对磁盘系统执行资源重新分配的方法、装置和计算机程序产品
CN111508532A (zh) * 2019-01-31 2020-08-07 马维尔亚洲私人有限公司 用于磁存储介质的健康管理
CN113810477A (zh) * 2021-08-30 2021-12-17 深圳壹账通智能科技有限公司 一种文件上传方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129397A (zh) * 2010-12-29 2011-07-20 深圳市永达电子股份有限公司 一种自适应磁盘阵列故障预测方法及系统
CN102981930A (zh) * 2012-11-15 2013-03-20 浪潮电子信息产业股份有限公司 一种磁盘阵列多级数据自动修复的方法
CN104866411A (zh) * 2015-06-08 2015-08-26 北京奇虎科技有限公司 固态硬盘的监测及分析方法及装置
CN105893231A (zh) * 2016-05-06 2016-08-24 思创数码科技股份有限公司 一种基于smart的预测硬盘亚健康指标的方法及装置
US9535779B1 (en) * 2014-07-25 2017-01-03 Emc Corporation Method and system for predicting redundant array of independent disks (RAID) vulnerability
TW201732591A (zh) * 2016-01-29 2017-09-16 Alibaba Group Services Ltd 磁碟的故障預測方法和裝置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129397A (zh) * 2010-12-29 2011-07-20 深圳市永达电子股份有限公司 一种自适应磁盘阵列故障预测方法及系统
CN102981930A (zh) * 2012-11-15 2013-03-20 浪潮电子信息产业股份有限公司 一种磁盘阵列多级数据自动修复的方法
US9535779B1 (en) * 2014-07-25 2017-01-03 Emc Corporation Method and system for predicting redundant array of independent disks (RAID) vulnerability
CN104866411A (zh) * 2015-06-08 2015-08-26 北京奇虎科技有限公司 固态硬盘的监测及分析方法及装置
TW201732591A (zh) * 2016-01-29 2017-09-16 Alibaba Group Services Ltd 磁碟的故障預測方法和裝置
CN105893231A (zh) * 2016-05-06 2016-08-24 思创数码科技股份有限公司 一种基于smart的预测硬盘亚健康指标的方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111124271A (zh) * 2018-10-31 2020-05-08 伊姆西Ip控股有限责任公司 用于针对磁盘系统执行资源重新分配的方法、装置和计算机程序产品
CN111124271B (zh) * 2018-10-31 2023-09-08 伊姆西Ip控股有限责任公司 用于针对磁盘系统执行资源重新分配的方法、装置和介质
CN111508532A (zh) * 2019-01-31 2020-08-07 马维尔亚洲私人有限公司 用于磁存储介质的健康管理
CN111508532B (zh) * 2019-01-31 2023-11-03 马维尔亚洲私人有限公司 用于磁存储介质的健康管理
CN113810477A (zh) * 2021-08-30 2021-12-17 深圳壹账通智能科技有限公司 一种文件上传方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN105843699B (zh) 用于错误监视与校正的动态随机存取存储器设备与方法
CN109725837B (zh) 管理存储系统的方法、系统和计算机程序产品
US9372743B1 (en) System and method for storage management
US8930736B2 (en) Inferred electrical power consumption of computing devices
US8645769B2 (en) Operation management apparatus, operation management method, and program storage medium
US9317349B2 (en) SAN vulnerability assessment tool
CN103003799B (zh) 用于验证存储器器件完整性的方法和系统
US9430011B2 (en) Systems and methods for determining the state of health of a capacitor module
CN110213068A (zh) 一种消息中间件的监控方法及相关设备
US8839017B2 (en) Electronic device and method for detecting power statuses of electronic device
CN103026342B (zh) 用于验证存储器器件完整性的方法和系统
CN107861829A (zh) 一种磁盘故障检测的方法、系统、装置及存储介质
CN106980562A (zh) 一种硬盘监控方法及装置
WO2013149558A1 (en) Systems and methods for preventing data loss
CN111104283B (zh) 一种分布式存储系统的故障检测方法、装置、设备及介质
US8806268B2 (en) Communication of conditions at a primary storage controller to a host
CN108920102A (zh) 一种非易失性内存的预警方法及相关装置
CN106909307A (zh) 一种管理双活存储阵列的方法及装置
US20230136274A1 (en) Ceph Media Failure and Remediation
CN105528180B (zh) 一种数据存储方法、装置及设备
CN107729199A (zh) 一种存储设备的硬盘检测方法和系统
CN109558299A (zh) 业务监控与预警的方法、装置、设备及存储介质
US10942826B2 (en) Method and device for managing storage system
CN108519940A (zh) 一种存储设备告警方法、系统及计算机可读存储介质
CN107886992A (zh) 一种raid健康状态检测方法、系统及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180330

RJ01 Rejection of invention patent application after publication