CN111625185A - 一种磁盘故障监控的方法、系统及相关组件 - Google Patents

一种磁盘故障监控的方法、系统及相关组件 Download PDF

Info

Publication number
CN111625185A
CN111625185A CN202010377065.3A CN202010377065A CN111625185A CN 111625185 A CN111625185 A CN 111625185A CN 202010377065 A CN202010377065 A CN 202010377065A CN 111625185 A CN111625185 A CN 111625185A
Authority
CN
China
Prior art keywords
fault
disk
type
faults
monitoring method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010377065.3A
Other languages
English (en)
Other versions
CN111625185B (zh
Inventor
黄玉龙
李家兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010377065.3A priority Critical patent/CN111625185B/zh
Publication of CN111625185A publication Critical patent/CN111625185A/zh
Application granted granted Critical
Publication of CN111625185B publication Critical patent/CN111625185B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0607Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种磁盘故障监控方法,包括:按照磁盘故障发生位置设置多种类型的故障;收集底层错误数据,将每一底层错误数据划分到其对应的类型的故障中;当存在任一类型的故障满足提示条件,执行与该类型的故障对应的提示操作。本申请能够实现对磁盘应用过程中各个位置可能出现的故障进行监控,保证磁盘故障检测的全面性,当任一类型的故障满足提示条件,则执行对应的提示操作,以便工作人员及时发现磁盘存在故障,同时能够定位故障位置,从而对该类型的故障选取对应的措施进行维护,提高数据存储中的高效性及稳定性。本申请还公开了一种磁盘故障监控系统、电子设备及计算机可读存储介质,具有以上有益效果。

Description

一种磁盘故障监控的方法、系统及相关组件
技术领域
本申请涉及存储服务器领域,特别涉及一种磁盘故障监控的方法、系统及相关组件。
背景技术
在云计算时代,海量数据存储需要使用数量庞大的磁盘,因而磁盘的性能成为存储速度与稳定的保障之一,磁盘是计算机主要的存储介质,可以存储大量的二进制数据,并且断电后也能保持数据不丢失,然而磁盘故障时,磁盘中保存的数据也会有极大的缺失,如果在磁盘故障时没有及时检测出故障磁盘并进行更换,就会严重影响云计算数据中心中存储的性能。目前常用的磁盘故障检测主要是针对磁盘的硬件连接,但是磁盘使用过程中,除了硬件连接问题会造成磁盘故障,还会有其他方面的原因造成磁盘故障,因此,现有技术中的检测方案不全面,若没有及时检测出故障的磁盘,并进行更换,则会降低数据存储的效率及稳定性。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本申请的目的是提供一种磁盘故障监控方法、系统、电子设备及计算机可读存储介质,实现对磁盘应用过程中各个位置可能出现的故障进行监控,保证磁盘故障检测的全面性,同时便于工作人员及时发现磁盘存在故障,能够定位故障位置,从而对该类型的故障选取对应的措施进行维护,提高数据存储中的高效性及稳定性。
为解决上述技术问题,本申请提供了一种磁盘故障监控方法,包括:
按照磁盘故障发生位置设置多种类型的故障;
收集底层错误数据,将每一所述底层错误数据划分到其对应的类型的故障中;
当存在任一所述类型的故障满足提示条件,执行与该类型的故障对应的提示操作。
优选的,所述多种类型的故障包括:
磁盘阵列故障和/或集群故障和/或节点故障和/或机箱故障。
优选的,所述将每一所述底层错误数据划分到其对应的类型的故障中之后,该磁盘故障监控方法还包括:
判断该类型的故障中的底层错误数据是否满足对应的故障条件;
若是,将该类型的故障的状态值设置为对应的目标值;
相应的,所述当存在任一类型的故障满足提示条件之前,该磁盘故障监控方法还包括:
判断是否存在所述状态值为其对应的目标值的故障;
若是,判定存在任一所述类型的故障满足提示条件。
优选的,所述执行与该类型的故障对应的提示操作之前,该磁盘故障监控方法还包括:
检测平台类型;
相应的,所述执行与该类型的故障对应的提示操作的过程具体为:
根据所述平台类型执行与该类型的故障对应的提示操作。
优选的,所述执行与该类型的故障对应的提示操作的过程包括:
控制与该类型的故障对应的指示灯处于点亮状态。
优选的,所述执行与该类型的故障对应的提示操作的过程包括:
生成与该类型的故障对应的错误码,以便终端根据所述错误码定位磁盘故障。
优选的,该磁盘故障监控方法还包括:
判断所述集群故障是否满足所述提示条件;
若否,通过故障清理函数清理故障。
为解决上述技术问题,本申请还提供了一种磁盘故障监控系统,包括:
设置模块,用于预先按照磁盘故障发生位置设置多种类型的故障;
划分模块,用于收集底层错误数据,将每一所述底层错误数据划分到其对应的类型的故障中;
提示模块,用于当存在任一所述类型的故障满足提示条件,执行与该类型的故障对应的提示操作。
为解决上述技术问题,本申请还提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上文任意一项所述的磁盘故障监控方法的步骤。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文任意一项所述的磁盘故障监控方法的步骤。
本申请提供了一种磁盘故障监控方法,首先按照磁盘在使用过程中可能发生故障的位置设置多种类型的故障,将底层收集到的错误数据划分到对应类型的故障中,实现对磁盘应用过程中各个位置可能出现的故障进行监控,保证磁盘故障检测的全面性,当任一类型的故障满足提示条件,则执行对应的提示操作,以便工作人员及时发现磁盘存在故障,同时能够定位故障位置,从而对该类型的故障选取对应的措施进行维护,提高数据存储中的高效性及稳定性。本申请还提供了一种磁盘故障监控系统、电子设备及计算机可读存储介质,具有和上述磁盘故障监控方法相同的有益效果。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的一种磁盘故障监控方法的步骤流程图;
图2为本申请所提供的一种磁盘故障监控系统的结构示意图。
具体实施方式
本申请的核心是提供一种磁盘故障监控方法、系统、电子设备及计算机可读存储介质,实现对磁盘应用过程中各个位置可能出现的故障进行监控,保证磁盘故障检测的全面性,同时便于工作人员及时发现磁盘存在故障,能够定位故障位置,从而对该类型的故障选取对应的措施进行维护,提高数据存储中的高效性及稳定性。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参照图1,图1为本申请所提供的一种磁盘故障监控方法的步骤流程图,该磁盘故障监控方法包括:
S101:按照磁盘故障发生位置设置多种类型的故障;
具体的,磁盘故障发生位置即在磁盘应用过程中,可能导致磁盘发生故障的位置,可以为磁盘自身、磁盘所在集群、磁盘所在节点及磁盘所在机箱。因此,可按上述位置设置多种类型的故障,如磁盘阵列故障和/或集群故障和/或节点故障和/或机箱故障。
S102:收集底层错误数据,将每一底层错误数据划分到其对应的类型的故障中;
具体的,本步骤的目的在于收集底层错误数据,判断底层错误数据中是否有与上述磁盘阵列故障和/或集群故障和/或节点故障和/或机箱故障对应的错误数据,将其划分到对应的类型的故障中,以便后续定位故障。作为一种优选的实施例,将每一底层错误数据划分到其对应的类型的故障中之后,该磁盘故障监控方法还包括:判断该类型的故障中的底层错误数据是否满足对应的故障条件,若是,将该类型的故障的状态值设置为对应的目标值。
具体的,分别对磁盘阵列故障、集群故障、节点故障、机箱故障的划分方案进行说明。对于磁盘阵列故障,将与磁盘阵列故障对应的底层错误数据划分到磁盘阵列故障中,然后判断底层错误数据中是否包括集群id为65535的错误数据,若包括,则遍历所有磁盘,读取磁盘情况(包括磁盘状态及磁盘内容),当磁盘存在故障时,设置磁盘阵列对应的状态值为1,这里的1即为与磁盘阵列故障的目标值;判断底层错误数据中是否包括与磁盘阵列状态不正常对应的错误数据,若包括则设置磁盘阵列对应的状态值为1,在具体实现时,可以预设一些与磁盘阵列状态不正常对应的标识,然后通过标识在所有底层错误数据中匹配出与磁盘阵列状态不正常对应的错误数据,可以理解的是,若不存在上述两种中任一种情况,则将磁盘阵列对应的状态值设置为0。对于集群故障,判断该集群故障中的错误数据是否包括与SAS连接错误对应的错误数据,由于集群中包括多个节点的,因此,SAS(SerialAttached SCSI,串行连接SCSI接口)连接错误可以看作是节点故障,若集群故障中的错误数据包括与SAS连接错误对应的错误数据,则将节点故障对应的状态值设为1,若不存在与SAS连接错误对应的错误数据,则将节点故障对应的状态值设置0。对于节点故障,判断节点故障对应的所有错误数据中是否包括与上下控电源模块和/或上下控CMC芯片和/或控制器状态异常对应的错误数据,若是,则将节点故障对应的的状态值设置为1,若否,则将节点故障对应的状态值设置为0。对于机箱故障,判断机箱故障中是否存在与控制器/电源模块/风扇模块/托盘/磁盘这些模块状态异常对应的错误数据,若是,将机箱故障对应的状态值设置为1,若否,则将机箱故障对应的状态值设置为0。
进一步的,考虑到上述某些节点故障是可以清理的,因此,本实施例所提供的磁盘故障监控方法还包括判断集群故障是否满足提示条件,即判断是否存在SAS故障,若否,通过故障清理函数清理故障,并将节点故障的状态值设置为0。
S103:当存在任一类型的故障满足提示条件,执行与该类型的故障对应的提示操作。
具体的,判断是否有任一类型的故障的状态值为1,若是,判定存在任一类型的故障满足提示条件,则执行与该类型的故障对应的提示操作,以便工作人员可以及时发现存在故障的磁盘,并对磁盘进行维护处理,提高数据存储性能。具体的,本实施例中的执行与该类型的故障对应的提示操作可以包括控制与该类型的故障对应的指示灯处于点亮状态。还可以包括生成与该类型的故障对应的错误码,以便终端根据错误码定位磁盘故障。即当存在任一类型的故障满足提示条件,则点亮机柜的前置故障灯来提醒故障,同时生成与该类型的故障对应的故障码,当工作人员通过故障灯判断存在磁盘故障时,可以通过查询机箱上报的错误码,匹配相对应的错误,并通过错误相对应的解决方案进行手动调试(例如插拔磁盘,或通过调试代码修改错误),以此提高数据存储中的高效性及稳定性。
可见,在实际应用中,本实施例首先按照磁盘在使用过程中可能发生故障的位置设置多种类型的故障,将底层收集到的错误数据划分到对应类型的故障中,实现对磁盘应用过程中各个位置可能出现的故障进行监控,保证磁盘故障检测的全面性,当任一类型的故障满足提示条件,则执行对应的提示操作,以便工作人员及时发现磁盘存在故障,同时能够定位故障位置,从而对该类型的故障选取对应的措施进行维护,提高数据存储中的高效性及稳定性。
在上述实施例的基础上:
作为一种优选的实施例,执行与该类型的故障对应的提示操作之前,该磁盘故障监控方法还包括:
检测平台类型;
相应的,执行与该类型的故障对应的提示操作的过程具体为:
根据平台类型执行与该类型的故障对应的提示操作。
具体的,磁盘可以在多种平台上运行,不同的平台在执行提示操作时有不同的方案,因此,本实施例还对磁盘运行的平台类型进行检测,根据平台类型执行与该类型的故障对应的电灯操作,以提高可靠性。如在OAK平台上,由PL模块负责将SAS错误划分到集群故障,由RD模块负责将磁盘故障状态划分到磁盘阵列故障,由EN模块负责将机箱错误划分到机箱故障,由PL模块负责将电源模块、CMC、节点错误划分到节点故障,如果存在有上述任一故障对应的状态值发生改变,则PL模块通过ipc传递对应的信息至EC模块,EC模块通过IPMI(Intelligent Platform Management Interface,智能平台管理接口)传递信息至CMC模块,由CMC模块点亮控制柜的故障灯。若果在其他平台上。PL模块将FC/SAS错误划分到集群故障,RD模块将错误状态划分到磁盘故障,EN中检测整个机箱中的,电源、SAS、硬盘、拓展柜是否有错误,如果FC/SAS/mdisk和EN监控的机箱内的错误,则设置前面板LED。
请参照图2,图2为本申请所提供的一种磁盘故障监控系统的结构示意图,该磁盘故障监控系统包括:
设置模块1,用于预先按照磁盘故障发生位置设置多种类型的故障;
划分模块2,用于收集底层错误数据,将每一底层错误数据划分到其对应的类型的故障中;
提示模块3,用于当存在任一类型的故障满足提示条件,执行与该类型的故障对应的提示操作。
可见,在实际应用中,本实施例首先按照磁盘在使用过程中可能发生故障的位置设置多种类型的故障,将底层收集到的错误数据划分到对应类型的故障中,实现对磁盘应用过程中各个位置可能出现的故障进行监控,保证磁盘故障检测的全面性,当任一类型的故障满足提示条件,则执行对应的提示操作,以便工作人员及时发现磁盘存在故障,同时能够定位故障位置,从而对该类型的故障选取对应的措施进行维护,提高数据存储中的高效性及稳定性。
作为一种优选的实施例,多种类型的故障包括:
磁盘阵列故障和/或集群故障和/或节点故障和/或机箱故障。
作为一种优选的实施例,划分模块2还用于判断该类型的故障中的底层错误数据是否满足对应的故障条件,若是,将该类型的故障的状态值设置为对应的目标值;
相应的,该磁盘故障监控系统还包括:
判断模块,用于判断是否存在状态值为其对应的目标值的故障,若是,判定存在任一类型的故障满足提示条件。
作为一种优选的实施例,该磁盘故障监控系统还包括:
检测模块,用于检测平台类型;
相应的,执行与该类型的故障对应的提示操作的过程具体为:
根据平台类型执行与该类型的故障对应的提示操作。
作为一种优选的实施例,执行与该类型的故障对应的提示操作的过程包括:
控制与该类型的故障对应的指示灯处于点亮状态。
作为一种优选的实施例,执行与该类型的故障对应的提示操作的过程包括:
生成与该类型的故障对应的错误码,以便终端根据错误码定位磁盘故障。
作为一种优选的实施例,该磁盘故障监控系统还包括:
故障清理模块,用于判断集群故障是否满足提示条件,若否,通过故障清理函数清理故障。
另一方面,本申请还提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上文任意一个实施例所描述的磁盘故障监控方法的步骤。
本申请所提供的一种电子设备,具有和上述磁盘故障监控方法相同的有益效果。
对于本申请所提供的一种电子设备的介绍请参照上述实施例,本申请在此不再赘述。
另一方面,本申请还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上文任意一个实施例所描述的磁盘故障监控方法的步骤。
本申请所提供的一种计算机可读存储介质,具有和上述磁盘故障监控方法相同的有益效果。
对于本申请所提供的一种计算机可读存储介质的介绍请参照上述实施例,本申请在此不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种磁盘故障监控方法,其特征在于,包括:
按照磁盘故障发生位置设置多种类型的故障;
收集底层错误数据,将每一所述底层错误数据划分到其对应的类型的故障中;
当存在任一所述类型的故障满足提示条件,执行与该类型的故障对应的提示操作。
2.根据权利要求1所述的磁盘故障监控方法,其特征在于,所述多种类型的故障包括:
磁盘阵列故障和/或集群故障和/或节点故障和/或机箱故障。
3.根据权利要求2所述的磁盘故障监控方法,其特征在于,所述将每一所述底层错误数据划分到其对应的类型的故障中之后,该磁盘故障监控方法还包括:
判断该类型的故障中的底层错误数据是否满足对应的故障条件;
若是,将该类型的故障的状态值设置为对应的目标值;
相应的,所述当存在任一类型的故障满足提示条件之前,该磁盘故障监控方法还包括:
判断是否存在所述状态值为其对应的目标值的故障;
若是,判定存在任一所述类型的故障满足提示条件。
4.根据权利要求2所述的磁盘故障监控方法,其特征在于,所述执行与该类型的故障对应的提示操作之前,该磁盘故障监控方法还包括:
检测平台类型;
相应的,所述执行与该类型的故障对应的提示操作的过程具体为:
根据所述平台类型执行与该类型的故障对应的提示操作。
5.根据权利要求4所述的磁盘故障监控方法,其特征在于,所述执行与该类型的故障对应的提示操作的过程包括:
控制与该类型的故障对应的指示灯处于点亮状态。
6.根据权利要求4所述的磁盘故障监控方法,其特征在于,所述执行与该类型的故障对应的提示操作的过程包括:
生成与该类型的故障对应的错误码,以便终端根据所述错误码定位磁盘故障。
7.根据权利要求2-6任意一项所述的磁盘故障监控方法,其特征在于,该磁盘故障监控方法还包括:
判断所述集群故障是否满足所述提示条件;
若否,通过故障清理函数清理故障。
8.一种磁盘故障监控系统,其特征在于,包括:
设置模块,用于预先按照磁盘故障发生位置设置多种类型的故障;
划分模块,用于收集底层错误数据,将每一所述底层错误数据划分到其对应的类型的故障中;
提示模块,用于当存在任一所述类型的故障满足提示条件,执行与该类型的故障对应的提示操作。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1-7任意一项所述的磁盘故障监控方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任意一项所述的磁盘故障监控方法的步骤。
CN202010377065.3A 2020-05-07 2020-05-07 一种磁盘故障监控的方法、系统及相关组件 Active CN111625185B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010377065.3A CN111625185B (zh) 2020-05-07 2020-05-07 一种磁盘故障监控的方法、系统及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010377065.3A CN111625185B (zh) 2020-05-07 2020-05-07 一种磁盘故障监控的方法、系统及相关组件

Publications (2)

Publication Number Publication Date
CN111625185A true CN111625185A (zh) 2020-09-04
CN111625185B CN111625185B (zh) 2022-07-08

Family

ID=72270163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010377065.3A Active CN111625185B (zh) 2020-05-07 2020-05-07 一种磁盘故障监控的方法、系统及相关组件

Country Status (1)

Country Link
CN (1) CN111625185B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506749A (zh) * 2020-12-04 2021-03-16 苏州浪潮智能科技有限公司 一种硬盘报错信息的现场区分方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866271A (zh) * 2010-06-08 2010-10-20 华中科技大学 一种基于raid的安全预警系统和方法
CN103970642A (zh) * 2014-05-21 2014-08-06 浪潮电子信息产业股份有限公司 一种Linux服务器硬盘在线状态的监控方法
CN104951383A (zh) * 2014-03-31 2015-09-30 伊姆西公司 用于监测硬盘的健康状况的方法和装置
US20190332455A1 (en) * 2018-04-28 2019-10-31 EMC IP Holding Company LLC Method, electronic device and computer program product for evaluating health of storage disk
CN110989938A (zh) * 2019-12-15 2020-04-10 苏州浪潮智能科技有限公司 一种故障盘识别方法、装置、设备及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866271A (zh) * 2010-06-08 2010-10-20 华中科技大学 一种基于raid的安全预警系统和方法
CN104951383A (zh) * 2014-03-31 2015-09-30 伊姆西公司 用于监测硬盘的健康状况的方法和装置
CN103970642A (zh) * 2014-05-21 2014-08-06 浪潮电子信息产业股份有限公司 一种Linux服务器硬盘在线状态的监控方法
US20190332455A1 (en) * 2018-04-28 2019-10-31 EMC IP Holding Company LLC Method, electronic device and computer program product for evaluating health of storage disk
CN110989938A (zh) * 2019-12-15 2020-04-10 苏州浪潮智能科技有限公司 一种故障盘识别方法、装置、设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506749A (zh) * 2020-12-04 2021-03-16 苏州浪潮智能科技有限公司 一种硬盘报错信息的现场区分方法和系统
CN112506749B (zh) * 2020-12-04 2023-01-06 苏州浪潮智能科技有限公司 一种硬盘报错信息的现场区分方法和系统

Also Published As

Publication number Publication date
CN111625185B (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
CN103455395B (zh) 一种硬盘故障的检测方法及装置
CN108536548B (zh) 一种磁盘坏道的处理方法、装置及计算机存储介质
CN103092746A (zh) 线程异常的定位方法及系统
CN107315616B (zh) 一种固件的加载方法、装置及电子设备
CN111104293A (zh) 用于支持盘故障预测的方法、设备和计算机程序产品
CN109376029B (zh) 一种scsi硬盘异常超时的处理方法及处理系统
CN113051104B (zh) 基于纠删码的磁盘间数据恢复方法及相关装置
US7269764B2 (en) Monitoring VRM-induced memory errors
US20200004620A1 (en) Monitor and monitoring control method
US20170132102A1 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
US8984333B2 (en) Automatic computer storage medium diagnostics
CN111625185B (zh) 一种磁盘故障监控的方法、系统及相关组件
CN103502951A (zh) 操作管理系统、操作管理方法及其程序
WO2017220013A1 (zh) 业务处理方法及装置、存储介质
CN115793963A (zh) 一种硬盘故障处理方法、装置、设备及存储介质
Xu et al. Understanding SSD reliability in large-scale cloud systems
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
CN104158843A (zh) 分布式文件存储系统的存储单元失效检测方法及装置
CN111124785A (zh) 一种硬盘故障检查的方法、装置、设备及存储介质
JP6212947B2 (ja) 情報処理装置、制御装置及び制御プログラム
WO2011051999A1 (ja) 情報処理装置及び情報処理装置の制御方法
CN107122254A (zh) 一种计算机修复控制方法及系统、修复方法及系统
CN112838962B (zh) 一种大数据集群的性能瓶颈检测方法及装置
CN115240759A (zh) 一种固态硬盘检测方法、装置、设备及存储介质
CN115687026A (zh) 多节点服务器故障预警方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant