CN114048085A - 一种磁盘故障分析方法、装置、设备及可读存储介质 - Google Patents

一种磁盘故障分析方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN114048085A
CN114048085A CN202210029329.5A CN202210029329A CN114048085A CN 114048085 A CN114048085 A CN 114048085A CN 202210029329 A CN202210029329 A CN 202210029329A CN 114048085 A CN114048085 A CN 114048085A
Authority
CN
China
Prior art keywords
fault
parameter
disk
parameters
association rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210029329.5A
Other languages
English (en)
Other versions
CN114048085B (zh
Inventor
李美影
荆荣讯
连爱朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210029329.5A priority Critical patent/CN114048085B/zh
Publication of CN114048085A publication Critical patent/CN114048085A/zh
Application granted granted Critical
Publication of CN114048085B publication Critical patent/CN114048085B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2268Logging of test results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种磁盘故障分析方法、装置、设备及可读存储介质。本申请提供的方法包括:获取记录磁盘故障的故障参数集;从所述故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数;对所述目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间;基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障。该方案保留了相关性较高的参数,无需较多算力支持,考虑相关性较高的各参数间的关联得到的故障关联规则易于发现不同参数间更深层次的规律,能够以轻量方式全面分析磁盘故障。本申请提供的一种磁盘故障分析装置、设备及可读存储介质,也同样具有上述技术效果。

Description

一种磁盘故障分析方法、装置、设备及可读存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种磁盘故障分析方法、装置、设备及可读存储介质。
背景技术
在磁盘使用过程中,通常会记录较多磁盘故障信息,这些信息多而繁杂。目前可以使用神经网络等模型对这些信息进行分析,以总结不同参数间的规律。但是,由于神经网络等模型需要较多算力支持,分析过程复杂,故不宜在轻量级设备上使用。若采用图表等简单方法分析多而繁杂的磁盘故障信息,又会导致分析过于片面,难以发现不同参数间更深层次的规律。
因此,如何以较方便快捷的分析方式分析磁盘故障,是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种磁盘故障分析方法、装置、设备及可读存储介质,以较方便快捷的分析方式分析磁盘故障。其具体方案如下:
第一方面,本申请提供了一种磁盘故障分析方法,包括:
获取记录磁盘故障的故障参数集;
从所述故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数;
对所述目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间;
基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障。
优选地,所述从所述故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数,包括:
确定所述故障参数集中的每一故障参数对应的参数等级和故障等级;
基于每一故障参数对应的参数等级和故障等级计算每一故障参数的斯皮尔曼相关系数;
选择斯皮尔曼相关系数大于所述相关性阈值的故障参数作为所述目标参数。
优选地,所述基于每一故障参数对应的参数等级和故障等级计算每一故障参数的斯皮尔曼相关系数,包括:
按照目标公式计算每一故障参数的斯皮尔曼相关系数,所述目标公式为:
Figure 825843DEST_PATH_IMAGE001
其中,R为故障参数i的斯皮尔曼相关系数,n为所述故障参数集包括的参数个数,d为故障参数i对应的参数等级和故障等级的差值。
优选地,所述相关性阈值为:基于双尾检验确定的临界值。
优选地,所述多个预设区间通过划分[0,1]或[0,100]得到。
优选地,所述基于任意预设区间生成故障关联规则,包括:
确定最小支持度阈值和最小置信度阈值;
在任一预设区间中确定满足所述最小支持度阈值和所述最小置信度阈值的K个项目组;每个项目组包括的参数个数不等;
将所述K个项目组确定为K个故障关联规则。
优选地,所述利用所述故障关联规则分析磁盘故障,包括:
在磁盘使用过程中,利用所述故障关联规则分析磁盘产生的故障信息,并对满足所述故障关联规则的故障信息进行告警。
优选地,还包括:
若任一故障关联规则对应的项目组个数超过项目组阈值和/或告警频率超过告警阈值,则调大最小支持度阈值和最小置信度阈值,并执行所述基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障的步骤。
优选地,所述调大所述最小支持度阈值和所述最小置信度阈值,包括:
基于任一故障关联规则对应的项目组个数和告警频率确定调整梯度值,并基于所述调整梯度值调大所述最小支持度阈值和所述最小置信度阈值。
优选地,还包括:
若告警属于误报,则删除所述故障信息满足的故障关联规则。
第二方面,本申请提供了一种磁盘故障分析装置,包括:
获取模块,用于获取记录磁盘故障的故障参数集;
选择模块,用于从所述故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数;
映射模块,用于对所述目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间;
分析模块,用于基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障。
第三方面,本申请提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的磁盘故障分析方法。
第四方面,本申请提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的磁盘故障分析方法。
通过以上方案可知,本申请提供了一种磁盘故障分析方法,包括:获取记录磁盘故障的故障参数集;从所述故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数;对所述目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间;基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障。
可见,本申请先从大量故障参数中找出与磁盘故障相关性较高的目标参数,然后对目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间,以统一繁杂的各种参数,以便进行故障关联规则的总结。最后基于任意预设区间生成故障关联规则,并利用故障关联规则分析磁盘故障。该方案剔除了相关性较小的参数,保留了相关性较高的参数,无需较多算力支持,分析过程便捷且方便,故可以在轻量级设备上应用;同时该方案考虑了相关性较高的各参数间的关联得到了故障关联规则,不至于出现片面分析,易于发现不同参数间更深层次的规律,能够以较方便快捷的分析方式发现不同磁盘故障参数间更深层次的规律,能够以轻量方式全面分析磁盘故障。
相应地,本申请提供的一种磁盘故障分析装置、设备及可读存储介质,也同样具有上述技术效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种磁盘故障分析方法流程图;
图2为本申请公开的另一种磁盘故障分析方法流程图;
图3为本申请公开的一种磁盘故障分析装置示意图;
图4为本申请公开的一种电子设备示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,由于神经网络等模型需要较多算力支持,分析过程复杂,故不宜在轻量级设备上使用。若采用图表等简单方法分析多而繁杂的磁盘故障信息,又会导致分析过于片面,难以发现不同参数间更深层次的规律。为此,本申请提供了一种磁盘故障分析方案,能够以较方便快捷的分析方式分析磁盘故障。
参见图1所示,本申请实施例公开了一种磁盘故障分析方法,包括:
S101、获取记录磁盘故障的故障参数集。
在本实施例中,故障参数集由磁盘内置的SMART系统(Self-Monitoring Analysisand Reporting Technology,自动检测分析及报告技术)或FARM系统(FieldAccessibility Reliability Metrics)产生。磁盘可以是固态硬盘、机械硬盘等任意存储介质。SMART系统或FARM系统产生的参数可以包括:盘片温度、寿命余量、链路错误次数、工作时间、通电次数、坏块数、循环擦写数、读出量、写入量等。
S102、从故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数。
在本实施例中,各故障参数与磁盘故障的相关性大小可以采用斯皮尔曼相关系数进行评估。当然,还可以采用其他合适的相关性评估方法评估各故障参数与磁盘故障的相关性大小,如皮尔逊相关性等。
在一种具体实施方式中,从故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数,包括:确定故障参数集中的每一故障参数对应的参数等级和故障等级;基于每一故障参数对应的参数等级和故障等级计算每一故障参数的斯皮尔曼相关系数;选择斯皮尔曼相关系数大于相关性阈值的故障参数作为目标参数。
其中,基于每一故障参数对应的参数等级和故障等级计算每一故障参数的斯皮尔曼相关系数,包括:按照目标公式计算每一故障参数的斯皮尔曼相关系数,目标公式为:
Figure 215368DEST_PATH_IMAGE001
其中,R为故障参数i的斯皮尔曼相关系数,n为故障参数集包括的参数个数,d为故障参数i对应的参数等级和故障等级的差值。
其中,相关性阈值为:基于双尾检验确定的临界值,当然还可以是经验值。该相关性阈值可由用户自由调整,以调整需要保留的目标参数的总个数。目标参数为保留下来的、与磁盘故障的相关性高于相关性阈值的各故障参数的统称。
S103、对目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间。
由于磁盘故障参数多而繁杂,且不同种类的参数无法横向比较和关联。例如:温度大小和擦写次数这两种参数无法横向比较。为了便于对不同种类的参数进行横向比较和关联,本实施例将这些参数按照种类分类后,按照类别将每一参数量化至[0,1]之间或[0,100]之间,并将量化后的各参数划分为多个预设区间,以分别总结不同梯度的各参数间的关系。例如:将[0,1]预先划分为[0,0.2)、[0.2,0.4)、[0.4,0.6)、[0.6,0.8)、[0.8,1],那么量化至[0,1]之间的各参数就被划分至上述5个预设区间,针对这5个预设区间可分别总结故障关联规则。因此在一种具体实施方式中,多个预设区间通过划分[0,1]或[0,100]得到。
S104、基于任意预设区间生成故障关联规则,并利用故障关联规则分析磁盘故障。
在一种具体实施方式中,基于任意预设区间生成故障关联规则,包括:确定最小支持度阈值和最小置信度阈值;在任一预设区间中确定满足最小支持度阈值和最小置信度阈值的K个项目组;每个项目组包括的参数个数不等;将K个项目组确定为K个故障关联规则。可见,针对任一个预设区间,可得到K个故障关联规则,K的取值及故障关联规则的具体生成过程可参照现有相关技术。最小支持度阈值和最小置信度阈值的初始值可由用户根据经验设定。
本实施例能够对大量且复杂的磁盘参数进行筛选,并对筛选所得的各参数进行标准化,以便从杂乱的参数中总结出故障关联规则。
可见,本实施例先从大量故障参数中找出与磁盘故障相关性较高的目标参数,然后对目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间,以统一繁杂的各种参数,以便进行故障关联规则的总结。最后基于任意预设区间生成故障关联规则,并利用故障关联规则分析磁盘故障。该方案剔除了相关性较小的参数,保留了相关性较高的参数,无需较多算力支持,分析过程便捷且方便,故可以在轻量级设备上应用;同时该方案考虑了相关性较高的各参数间的关联得到了故障关联规则,不至于出现片面分析,易于发现不同参数间更深层次的规律,能够以较方便快捷的分析方式发现不同磁盘故障参数间更深层次的规律,能够以轻量方式全面分析磁盘故障。
基于上述实施例,需要说明的是,利用故障关联规则分析磁盘故障,包括:在磁盘使用过程中,利用故障关联规则分析磁盘产生的故障信息,并对满足任一故障关联规则的故障信息进行告警。
由于针对任一个预设区间可得到K个项目组,即K个故障关联规则,因此按照本申请可得K×M个故障关联规则,M为预设区间的个数。
在一种具体实施方式中,若任一故障关联规则对应的项目组个数(即K的值)超过项目组阈值和/或告警频率(该故障关联规则对应的告警频率)超过告警阈值,则调大最小支持度阈值和最小置信度阈值后,执行所述基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障的步骤,以更新得到的故障关联规则,使其精准度更高。
在一种具体实施方式中,调大最小支持度阈值和最小置信度阈值,包括:基于任一故障关联规则对应的项目组个数(即K的值)和告警频率(该故障关联规则对应的告警频率)确定调整梯度值,并基于调整梯度值调大最小支持度阈值和最小置信度阈值。
在一种具体实施方式中,若告警属于误报,则删除产生告警的故障信息满足的故障关联规则和/或调大最小支持度阈值和最小置信度阈值后重新生成故障关联规则。其中,删除产生告警的故障信息满足的故障关联规则,可剔除不准确的故障关联规则。调大最小支持度阈值和最小置信度阈值后,执行所述基于任意预设区间生成故障关联规则的步骤,可重新生成故障关联规则,从而更新得到精准度更高的故障关联规则。
针对以下问题:①不能全面、精确、客观地获取磁盘故障的因素及其发生规律;②磁盘故障分析操作复杂、难度大、耗时长。本实施例提出了一种磁盘故障分析方法,该方法能够综合考虑磁盘各项故障参数的相互影响,发现磁盘故障参数之间的关联,从而识别高危磁盘,能够保证数据安全、系统安全、服务安全,极大地避免了数据丢失、服务崩溃等情况。
请参见图2,本实施例由以下几部分构成:参数筛选、参数标准化及区间划分、关联规则挖掘、关联规则应用。
一、参数筛选:筛选出与磁盘故障关系较大的参数。
一般地,SMART数据和/或FARM数据包含一大堆参数,如盘片温度、寿命余量、链路错误次数、工作时间、通电次数、坏块数、循环擦写数、读出量、写入量等等。参数过多会导致故障分析的复杂性过大,且一些参数可能对磁盘故障的影响微乎其微,但却干扰着磁盘故障分析工作。因此,首先需要从众多参数中筛选出与磁盘故障存在密切关系的参数,从而减少复杂度,增加磁盘故障数据分析的准确性。
磁盘故障参数与磁盘是否故障之间的相关性分析,可以采用常用的相关性分析方法。如:皮尔逊相关性分析方法,该方法要求变量为连续数值型变量,且为正态分布。但由于磁盘是否故障只存在两种情况:故障与非故障,因此皮尔逊相关性分析方法可能不太适于分析磁盘故障参数与磁盘是否故障之间的相关性。为此,本实施例选用斯皮尔曼相关系数来分析两个向量之间的关系程度。
斯皮尔曼相关系数不要求变量的连续性与正态性,且斯皮尔曼相关系数检验的不是数据之间的关系,而是数据排名之间的关系,若排名相同时则取算数平均。这对于离散数据、异常数据等具有更强的鲁棒性。据此,可对各故障参数按照等级排名后,基于斯皮尔曼相关系数分析不同等级的故障参数的相关性。
具体的,对SMART数据和/或FARM数据进行斯皮尔曼相关性分析,筛选出与磁盘故障存在密切关系的参数,具体过程如下:
1、对SMART数据和/或FARM数据、是否故障的结果进行等级排序,并计算故障参数X与其对应的故障结果的等级差、等级差的方差。
如表1所示,某一种类别的故障参数X包括X1~Xn个参数值。X1~Xn分别对应Y1~Yn个磁盘是否故障的结果,也即:Y1~Yn表示磁盘是否故障。
表1
Figure 141735DEST_PATH_IMAGE002
以磁盘启动次数这一参数为例,将其按照表1进行记录,可得如表2所示的数据表。
表2
Figure 18424DEST_PATH_IMAGE003
在表2中,“1”表示磁盘故障,“0”表示磁盘未故障,且记录有磁盘启动次数这一参数的信息共有2000条(假设各条信息记录的磁盘启动次数不等),故2000条数据按序排列后,等级自1至2000进行取值。
2、计算斯皮尔曼相关系数,计算公式为:
Figure 122778DEST_PATH_IMAGE001
其中,R为故障参数i的斯皮尔曼相关系数,n为故障参数集包括的参数个数,d为故障参数i对应的参数等级(如表2中启动次数的等级)和故障等级(如表2中是否故障的等级)的差值。基于该公式,R的取值位于[-1,+1]之间。
按照表2示例,则有:
Figure 999598DEST_PATH_IMAGE004
可见,针对每一参数,都能计算得到一个R。
3、设置斯皮尔曼相关系数阈值(即相关性阈值)。
假设设置0.5作为阈值,那么认为|R|≥0.5的参数与磁盘故障存在密切关系,因此保留此类参数。当然,可以参考双尾检验临界值来设置此阈值,例如取样本数为n、显著水平0.05情况下的阈值。该阈值可以根据实际情况进行修改。
二、参数标准化及区间划分。
根据相关性阈值可以剔除不重要的参数,保留与磁盘故障相关性强的关键参数。筛选后所得的数据集可如表3所示。
表3
Figure 791974DEST_PATH_IMAGE005
可见,针对每一种参数,都可能保留至少一个取值。在表3中,这些参数的取值已量化为100制。
由于参数种类可能有100种,不同类型的参数的取值不同,难以量化。为此,本实施例将255制或其他制的参数取值都转为100制,以对分散的数据进行整合,降低分析结果的偶然性。
进一步地,将转化后的100制的所有参数划分成不同的区段(即多个预设区间),分别分析某个区段内的磁盘故障率的高低,以进一步降低分析结果的偶然性。
例如:不同的区段为1~10,11~20,…,91~100。比如通电次数52这一参数落在51~60这个区段之中,那么使其落入该区段。
三、针对各区间的参数进行关联规则挖掘。
关联规则挖掘可以发现表3中项与项之间的关系,通过不同故障因素的组合,获取的有用规律。
具体的,关联规则是指两个事件或因素之间关系紧密程度的一种度量。一般地对关联规则有如下定义:关联规则是形如X→Y的蕴涵式,其中,X和Y分别称为关联规则的先导和后继。假设I={I1,I2,I3,…,Im}是m项集合。给定一个数据集D,其中每个事务(Transaction)T是I的非空子集,即T⊆I。关联规则在D中的支持度是D中事务同时包含X、Y的百分比,即概率;置信度是D中事务已经包含X的情况下包含Y的百分比,即条件概率;提升度为X的出现对Y出现概率提升的程度,即“包含X的事务中同时包含Y事务的比例”与“包含Y事务的比例”的比值,提升度反映了关联规则中的A与B的相关性,提升度>1且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。如果满足最小支持度阈值和最小置信度阈值,则认为关联规则是有意义的。
将D在I上满足最小支持度和最小信任度的关联规则,称为强关联规则。当给定一个事务数据集,关联规则挖掘就是通过用户指定最小支持度和最小信任度来寻找强关联规则的过程。因此,关联规则挖掘可定义为:给定一个事务数据集D,寻找出所有满足支持度大于最小支持度、且置信度大于最小置信度的项集合。
针对表3,可找出所有高频项目组。高频的意思是指某一项目组出现的频率相对于所有记录而言,必须达到某一水平。一个项目组出现的频率称为支持度。一个满足最小支持度的k-itemset,称为高频k-项目组,一般表示为Large k或Frequent k。增加项目组包括的项后,判断其是否满足支持度大于最小支持度、且置信度大于最小置信度;若是,则得到一个高频项目组,那么再次增加项目组包括的项,继续判断其是否满足支持度大于最小支持度、且置信度大于最小置信度,直至无法再找到更长的高频项目组为止。
得到的任一高频项目组即一个关联规则,也即:一个高频项目组中的所有项之间存在一个关联规则。据此,针对任一区段可得到多个关联规则。
四、利用上述各项关联规则有针对性地预防与处理磁盘故障。
例如,关联规则可以是:当磁盘通电次数为A1~A2、底层数据读取错误率为B1~B2、写错误率为C1~C2时,磁盘发生故障,据此可有针对性地预防与处理磁盘故障。
可见,本实施例将斯皮尔曼相关性分析应用到磁盘故障分析中,从繁多的磁盘参数中剔除了不相关参数,降低了磁盘故障分析的复杂度,减少了干扰项。将关联规则应用到磁盘故障分析中,找出了参数关联规律与磁盘故障发生的关系,据此关系能够找出易发生磁盘故障的场景,识别出高危磁盘,保证数据安全,为磁盘硬件厂商提供改进方向,为企业及用户避免巨大的经济损失。
下面对本申请实施例提供的一种磁盘故障分析装置进行介绍,下文描述的一种磁盘故障分析装置与上文描述的一种磁盘故障分析方法可以相互参照。
参见图3所示,本申请实施例公开了一种磁盘故障分析装置,包括:
获取模块301,用于获取记录磁盘故障的故障参数集;
选择模块302,用于从故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数;
映射模块303,用于对目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间;
分析模块304,用于基于任意预设区间生成故障关联规则,并利用故障关联规则分析磁盘故障。
在一种具体实施方式中,选择模块包括:
确定单元,用于确定故障参数集中的每一故障参数对应的参数等级和故障等级;
计算单元,用于基于每一故障参数对应的参数等级和故障等级计算每一故障参数的斯皮尔曼相关系数;
选择单元,用于选择斯皮尔曼相关系数大于相关性阈值的故障参数作为目标参数。
在一种具体实施方式中,计算单元具体用于:
按照目标公式计算每一故障参数的斯皮尔曼相关系数,目标公式为:
Figure 680426DEST_PATH_IMAGE001
其中,R为故障参数i的斯皮尔曼相关系数,n为故障参数集包括的参数个数,d为故障参数i对应的参数等级和故障等级的差值。
在一种具体实施方式中,相关性阈值为:基于双尾检验确定的临界值。
在一种具体实施方式中,多个预设区间通过划分[0,1]或[0,100]得到。
在一种具体实施方式中,分析模块具体用于:
确定最小支持度阈值和最小置信度阈值;
在任一预设区间中确定满足最小支持度阈值和最小置信度阈值的K个项目组;每个项目组包括的参数个数不等;
将K个项目组确定为K个故障关联规则。
在一种具体实施方式中,分析模块具体用于:
在磁盘使用过程中,利用故障关联规则分析磁盘产生的故障信息,并对满足故障关联规则的故障信息进行告警。
在一种具体实施方式中,还包括:
调整模块,用于若任一故障关联规则对应的项目组个数超过项目组阈值和/或告警频率超过告警阈值,则调大最小支持度阈值和最小置信度阈值。
在一种具体实施方式中,调整模块具体用于:
基于任一故障关联规则对应的项目组个数和告警频率确定调整梯度值,并基于调整梯度值调大最小支持度阈值和最小置信度阈值。
在一种具体实施方式中,还包括:
删除模块,用于若告警属于误报,则删除故障信息满足的故障关联规则。
其中,关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本实施例提供了一种磁盘故障分析装置,能够以较方便快捷的分析方式分析磁盘故障。
下面对本申请实施例提供的一种电子设备进行介绍,下文描述的一种电子设备与上文描述的一种磁盘故障分析方法及装置可以相互参照。
参见图4所示,本申请实施例公开了一种电子设备,包括:
存储器401,用于保存计算机程序;
处理器402,用于执行所述计算机程序,以实现上述任意实施例公开的方法。
下面对本申请实施例提供的一种可读存储介质进行介绍,下文描述的一种可读存储介质与上文描述的一种磁盘故障分析方法、装置及设备可以相互参照。
一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的磁盘故障分析方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本申请涉及的“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法或设备固有的其它步骤或单元。
需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的可读存储介质中。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种磁盘故障分析方法,其特征在于,包括:
获取记录磁盘故障的故障参数集;
从所述故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数;
对所述目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间;
基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障。
2.根据权利要求1所述的方法,其特征在于,所述从所述故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数,包括:
确定所述故障参数集中的每一故障参数对应的参数等级和故障等级;
基于每一故障参数对应的参数等级和故障等级计算每一故障参数的斯皮尔曼相关系数;
选择斯皮尔曼相关系数大于所述相关性阈值的故障参数作为所述目标参数。
3.根据权利要求2所述的方法,其特征在于,所述基于每一故障参数对应的参数等级和故障等级计算每一故障参数的斯皮尔曼相关系数,包括:
按照目标公式计算每一故障参数的斯皮尔曼相关系数,所述目标公式为:
Figure 637417DEST_PATH_IMAGE001
其中,R为故障参数i的斯皮尔曼相关系数,n为所述故障参数集包括的参数个数,d为故障参数i对应的参数等级和故障等级的差值。
4.根据权利要求2所述的方法,其特征在于,所述相关性阈值为:基于双尾检验确定的临界值。
5.根据权利要求1所述的方法,其特征在于,所述多个预设区间通过划分[0,1]或[0,100]得到。
6.根据权利要求1-5任意一项所述的方法,其特征在于,所述基于任意预设区间生成故障关联规则,包括:
确定最小支持度阈值和最小置信度阈值;
在任一预设区间中确定满足所述最小支持度阈值和所述最小置信度阈值的K个项目组;每个项目组包括的参数个数不等;
将所述K个项目组确定为K个故障关联规则。
7.根据权利要求1-5任意一项所述的方法,其特征在于,所述利用所述故障关联规则分析磁盘故障,包括:
在磁盘使用过程中,利用所述故障关联规则分析磁盘产生的故障信息,并对满足所述故障关联规则的故障信息进行告警。
8.根据权利要求7所述的方法,其特征在于,还包括:
若任一故障关联规则对应的项目组个数超过项目组阈值和/或告警频率超过告警阈值,则调大最小支持度阈值和最小置信度阈值,并执行所述基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障的步骤。
9.根据权利要求8所述的方法,其特征在于,所述调大所述最小支持度阈值和所述最小置信度阈值,包括:
基于任一故障关联规则对应的项目组个数和告警频率确定调整梯度值,并基于所述调整梯度值调大所述最小支持度阈值和所述最小置信度阈值。
10.根据权利要求7所述的方法,其特征在于,还包括:
若告警属于误报,则删除所述故障信息满足的故障关联规则。
11.一种磁盘故障分析装置,其特征在于,包括:
获取模块,用于获取记录磁盘故障的故障参数集;
选择模块,用于从所述故障参数集中选择与磁盘故障的相关性高于相关性阈值的故障参数,得到目标参数;
映射模块,用于对所述目标参数进行分类,得到多个参数类别,并将每一参数类别中的参数映射至多个预设区间;
分析模块,用于基于任意预设区间生成故障关联规则,并利用所述故障关联规则分析磁盘故障。
12.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至10任一项所述的方法。
13.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至10任一项所述的方法。
CN202210029329.5A 2022-01-12 2022-01-12 一种磁盘故障分析方法、装置、设备及可读存储介质 Active CN114048085B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210029329.5A CN114048085B (zh) 2022-01-12 2022-01-12 一种磁盘故障分析方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210029329.5A CN114048085B (zh) 2022-01-12 2022-01-12 一种磁盘故障分析方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN114048085A true CN114048085A (zh) 2022-02-15
CN114048085B CN114048085B (zh) 2022-04-22

Family

ID=80196348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210029329.5A Active CN114048085B (zh) 2022-01-12 2022-01-12 一种磁盘故障分析方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114048085B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293282A (zh) * 2022-08-18 2022-11-04 昆山润石智能科技有限公司 制程问题分析方法、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5117408A (en) * 1989-09-29 1992-05-26 Seagate Technology, Inc. Correlation of sectored servo position information
US20070274419A1 (en) * 2006-05-26 2007-11-29 Samsung Electronics Co., Ltd. Apparatus and method of detecting error symbol, and disk drive apparatus using the same
CN108228377A (zh) * 2017-12-29 2018-06-29 华中科技大学 一种面向磁盘故障检测的smart阈值优化方法
CN108959004A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 磁盘故障预测方法、装置、设备及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5117408A (en) * 1989-09-29 1992-05-26 Seagate Technology, Inc. Correlation of sectored servo position information
US20070274419A1 (en) * 2006-05-26 2007-11-29 Samsung Electronics Co., Ltd. Apparatus and method of detecting error symbol, and disk drive apparatus using the same
CN108228377A (zh) * 2017-12-29 2018-06-29 华中科技大学 一种面向磁盘故障检测的smart阈值优化方法
CN108959004A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 磁盘故障预测方法、装置、设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293282A (zh) * 2022-08-18 2022-11-04 昆山润石智能科技有限公司 制程问题分析方法、设备及存储介质
CN115293282B (zh) * 2022-08-18 2023-08-29 昆山润石智能科技有限公司 制程问题分析方法、设备及存储介质

Also Published As

Publication number Publication date
CN114048085B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
US11281203B2 (en) Method for detecting anomalies in a water distribution system
CN110046453B (zh) 一种激光雷达的寿命预测方法
CN110601900B (zh) 一种网络故障预警方法及装置
US8185348B2 (en) Techniques for monitoring a data stream
US7089460B2 (en) System and method for memory leak detection
CN107992410B (zh) 软件质量监测方法、装置、计算机设备和存储介质
CN112596964B (zh) 磁盘故障的预测方法及装置
CN114048085B (zh) 一种磁盘故障分析方法、装置、设备及可读存储介质
JP2017123124A (ja) 無線通信異常検出方法、無線通信異常検出プログラム及び無線通信異常検出装置
CN115248757A (zh) 一种硬盘健康评估方法和存储设备
CN111626351B (zh) 一种用于获取数据分布的概念漂移量的方法和系统
CN112416670A (zh) 硬盘测试方法、装置、服务器和存储介质
CN117170915A (zh) 数据中心设备故障预测方法、装置和计算机设备
CN116149926A (zh) 业务指标的异常监测方法、装置、设备及存储介质
CN111143103A (zh) 一种关联关系确定方法、装置、设备及可读存储介质
Cecconi et al. A temporal logic-based measurement framework for process mining
KR20190128420A (ko) 클라우드 기반 가상 센서를 이용한 IoT 센서 이상 진단 방법 및 시스템
CN115841049B (zh) 一种基于多源信息融合的设备寿命可靠性评估方法及系统
CN108763092B (zh) 一种基于交叉验证的代码缺陷检测方法及装置
US11803433B2 (en) Localization of potential issues to objects
CN114139625A (zh) 一种基于退化轨迹曲线分析的零件质量分类方法、系统
CN112541177A (zh) 一种基于数据安全的异常检测方法及系统
CN117271247B (zh) 一种ssd固态硬盘测试方法
US20240185136A1 (en) Method of assessing input-output datasets using neighborhood criteria in the input space and the output space
CN116450632B (zh) 地理样本数据质量评估方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant