CN113608916B - 故障诊断的方法、装置、电子设备及存储介质 - Google Patents
故障诊断的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113608916B CN113608916B CN202111168573.1A CN202111168573A CN113608916B CN 113608916 B CN113608916 B CN 113608916B CN 202111168573 A CN202111168573 A CN 202111168573A CN 113608916 B CN113608916 B CN 113608916B
- Authority
- CN
- China
- Prior art keywords
- fault
- diagnosis
- target
- data
- fault type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 337
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012216 screening Methods 0.000 claims abstract description 25
- 238000001914 filtration Methods 0.000 claims abstract description 14
- 239000002131 composite material Substances 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 description 10
- 238000012423 maintenance Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012106 screening analysis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0781—Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本发明揭示了一种故障诊断的方法、装置、电子设备及存储介质,方法包括获取各个诊断规则与故障类型的对应关系,以及获取各个诊断规则中的目标指标,各个诊断规则对应一个所述故障类型;获取待诊断故障数据,待诊断故障数据包括多个指标;基于各个诊断规则中的目标指标对待诊断故障数据中的指标进行过滤,得到与各个诊断规则对应的目标故障数据;基于各个目标故障数据中的指标数据与各个诊断规则中的目标指标数据的关系,确定目标诊断规则,确定待诊断故障数据对应的目标故障类型。根据故障类型对规则分类、计算相关系数和差值筛选规则指标,对新输入的故障数据快速给出故障类型,并输出所属类别中的规则做后续详细的故障诊断,从而提高诊断效率。
Description
技术领域
本发明涉及故障诊断技术领域,具体涉及一种故障诊断的方法、装置、电子设备及存储介质。
背景技术
在信息技术的发展应用中,生成了大量数据,数据的广泛性和复杂性为分析过程增加了难度,因而寻求更加快速且准确的分析方法是重中之重,服务器的运维和故障诊断便是该场景的体现。在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、规则分类和故障判别分析,快速给出故障的初始类型,并筛选出与该故障关联度高的规则以便后续的详细诊断。首先根据规则与故障的对应关系将规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该类中的规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间,所以该方法具有广泛的应用场景。
发明内容
有鉴于此,本发明实施例提供了一种故障诊断的方法、装置、电子设备及存储介质,旨在解决在现有的服务器故障诊断过程中,产生了大量的诊断规则,由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多的问题。
根据第一方面,本发明实施例提供了一种故障诊断的方法,包括如下步骤:
获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型;
获取待诊断故障数据,所述待诊断故障数据包括多个指标;
基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
本发明提供的故障诊断的方法,在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、诊断规则分类和故障类型判别分析,快速给出故障的初始类型,并筛选出与该故障类型关联度高的规则以便后续的详细诊断。首先根据诊断规则与故障类型的对应关系将诊断规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该故障类型中的规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间。
结合第一方面,在第一方面第一实施方式中,获取各个诊断规则与故障类型的对应关系,包括:
获取所述诊断规则所对应的故障类型,以及初始故障类型集;
当所述诊断规则对应至少两个故障类型时,获取复合故障类型集;
基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集;
判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
本发明提供的故障诊断的方法,每条诊断规则对应一个或者多个故障类型,每个故障类型中有一条或多条诊断规则,故障类型与诊断规则为多对多关系,因此需要对故障类型进行简化,提高诊断效率。
结合第一方面,在第一方面第二实施例中,获取各个所述诊断规则中的目标指标,包括:
获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
本发明提供的故障诊断的方法,指标之间的相关性则会影响诊断的准确率,因此需要对指标进行筛选,只保留相关性较弱的指标。
结合第一方面,在第一方面第三实施例中,基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据,包括:
对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
本发明提供的故障诊断的方法,目标指标数量过多会拖慢诊断速度,指标之间的相关性会导致诊断结果的冗余,影响诊断的准确率,所以在判别分析和诊断之前,通过判断结果筛选指标,剔除与其他指标相关性强的指标,减少指标个数,降低指标之间的相似度。
结合第一方面,在第一方面第四实施例中,基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型,包括:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
本发明提供的故障诊断的方法,基于所述距离和所述比值进行计算,可根据计算结果确定所述待诊断故障数据对应的目标故障类型,减少了计算的复杂度,提高了诊断速率,为服务器运维节省人力和时间。
结合第一方面第一实施方式,在第一方面第五实施例中,当所述诊断规则对应至少两个故障类型时,获取复合故障类型集步骤中,包括:
若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
本发明提供的故障诊断的方法,将所述诊断规则从初始对应的所述故障类型中删除可以简化对诊断规则的筛选,避免对诊断规则从初始对应的故障类型重复进行计算,节省了时间,提高了效率。
结合第一方面第一实施方式,在第一方面第六实施例中,当所述诊断规则对应至少两个故障类型时,获取复合故障类型集步骤中,包括:
判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
本发明提供的故障诊断的方法,对故障类型进行筛选简化,并且将删除的故障类型中原有的诊断规则发送到所述诊断规则中故障等级最高的故障类型中可以提高诊断的效率。
根据第二方面,本发明实施例还提供了一种故障诊断的装置,包括:
分类模块,用于获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型;
获取模块,用于获取待诊断故障数据,所述待诊断故障数据包括多个指标;
指标筛选模块,用于基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
判别分析模块,用于基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
本发明实施例提供的故障诊断的装置,在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、诊断规则分类和故障类型判别分析,快速给出故障的初始类型,并筛选出与该故障类型关联度高的规则以便后续的详细诊断。首先根据诊断规则与故障类型的对应关系将诊断规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该故障类型中的规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间。
结合第二方面,在第二方面第一实施方式中,上述分类模块,具体用于:
初始故障类型集获取模块,用于获取所述诊断规则所对应的故障类型,以及初始故障类型集;
复合故障类型集获取模块,用于当所述诊断规则对应至少两个故障类型时,获取复合故障类型集;
第一故障类型集获取模块,用于基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集;
目标故障类型获取模块,用于判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
结合第二方面,在第二方面第二实施例中,上述分类模块,具体用于:
系数判别模块,用于获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
目标指标获取模块,用于当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
结合第二方面,在第二方面第三实施例中,上述指标筛选模块,具体用于:
标记模块,用于对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
结合第二方面,在第二方面第四实施例中,上述判别分析模块,具体用于:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
结合第二方面第一实施方式,在第二方面第五实施例中,上述复合故障类型集获取模块,具体用于:
删除模块,用于若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
结合第二方面第一实施方式,在第二方面第六实施例中,上述复合故障类型集获取模块,具体用于:
分配模块,用于判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
根据第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的故障诊断的方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的故障诊断的方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1 是应用本发明实施例提供的故障诊断的方法的流程示意图;
图2 是应用本发明实施例提供的故障诊断的装置的功能模块图;
图3 是应用本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例提供的故障诊断的方法,其执行主体可以是故障诊断的装置,该故障诊断的装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
在本申请一个实施例中,如图1所示,提供了一种故障诊断的方法,以该方法应用与电子设备为例进行说明,包括以下步骤:
S100,获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型。
本发明以服务器运维和故障诊断中积累的诊断规则为目标数据集,根据故障类型对规则分类、计算相关系数和差值筛选规则指标,具体运算方式后续进行详细说明,然后对新输入的故障数据判别分析所属故障类别,快速给出故障类型,并输出所属故障类别中的诊断规则做后续详细的故障诊断,从而提高诊断效率。
在本实施例中,形成一个数据集,其中,现有服务器运维和故障诊断中积累的诊断规则E,共有a条;有b个故障类型;故障等级c个。每条诊断规则对应一个或者多个故障类型,每个故障类型中有一条或多条诊断规则,故障类型与诊断规则为多对多关系;一个故障类型对应唯一故障等级,一个故障等级中可包含多个故障类型,故障类型与故障严重等级为多对一关系,因此需要对诊断规则和故障类型进行简化处理,使得各个所述诊断规则对应一个所述故障类型,使得新输入的故障数据可以根据诊断规则快速匹配到相应的故障类型,提高了诊断效率。
S200,获取待诊断故障数据,所述待诊断故障数据包括多个指标。
获取到待诊断故障数据中的多个指标,然后将其与诊断规则中的目标指标进行判别分析进行筛选分析,进而可将待诊断故障数据匹配到相应的诊断规则,从而可确定待诊断故障数据对应的故障类型。
S300,基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据。
诊断规则指标数量过多会影响诊断效率,指标之间的相关性则会影响诊断的准确率,所以在判别分析和诊断之前,通过相关系数和差值比值的计算筛选指标,具体计算过程后续详细说明,只保留相关性较弱的指标;基于诊断规则分类和指标筛选结果,对新输入的待诊断故障数据进行判别分析,给出初始故障类型,并输出该故障初始类型中的诊断规则做后续的详细故障诊断。
S400,基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
获取到目标诊断规则可以提高争端效率,防止诊断的冗余以及繁杂,并且由于诊断规则对应一个故障类型,因此确定目标诊断规则后,可直接匹配到相应的目标故障类型中。
在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、诊断规则分类和故障类型判别分析,快速给出故障的初始类型,并筛选出与该故障类型关联度高的规则以便后续的详细诊断。首先根据诊断规则与故障类型的对应关系将诊断规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该故障类型中的诊断规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间。
在本申请一个可选的实施例中,上述S100中的“获取各个诊断规则与故障类型的对应关系”,可以包括以下步骤:
(1)获取所述诊断规则所对应的故障类型,以及初始故障类型集。
将诊断规则按照故障类型分类,共有b个故障类型,初始故障类型集分类为b类,由于故障类型与诊断规则为多对多关系,此时的分类会出现一条诊断规则归属于多个故障类型的情况,也就是说故障类型中诊断规则总数大于真实的诊断规则数量,影响后续判别分析,所以接下来做唯一性处理,下一步进行说明。
(2)当所述诊断规则对应至少两个故障类型时,获取复合故障类型集。
若某条诊断规则属于q个故障类型,则将这q个故障类型作为一个复合故障类,该条诊断规则从原q个故障类型中删除,添加到复合故障类中,依次类推,遍历所有诊断规则,设生成g个复合故障类,合成一个复合故障类型集。
(3)基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集。
将复合故障类型集与初始故障类型集加和,获取第一故障类型集,此时所有诊断规则被分为b+g类。经过处理后,每条诊断规则属于唯一故障类型。为避免故障类型中诊断规则的数目较少,影响诊断效率,因此对上述分类后的结果做简化处理。
(4)判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
设每个故障类型中的诊断规则数目为n,若故障类型中诊断规则的数目占全部诊
断规则的比值小于5%(5%是本实施例设定的固定值),则删除该故障类型,设获取到的最终
的目标故障类型数目为m,分类结果为,记目标故障类型中的诊断规则数
目为,即 所以最终的全部诊断规则总数为。
本发明基于服务器运维和故障诊断中记录的真实数据,目标数据集来源真实可靠;现有故障类型一般为单故障类型,故障类型与诊断规则之间存在多对多的关系,通过唯一性处理,添加组合故障类型作为补充类,实现类型与规则一对多关系,再作类型简化处理避免类型中规则数目过少;诊断规则指标数量过多会影响诊断效率,指标之间的相关性则会影响诊断的准确率,所以在判别分析和诊断之前,通过相关系数和差值比值的计算筛选指标,只保留相关性较弱的指标;基于规则分类和指标筛选结果,对新输入的故障数据进行判别分析,给出初始故障类型,并输出该类中的规则做后续的详细故障诊断。
本发明提供的故障诊断的方法,每条诊断规则对应一个或者多个故障类型,每个故障类型中有一条或多条诊断规则,故障类型与诊断规则为多对多关系,因此需要对故障类型进行简化,提高诊断效率。
在本申请一个可选的实施例中,上述S100中的“获取各个所述诊断规则中的目标指标”,可以包括以下步骤:
(1)获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
(2)当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
在本实施例中,共有a条规则,每条规则k个指标,诊断规则数据集为:
指标数量过多会拖慢诊断速度,指标之间的相关性会导致诊断结果的冗余,影响诊断的准确率,所以在判别分析和诊断之前,通过相关系数和差值比值的计算筛选指标,剔除与其他指标相关性强的指标,减少指标个数,降低指标之间的相似度。
对k个指标数据两两之间计算相关系数,得到相关系数矩阵如下:
计算该向量中每个值与最小值的差值占极差(最大值和最小值的差值)的比,若比值大于80%,则认为该指标与第i个指标相似度高,应该去除该指标,其保留值记为0,反之,若比值小于80%,则该指标保留值记为1。
本发明提供的故障诊断的方法,指标之间的相关性则会影响诊断的准确率,因此需要对指标进行筛选,只保留相关性较弱的指标。
在本申请一个可选的实施例中,上述S300中“基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据”,可以包括以下步骤:
(1)对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
上述计算该向量中每个值与最小值的差值占极差(最大值和最小值的差值)的比,并且根据结果进行了标记,由此得到指标i的保留向量:
以此类推,可得到所有指标的保留向量,向量中取值均为0或1。
计算每个指标被保留的次数,即每个指标在保留向量中取值为1的个数,得到保留数量向量,取向量d的四分之一分位数,若di大于四分之一分位数,则认为该指标与其他指标的相关性较弱,保留次数较多,可以保留。设通过计算共保留t个指标,则诊断规则数据集简化为:
本发明提供的故障诊断的方法,目标指标数量过多会拖慢诊断速度,指标之间的相关性会导致诊断结果的冗余,影响诊断的准确率,所以在判别分析和诊断之前,通过判断结果筛选指标,剔除与其他指标相关性强的指标,减少指标个数,降低指标之间的相似度。
在本申请一个可选的实施例中,上述S400中“基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型”,可以包括以下步骤:
(1)计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
同理,可得待诊断故障数据与全部诊断规则库中所有诊断规则的欧氏距离。
根据S100的分类结果,先验概率记为每个故障类型中诊断规则数目占全部诊断规则数目的比值:
本发明提供的故障诊断的方法,基于所述距离和所述比值进行计算,可根据计算结果确定所述待诊断故障数据对应的目标故障类型,减少了计算的复杂度,提高了诊断速率,为服务器运维节省人力和时间。
在本申请一个可选的实施例中,上述“当所述诊断规则对应至少两个故障类型时,获取复合故障类型集”,可以包括以下步骤:
(1)若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
本发明提供的故障诊断的方法,将所述诊断规则从初始对应的所述故障类型中删除可以简化对诊断规则的筛选,避免对诊断规则从初始对应的故障类型重复进行计算,节省了时间,提高了效率。
在本申请一个可选的实施例中,上述“当所述诊断规则对应至少两个故障类型时,获取复合故障类型集”,可以包括以下步骤:
(1)判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
为避免故障类型中诊断规则的数目较少,影响诊断效率,因此对上述分类后的结果做简化处理。设每个故障类型中的诊断规则数目为n,若故障类型中诊断规则的数目占全部诊断规则的比值小于5%(5%是本实施例设定的固定值),则删除该故障类型,该故障类型中的诊断规则分配到故障等级最高的故障类型中。
如上述一个故障类型对应唯一故障等级,生成的g个复合故障类对应的故障等级为复合故障类中每个故障类型对应的故障等级,所以一个复合故障类对应多个故障等级,然后判定出故障等级最高的故障类型。如:A、B、C三个单故障类组成复合故障类D,A对应故障等级一级,B对应故障等级二级,C对应故障等级三级,则D类对应故障等级一、二、三级,数字越小等级越高,所以D类中故障等级最高的故障类型就是A类,若D中包含的诊断规则数占全部诊断规则的比值小于5%,则去除D类,将D类中的诊断规则归于故障等级最高的A类中。
本发明提供的故障诊断的方法,对故障类型进行筛选简化,并且将删除的故障类型中原有的诊断规则发送到所述诊断规则中故障等级最高的故障类型中可以提高诊断的效率。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
如图2所述,本实施例提供了一种故障诊断的装置,包括分类模块1、获取模块2、指标筛选模块3和判别分析模块4,其中:
分类模块1,用于获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型;
获取模块2,用于获取待诊断故障数据,所述待诊断故障数据包括多个指标;
指标筛选模块3,用于基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
判别分析模块4,用于基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
本发明实施例提供的故障诊断的装置,在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、诊断规则分类和故障类型判别分析,快速给出故障的初始类型,并筛选出与该故障类型关联度高的规则以便后续的详细诊断。首先根据诊断规则与故障类型的对应关系将诊断规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该故障类型中的规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间。
在本申请一个实施例中,上述分类模块,包括:
初始故障类型集获取模块,用于获取所述诊断规则所对应的故障类型,以及初始故障类型集;
复合故障类型集获取模块,用于当所述诊断规则对应至少两个故障类型时,获取复合故障类型集;
第一故障类型集获取模块,用于基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集;
目标故障类型获取模块,用于判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
在本申请一个实施例中,上述分类模块,包括:
系数判别模块,用于获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
目标指标获取模块,用于当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
在本申请一个实施例中,上述指标筛选模块,包括:
标记模块,用于对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
在本申请一个实施例中,上述判别分析模块,具体用于:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
在本申请一个实施例中,上述复合故障类型集获取模块,包括:
删除模块,用于若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
在本申请一个实施例中,上述复合故障类型集获取模块,包括:
分配模块,用于判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
关于故障诊断的装置的具体限定以及有益效果可以参见上文中对于方法的限定,在此不再赘述。上述故障诊断的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明实施例还提供一种电子设备,具有上述图2所示的故障诊断的装置。
如图3所示,图3是本发明可选实施例提供的一种电子设备的结构示意图,如图3所示,该电子设备可以包括:至少一个处理器71,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口73,存储器74,至少一个通信总线72。其中,通信总线72用于实现这些组件之间的连接通信。其中,通信接口73可以包括显示屏(Display)、键盘(Keyboard),可选通信接口73还可以包括标准的有线接口、无线接口。存储器74可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器74可选的还可以是至少一个位于远离前述处理器71的存储装置。其中处理器71可以结合图2所描述的装置,存储器74中存储应用程序,且处理器71调用存储器74中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线72可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线72可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器74可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器74还可以包括上述种类的存储器的组合。
其中,处理器71可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器71还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic, 缩写:GAL)或其任意组合。
可选地,存储器74还用于存储程序指令。处理器71可以调用程序指令,实现如本申请图1实施例中所示的故障诊断的方法。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的故障诊断的方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (8)
1.一种故障诊断的方法,其特征在于,包括:
获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,每个所述诊断规则对应一个所述故障类型;
获取待诊断故障数据,所述待诊断故障数据包括多个指标;
基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型;
所述获取各个所述诊断规则中的目标指标,包括:
获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标;
所述基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型,包括:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
2.根据权利要求1所述的方法,其特征在于,所述获取各个诊断规则与故障类型的对应关系,包括:
获取所述诊断规则所对应的故障类型,以及初始故障类型集;
当所述诊断规则对应至少两个故障类型时,获取复合故障类型集;
基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集;
判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
3.根据权利要求1所述的方法,其特征在于,所述基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据,包括:
对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
4.根据权利要求2所述的故障诊断的方法,其特征在于,所述当所述诊断规则对应至少两个故障类型时,获取复合故障类型集步骤中,包括:
若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
5.根据权利要求2所述的故障诊断的方法,其特征在于,所述当所述诊断规则对应至少两个故障类型时,获取复合故障类型集步骤中,包括:
判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
6.一种故障诊断的装置,其特征在于,包括:
分类模块,用于获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,每个所述诊断规则对应一个所述故障类型;
获取模块,用于获取待诊断故障数据,所述待诊断故障数据包括多个指标;
指标筛选模块,用于基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
判别分析模块,用于基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型;
所述获取各个所述诊断规则中的目标指标,包括:
获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标;
所述基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型,包括:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
7.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-5中任一项所述的故障诊断的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-5中任一项所述的故障诊断的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111168573.1A CN113608916B (zh) | 2021-10-08 | 2021-10-08 | 故障诊断的方法、装置、电子设备及存储介质 |
PCT/CN2022/074416 WO2023056723A1 (zh) | 2021-10-08 | 2022-01-27 | 故障诊断的方法、装置、电子设备及存储介质 |
US18/564,536 US20240256377A1 (en) | 2021-10-08 | 2023-04-13 | Fault diagnosis method and apparatus, electronic device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111168573.1A CN113608916B (zh) | 2021-10-08 | 2021-10-08 | 故障诊断的方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113608916A CN113608916A (zh) | 2021-11-05 |
CN113608916B true CN113608916B (zh) | 2022-01-04 |
Family
ID=78310753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111168573.1A Active CN113608916B (zh) | 2021-10-08 | 2021-10-08 | 故障诊断的方法、装置、电子设备及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240256377A1 (zh) |
CN (1) | CN113608916B (zh) |
WO (1) | WO2023056723A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113608916B (zh) * | 2021-10-08 | 2022-01-04 | 苏州浪潮智能科技有限公司 | 故障诊断的方法、装置、电子设备及存储介质 |
CN114116428A (zh) * | 2021-12-01 | 2022-03-01 | 中国建设银行股份有限公司 | 调度系统的故障诊断方法及设备 |
CN117093405B (zh) * | 2023-10-18 | 2024-02-09 | 苏州元脑智能科技有限公司 | 一种服务器故障诊断方法、装置、设备和介质 |
CN117130819B (zh) * | 2023-10-27 | 2024-01-30 | 江西师范大学 | 一种基于时延方差和相关系数值的微服务故障诊断方法 |
CN117194094B (zh) * | 2023-11-07 | 2024-07-23 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质及计算机设备 |
CN118468162B (zh) * | 2024-07-09 | 2024-09-10 | 三峡金沙江川云水电开发有限公司 | 一种水电站机组状态监控方法、装置、设备及介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021771A (zh) * | 2016-05-30 | 2016-10-12 | 天河国云(北京)科技有限公司 | 一种故障诊断方法及装置 |
CN109905261A (zh) * | 2017-12-08 | 2019-06-18 | 华为技术有限公司 | 故障诊断方法及装置 |
CN108009040B (zh) * | 2017-12-12 | 2021-05-04 | 杭州时趣信息技术有限公司 | 一种确定故障根因的方法、系统和计算机可读存储介质 |
US10810076B1 (en) * | 2018-08-28 | 2020-10-20 | Palantir Technologies Inc. | Fault clustering for remedial action analysis |
CN110888763A (zh) * | 2018-09-11 | 2020-03-17 | 北京奇虎科技有限公司 | 磁盘故障诊断方法、装置、终端设备及计算机存储介质 |
CN112887119B (zh) * | 2019-11-30 | 2022-09-16 | 华为技术有限公司 | 故障根因确定方法及装置、计算机存储介质 |
CN111274084A (zh) * | 2020-01-14 | 2020-06-12 | 中国平安人寿保险股份有限公司 | 故障诊断方法、装置、设备及计算机可读存储介质 |
CN113608916B (zh) * | 2021-10-08 | 2022-01-04 | 苏州浪潮智能科技有限公司 | 故障诊断的方法、装置、电子设备及存储介质 |
-
2021
- 2021-10-08 CN CN202111168573.1A patent/CN113608916B/zh active Active
-
2022
- 2022-01-27 WO PCT/CN2022/074416 patent/WO2023056723A1/zh active Application Filing
-
2023
- 2023-04-13 US US18/564,536 patent/US20240256377A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2023056723A1 (zh) | 2023-04-13 |
US20240256377A1 (en) | 2024-08-01 |
CN113608916A (zh) | 2021-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113608916B (zh) | 故障诊断的方法、装置、电子设备及存储介质 | |
WO2019214309A1 (zh) | 模型测试的方法及装置 | |
WO2018112783A1 (zh) | 图像识别方法及装置 | |
WO2019051941A1 (zh) | 车型识别方法、装置、设备及计算机可读存储介质 | |
CN108022146A (zh) | 征信数据的特征项处理方法、装置、计算机设备 | |
CN111476191B (zh) | 基于智慧交通的人工智能图像处理方法及大数据云服务器 | |
CN114387451A (zh) | 异常图像检测模型的训练方法、装置及介质 | |
CN112434717B (zh) | 一种模型训练方法及装置 | |
CN116311462A (zh) | 一种结合上下文信息和vgg19的人脸图像修复识别方法 | |
CN108182444A (zh) | 基于场景分类的视频质量诊断的方法及装置 | |
CN116821777B (zh) | 一种新型基础测绘数据整合方法及系统 | |
CN111738290B (zh) | 图像检测方法、模型构建和训练方法、装置、设备和介质 | |
CN112966687A (zh) | 图像分割模型训练方法、装置及通信设备 | |
CN115495498B (zh) | 数据关联方法、系统、电子设备及存储介质 | |
CN116757870A (zh) | 一种能源物联网的智慧能源监控数据处理方法及系统 | |
CN115908303A (zh) | 一种电缆缺陷诊断模型的构建方法和系统 | |
CN111506038B (zh) | 一种麦芽监控巡检数据处理方法及系统 | |
CN112710590A (zh) | 尿液检测方法、尿液检测设备及计算机可读存储介质 | |
CN113837863B (zh) | 一种业务预测模型创建方法、装置及计算机可读存储介质 | |
CN117496419A (zh) | 基于智慧建筑的数据处理方法及系统 | |
CN114092739B (zh) | 图像处理方法、装置、设备、存储介质和程序产品 | |
CN113407450B (zh) | 基于参数自动识别的接口测试方法、装置、设备及介质 | |
WO2024208102A1 (zh) | 基于深度学习的换向器内侧图像缺陷目标检测方法 | |
CN117669364A (zh) | 车道保持辅助系统测试场景的提取方法、服务器及介质 | |
CN115080081A (zh) | 一种自动更新的自动驾驶功能验证场景库构建方法、系统、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |