CN113608916A - 故障诊断的方法、装置、电子设备及存储介质 - Google Patents

故障诊断的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113608916A
CN113608916A CN202111168573.1A CN202111168573A CN113608916A CN 113608916 A CN113608916 A CN 113608916A CN 202111168573 A CN202111168573 A CN 202111168573A CN 113608916 A CN113608916 A CN 113608916A
Authority
CN
China
Prior art keywords
fault
diagnosis
target
data
fault type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111168573.1A
Other languages
English (en)
Other versions
CN113608916B (zh
Inventor
王崇娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111168573.1A priority Critical patent/CN113608916B/zh
Publication of CN113608916A publication Critical patent/CN113608916A/zh
Application granted granted Critical
Publication of CN113608916B publication Critical patent/CN113608916B/zh
Priority to PCT/CN2022/074416 priority patent/WO2023056723A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明揭示了一种故障诊断的方法、装置、电子设备及存储介质,方法包括获取各个诊断规则与故障类型的对应关系,以及获取各个诊断规则中的目标指标,各个诊断规则对应一个所述故障类型;获取待诊断故障数据,待诊断故障数据包括多个指标;基于各个诊断规则中的目标指标对待诊断故障数据中的指标进行过滤,得到与各个诊断规则对应的目标故障数据;基于各个目标故障数据中的指标数据与各个诊断规则中的目标指标数据的关系,确定目标诊断规则,确定待诊断故障数据对应的目标故障类型。根据故障类型对规则分类、计算相关系数和差值筛选规则指标,对新输入的故障数据快速给出故障类型,并输出所属类别中的规则做后续详细的故障诊断,从而提高诊断效率。

Description

故障诊断的方法、装置、电子设备及存储介质
技术领域
本发明涉及故障诊断技术领域,具体涉及一种故障诊断的方法、装置、电子设备及存储介质。
背景技术
在信息技术的发展应用中,生成了大量数据,数据的广泛性和复杂性为分析过程增加了难度,因而寻求更加快速且准确的分析方法是重中之重,服务器的运维和故障诊断便是该场景的体现。在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、规则分类和故障判别分析,快速给出故障的初始类型,并筛选出与该故障关联度高的规则以便后续的详细诊断。首先根据规则与故障的对应关系将规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该类中的规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间,所以该方法具有广泛的应用场景。
发明内容
有鉴于此,本发明实施例提供了一种故障诊断的方法、装置、电子设备及存储介质,旨在解决在现有的服务器故障诊断过程中,产生了大量的诊断规则,由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多的问题。
根据第一方面,本发明实施例提供了一种故障诊断的方法,包括如下步骤:
获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型;
获取待诊断故障数据,所述待诊断故障数据包括多个指标;
基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
本发明提供的故障诊断的方法,在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、诊断规则分类和故障类型判别分析,快速给出故障的初始类型,并筛选出与该故障类型关联度高的规则以便后续的详细诊断。首先根据诊断规则与故障类型的对应关系将诊断规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该故障类型中的规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间。
结合第一方面,在第一方面第一实施方式中,获取各个诊断规则与故障类型的对应关系,包括:
获取所述诊断规则所对应的故障类型,以及初始故障类型集;
当所述诊断规则对应至少两个故障类型时,获取复合故障类型集;
基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集;
判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
本发明提供的故障诊断的方法,每条诊断规则对应一个或者多个故障类型,每个故障类型中有一条或多条诊断规则,故障类型与诊断规则为多对多关系,因此需要对故障类型进行简化,提高诊断效率。
结合第一方面,在第一方面第二实施例中,获取各个所述诊断规则中的目标指标,包括:
获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
本发明提供的故障诊断的方法,指标之间的相关性则会影响诊断的准确率,因此需要对指标进行筛选,只保留相关性较弱的指标。
结合第一方面,在第一方面第三实施例中,基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据,包括:
对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
本发明提供的故障诊断的方法,目标指标数量过多会拖慢诊断速度,指标之间的相关性会导致诊断结果的冗余,影响诊断的准确率,所以在判别分析和诊断之前,通过判断结果筛选指标,剔除与其他指标相关性强的指标,减少指标个数,降低指标之间的相似度。
结合第一方面,在第一方面第四实施例中,基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型,包括:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
本发明提供的故障诊断的方法,基于所述距离和所述比值进行计算,可根据计算结果确定所述待诊断故障数据对应的目标故障类型,减少了计算的复杂度,提高了诊断速率,为服务器运维节省人力和时间。
结合第一方面第一实施方式,在第一方面第五实施例中,当所述诊断规则对应至少两个故障类型时,获取复合故障类型集步骤中,包括:
若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
本发明提供的故障诊断的方法,将所述诊断规则从初始对应的所述故障类型中删除可以简化对诊断规则的筛选,避免对诊断规则从初始对应的故障类型重复进行计算,节省了时间,提高了效率。
结合第一方面第一实施方式,在第一方面第六实施例中,当所述诊断规则对应至少两个故障类型时,获取复合故障类型集步骤中,包括:
判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
本发明提供的故障诊断的方法,对故障类型进行筛选简化,并且将删除的故障类型中原有的诊断规则发送到所述诊断规则中故障等级最高的故障类型中可以提高诊断的效率。
根据第二方面,本发明实施例还提供了一种故障诊断的装置,包括:
分类模块,用于获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型;
获取模块,用于获取待诊断故障数据,所述待诊断故障数据包括多个指标;
指标筛选模块,用于基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
判别分析模块,用于基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
本发明实施例提供的故障诊断的装置,在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、诊断规则分类和故障类型判别分析,快速给出故障的初始类型,并筛选出与该故障类型关联度高的规则以便后续的详细诊断。首先根据诊断规则与故障类型的对应关系将诊断规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该故障类型中的规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间。
结合第二方面,在第二方面第一实施方式中,上述分类模块,具体用于:
初始故障类型集获取模块,用于获取所述诊断规则所对应的故障类型,以及初始故障类型集;
复合故障类型集获取模块,用于当所述诊断规则对应至少两个故障类型时,获取复合故障类型集;
第一故障类型集获取模块,用于基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集;
目标故障类型获取模块,用于判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
结合第二方面,在第二方面第二实施例中,上述分类模块,具体用于:
系数判别模块,用于获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
目标指标获取模块,用于当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
结合第二方面,在第二方面第三实施例中,上述指标筛选模块,具体用于:
标记模块,用于对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
结合第二方面,在第二方面第四实施例中,上述判别分析模块,具体用于:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
结合第二方面第一实施方式,在第二方面第五实施例中,上述复合故障类型集获取模块,具体用于:
删除模块,用于若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
结合第二方面第一实施方式,在第二方面第六实施例中,上述复合故障类型集获取模块,具体用于:
分配模块,用于判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
根据第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的故障诊断的方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的故障诊断的方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1 是应用本发明实施例提供的故障诊断的方法的流程示意图;
图2 是应用本发明实施例提供的故障诊断的装置的功能模块图;
图3 是应用本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例提供的故障诊断的方法,其执行主体可以是故障诊断的装置,该故障诊断的装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是电子设备为例来进行说明。
在本申请一个实施例中,如图1所示,提供了一种故障诊断的方法,以该方法应用与电子设备为例进行说明,包括以下步骤:
S100,获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型。
本发明以服务器运维和故障诊断中积累的诊断规则为目标数据集,根据故障类型对规则分类、计算相关系数和差值筛选规则指标,具体运算方式后续进行详细说明,然后对新输入的故障数据判别分析所属故障类别,快速给出故障类型,并输出所属故障类别中的诊断规则做后续详细的故障诊断,从而提高诊断效率。
在本实施例中,形成一个数据集,其中,现有服务器运维和故障诊断中积累的诊断规则E,共有a条;有b个故障类型;故障等级c个。每条诊断规则对应一个或者多个故障类型,每个故障类型中有一条或多条诊断规则,故障类型与诊断规则为多对多关系;一个故障类型对应唯一故障等级,一个故障等级中可包含多个故障类型,故障类型与故障严重等级为多对一关系,因此需要对诊断规则和故障类型进行简化处理,使得各个所述诊断规则对应一个所述故障类型,使得新输入的故障数据可以根据诊断规则快速匹配到相应的故障类型,提高了诊断效率。
S200,获取待诊断故障数据,所述待诊断故障数据包括多个指标。
获取到待诊断故障数据中的多个指标,然后将其与诊断规则中的目标指标进行判别分析进行筛选分析,进而可将待诊断故障数据匹配到相应的诊断规则,从而可确定待诊断故障数据对应的故障类型。
S300,基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据。
诊断规则指标数量过多会影响诊断效率,指标之间的相关性则会影响诊断的准确率,所以在判别分析和诊断之前,通过相关系数和差值比值的计算筛选指标,具体计算过程后续详细说明,只保留相关性较弱的指标;基于诊断规则分类和指标筛选结果,对新输入的待诊断故障数据进行判别分析,给出初始故障类型,并输出该故障初始类型中的诊断规则做后续的详细故障诊断。
S400,基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
获取到目标诊断规则可以提高争端效率,防止诊断的冗余以及繁杂,并且由于诊断规则对应一个故障类型,因此确定目标诊断规则后,可直接匹配到相应的目标故障类型中。
在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、诊断规则分类和故障类型判别分析,快速给出故障的初始类型,并筛选出与该故障类型关联度高的规则以便后续的详细诊断。首先根据诊断规则与故障类型的对应关系将诊断规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该故障类型中的诊断规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间。
在本申请一个可选的实施例中,上述S100中的“获取各个诊断规则与故障类型的对应关系”,可以包括以下步骤:
(1)获取所述诊断规则所对应的故障类型,以及初始故障类型集。
将诊断规则按照故障类型分类,共有b个故障类型,初始故障类型集分类为b类
Figure 257597DEST_PATH_IMAGE002
,由于故障类型与诊断规则为多对多关系,此时的分类会出现一条诊断规则归属于多个故障类型的情况,也就是说故障类型中诊断规则总数大于真实的诊断规则数量,影响后续判别分析,所以接下来做唯一性处理,下一步进行说明。
(2)当所述诊断规则对应至少两个故障类型时,获取复合故障类型集。
若某条诊断规则属于q个故障类型,则将这q个故障类型作为一个复合故障类,该条诊断规则从原q个故障类型中删除,添加到复合故障类中,依次类推,遍历所有诊断规则,设生成g个复合故障类,合成一个复合故障类型集。
(3)基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集。
将复合故障类型集与初始故障类型集加和,获取第一故障类型集,此时所有诊断规则被分为b+g类
Figure 764802DEST_PATH_IMAGE004
。经过处理后,每条诊断规则属于唯一故障类型。为避免故障类型中诊断规则的数目较少,影响诊断效率,因此对上述分类后的结果做简化处理。
(4)判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
设每个故障类型中的诊断规则数目为n,若故障类型中诊断规则的数目占全部诊 断规则的比值小于5%(5%是本实施例设定的固定值),则删除该故障类型,设获取到的最终 的目标故障类型数目为m,分类结果为
Figure 321816DEST_PATH_IMAGE006
,记目标故障类型中的诊断规则数 目为
Figure 558763DEST_PATH_IMAGE008
,即
Figure 893929DEST_PATH_IMAGE010
Figure 403277DEST_PATH_IMAGE011
所以最终的全部诊断规则总数为
Figure 809987DEST_PATH_IMAGE012
本发明基于服务器运维和故障诊断中记录的真实数据,目标数据集来源真实可靠;现有故障类型一般为单故障类型,故障类型与诊断规则之间存在多对多的关系,通过唯一性处理,添加组合故障类型作为补充类,实现类型与规则一对多关系,再作类型简化处理避免类型中规则数目过少;诊断规则指标数量过多会影响诊断效率,指标之间的相关性则会影响诊断的准确率,所以在判别分析和诊断之前,通过相关系数和差值比值的计算筛选指标,只保留相关性较弱的指标;基于规则分类和指标筛选结果,对新输入的故障数据进行判别分析,给出初始故障类型,并输出该类中的规则做后续的详细故障诊断。
本发明提供的故障诊断的方法,每条诊断规则对应一个或者多个故障类型,每个故障类型中有一条或多条诊断规则,故障类型与诊断规则为多对多关系,因此需要对故障类型进行简化,提高诊断效率。
在本申请一个可选的实施例中,上述S100中的“获取各个所述诊断规则中的目标指标”,可以包括以下步骤:
(1)获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
(2)当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
在本实施例中,共有a条规则,每条规则k个指标,诊断规则数据集为:
Figure 307965DEST_PATH_IMAGE014
指标数量过多会拖慢诊断速度,指标之间的相关性会导致诊断结果的冗余,影响诊断的准确率,所以在判别分析和诊断之前,通过相关系数和差值比值的计算筛选指标,剔除与其他指标相关性强的指标,减少指标个数,降低指标之间的相似度。
对k个指标数据两两之间计算相关系数,得到相关系数矩阵如下:
Figure 610770DEST_PATH_IMAGE016
其中
Figure 577720DEST_PATH_IMAGE018
代表第i个指标和第j个指标的相关系数,
Figure 460226DEST_PATH_IMAGE020
,相关系数矩阵对角线
Figure 343868DEST_PATH_IMAGE022
代表自身相关系数,值为1。
取出第i个指标与其他指标的相关系数向量,并去掉自身相关系数
Figure 614312DEST_PATH_IMAGE024
Figure 52247DEST_PATH_IMAGE026
计算该向量中每个值与最小值的差值占极差(最大值和最小值的差值)的比,若比值大于80%,则认为该指标与第i个指标相似度高,应该去除该指标,其保留值记为0,反之,若比值小于80%,则该指标保留值记为1。
本发明提供的故障诊断的方法,指标之间的相关性则会影响诊断的准确率,因此需要对指标进行筛选,只保留相关性较弱的指标。
在本申请一个可选的实施例中,上述S300中“基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据”,可以包括以下步骤:
(1)对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
上述计算该向量中每个值与最小值的差值占极差(最大值和最小值的差值)的比,并且根据结果进行了标记,由此得到指标i的保留向量:
Figure 987711DEST_PATH_IMAGE028
以此类推,可得到所有指标的保留向量,向量中取值均为0或1。
计算每个指标被保留的次数,即每个指标在保留向量中取值为1的个数,得到保留数量向量
Figure 991439DEST_PATH_IMAGE030
,取向量d的四分之一分位数,若di大于四分之一分位数,则认为该指标与其他指标的相关性较弱,保留次数较多,可以保留。设通过计算共保留t个指标,则诊断规则数据集简化为:
Figure 104888DEST_PATH_IMAGE032
本发明提供的故障诊断的方法,目标指标数量过多会拖慢诊断速度,指标之间的相关性会导致诊断结果的冗余,影响诊断的准确率,所以在判别分析和诊断之前,通过判断结果筛选指标,剔除与其他指标相关性强的指标,减少指标个数,降低指标之间的相似度。
在本申请一个可选的实施例中,上述S400中“基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型”,可以包括以下步骤:
(1)计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
在本实施例中,待诊断故障数据中的指标数据与诊断规则中的指标数据的距离为欧式距离,对于新输入的故障数据只保留筛选后的指标
Figure 358015DEST_PATH_IMAGE034
,计算故障数据与第i条诊断规则数据的欧氏距离:
Figure 864214DEST_PATH_IMAGE036
同理,可得待诊断故障数据与全部诊断规则库中所有诊断规则的欧氏距离。
根据S100的分类结果,先验概率记为每个故障类型中诊断规则数目占全部诊断规则数目的比值:
Figure 925711DEST_PATH_IMAGE038
设定欧式距离阈值,筛选待诊断故障数据与诊断规则的欧氏距离中小于阈值的指标作为样本集,假设有
Figure 475641DEST_PATH_IMAGE040
个故障数据落入第j类,则记录样本集中落入c个诊断规则类别的数目向量
Figure 419326DEST_PATH_IMAGE042
;K近邻估计的密度函数记为:
Figure 447325DEST_PATH_IMAGE044
根据判别分析理论,若
Figure 206071DEST_PATH_IMAGE046
,则将待诊断故障数据归于第j个类别。
本发明提供的故障诊断的方法,基于所述距离和所述比值进行计算,可根据计算结果确定所述待诊断故障数据对应的目标故障类型,减少了计算的复杂度,提高了诊断速率,为服务器运维节省人力和时间。
在本申请一个可选的实施例中,上述“当所述诊断规则对应至少两个故障类型时,获取复合故障类型集”,可以包括以下步骤:
(1)若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
本发明提供的故障诊断的方法,将所述诊断规则从初始对应的所述故障类型中删除可以简化对诊断规则的筛选,避免对诊断规则从初始对应的故障类型重复进行计算,节省了时间,提高了效率。
在本申请一个可选的实施例中,上述“当所述诊断规则对应至少两个故障类型时,获取复合故障类型集”,可以包括以下步骤:
(1)判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
为避免故障类型中诊断规则的数目较少,影响诊断效率,因此对上述分类后的结果做简化处理。设每个故障类型中的诊断规则数目为n,若故障类型中诊断规则的数目占全部诊断规则的比值小于5%(5%是本实施例设定的固定值),则删除该故障类型,该故障类型中的诊断规则分配到故障等级最高的故障类型中。
如上述一个故障类型对应唯一故障等级,生成的g个复合故障类对应的故障等级为复合故障类中每个故障类型对应的故障等级,所以一个复合故障类对应多个故障等级,然后判定出故障等级最高的故障类型。如:A、B、C三个单故障类组成复合故障类D,A对应故障等级一级,B对应故障等级二级,C对应故障等级三级,则D类对应故障等级一、二、三级,数字越小等级越高,所以D类中故障等级最高的故障类型就是A类,若D中包含的诊断规则数占全部诊断规则的比值小于5%,则去除D类,将D类中的诊断规则归于故障等级最高的A类中。
本发明提供的故障诊断的方法,对故障类型进行筛选简化,并且将删除的故障类型中原有的诊断规则发送到所述诊断规则中故障等级最高的故障类型中可以提高诊断的效率。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
如图2所述,本实施例提供了一种故障诊断的装置,包括分类模块1、获取模块2、指标筛选模块3和判别分析模块4,其中:
分类模块1,用于获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型;
获取模块2,用于获取待诊断故障数据,所述待诊断故障数据包括多个指标;
指标筛选模块3,用于基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
判别分析模块4,用于基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
本发明实施例提供的故障诊断的装置,在现有的服务器故障诊断过程中,产生了大量的诊断规则,为服务器故障诊断提供了基础数据,维护了服务器的安全稳定运行,但是由于诊断规则数量过大,往往导致故障诊断过程较长,耗费人力、物力、时间较多。基于该种情况,本发明提出一种故障诊断的方法,旨在通过对现有规则的指标筛选、诊断规则分类和故障类型判别分析,快速给出故障的初始类型,并筛选出与该故障类型关联度高的规则以便后续的详细诊断。首先根据诊断规则与故障类型的对应关系将诊断规则分类;相关程度高的指标较多不仅会导致诊断结果冗余,还会影响结果的准确性,所以计算各项指标相关系数和差值,处理后只保留相互影响程度低的指标;最后对新输入的故障数据进行判别分析,给出初始故障类型,并输出该故障类型中的规则做后续的详细故障诊断。此方法可以在保证故障诊断准确性的基础上,很大程度提高诊断的效率,为服务器运维节省人力和时间。
在本申请一个实施例中,上述分类模块,包括:
初始故障类型集获取模块,用于获取所述诊断规则所对应的故障类型,以及初始故障类型集;
复合故障类型集获取模块,用于当所述诊断规则对应至少两个故障类型时,获取复合故障类型集;
第一故障类型集获取模块,用于基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集;
目标故障类型获取模块,用于判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
在本申请一个实施例中,上述分类模块,包括:
系数判别模块,用于获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
目标指标获取模块,用于当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
在本申请一个实施例中,上述指标筛选模块,包括:
标记模块,用于对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
在本申请一个实施例中,上述判别分析模块,具体用于:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
在本申请一个实施例中,上述复合故障类型集获取模块,包括:
删除模块,用于若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
在本申请一个实施例中,上述复合故障类型集获取模块,包括:
分配模块,用于判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
关于故障诊断的装置的具体限定以及有益效果可以参见上文中对于方法的限定,在此不再赘述。上述故障诊断的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明实施例还提供一种电子设备,具有上述图2所示的故障诊断的装置。
如图3所示,图3是本发明可选实施例提供的一种电子设备的结构示意图,如图3所示,该电子设备可以包括:至少一个处理器71,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口73,存储器74,至少一个通信总线72。其中,通信总线72用于实现这些组件之间的连接通信。其中,通信接口73可以包括显示屏(Display)、键盘(Keyboard),可选通信接口73还可以包括标准的有线接口、无线接口。存储器74可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器74可选的还可以是至少一个位于远离前述处理器71的存储装置。其中处理器71可以结合图2所描述的装置,存储器74中存储应用程序,且处理器71调用存储器74中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线72可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线72可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器74可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器74还可以包括上述种类的存储器的组合。
其中,处理器71可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器71还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic, 缩写:GAL)或其任意组合。
可选地,存储器74还用于存储程序指令。处理器71可以调用程序指令,实现如本申请图1实施例中所示的故障诊断的方法。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的故障诊断的方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种故障诊断的方法,其特征在于,包括:
获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型;
获取待诊断故障数据,所述待诊断故障数据包括多个指标;
基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
2.根据权利要求1所述的方法,其特征在于,所述获取各个诊断规则与故障类型的对应关系,包括:
获取所述诊断规则所对应的故障类型,以及初始故障类型集;
当所述诊断规则对应至少两个故障类型时,获取复合故障类型集;
基于所述复合故障类型集与所述初始故障类型集,获取第一故障类型集;
判断所述第一故障类型集中每个故障类型的诊断规则与全部诊断规则的占比,若占比小于第一预设阈值,则删除该故障类型,获取目标故障类型。
3.根据权利要求1所述的方法,其特征在于,所述获取各个所述诊断规则中的目标指标,包括:
获取各个所述诊断规则中的各个指标与其他指标之间的相关系数;
当所述相关系数大于预设相关阈值时,删除所述指标,以确定所述诊断规则中的目标指标。
4.根据权利要求1所述的方法,其特征在于,所述基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据,包括:
对所述目标指标建立矩阵,基于所述矩阵对每个所述指标与其他指标建立初始向量集,对所述初始向量集进行判断,基于判断结果对所述指标进行标记,基于标记结果对所述待诊断故障数据中的指标进行过滤。
5.根据权利要求1所述的方法,其特征在于,所述基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型,包括:
计算待诊断故障数据中的指标数据与诊断规则中的指标数据的距离,以及所述故障类型中的所述诊断规则与全部诊断规则的比值,基于所述距离和所述比值确定所述待诊断故障数据对应的目标故障类型。
6.根据权利要求2所述的故障诊断的方法,其特征在于,所述当所述诊断规则对应至少两个故障类型时,获取复合故障类型集步骤中,包括:
若所述诊断规则属于多个故障类型,生成复合故障类型集,并将所述诊断规则从初始对应的所述故障类型中删除。
7.根据权利要求2所述的故障诊断的方法,其特征在于,所述当所述诊断规则对应至少两个故障类型时,获取复合故障类型集步骤中,包括:
判断所述第一故障类型集中每个故障类型的诊断规则数目与全部诊断规则数目的占比,若占比小于第一预设阈值,则删除该故障类型,将所述故障类型中的诊断规则发送到所述诊断规则中故障等级最高的故障类型中。
8.一种故障诊断的装置,其特征在于,包括:
分类模块,用于获取各个诊断规则与故障类型的对应关系,以及获取各个所述诊断规则中的目标指标,其中,各个所述诊断规则对应一个所述故障类型;
获取模块,用于获取待诊断故障数据,所述待诊断故障数据包括多个指标;
指标筛选模块,用于基于各个所述诊断规则中的目标指标对所述待诊断故障数据中的指标进行过滤,得到与各个所述诊断规则对应的目标故障数据;
判别分析模块,用于基于各个所述目标故障数据中的指标数据与各个所述诊断规则中的目标指标数据的关系,确定目标诊断规则,以确定所述待诊断故障数据对应的目标故障类型。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-7中任一项所述的故障诊断的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-7中任一项所述的故障诊断的方法。
CN202111168573.1A 2021-10-08 2021-10-08 故障诊断的方法、装置、电子设备及存储介质 Active CN113608916B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111168573.1A CN113608916B (zh) 2021-10-08 2021-10-08 故障诊断的方法、装置、电子设备及存储介质
PCT/CN2022/074416 WO2023056723A1 (zh) 2021-10-08 2022-01-27 故障诊断的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111168573.1A CN113608916B (zh) 2021-10-08 2021-10-08 故障诊断的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113608916A true CN113608916A (zh) 2021-11-05
CN113608916B CN113608916B (zh) 2022-01-04

Family

ID=78310753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111168573.1A Active CN113608916B (zh) 2021-10-08 2021-10-08 故障诊断的方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN113608916B (zh)
WO (1) WO2023056723A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023056723A1 (zh) * 2021-10-08 2023-04-13 苏州浪潮智能科技有限公司 故障诊断的方法、装置、电子设备及存储介质
CN117130819A (zh) * 2023-10-27 2023-11-28 江西师范大学 一种基于时延方差和相关系数值的微服务故障诊断方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093405B (zh) * 2023-10-18 2024-02-09 苏州元脑智能科技有限公司 一种服务器故障诊断方法、装置、设备和介质
CN117194094A (zh) * 2023-11-07 2023-12-08 腾讯科技(深圳)有限公司 数据处理方法、装置、存储介质及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021771A (zh) * 2016-05-30 2016-10-12 天河国云(北京)科技有限公司 一种故障诊断方法及装置
CN108009040A (zh) * 2017-12-12 2018-05-08 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质
CN110888763A (zh) * 2018-09-11 2020-03-17 北京奇虎科技有限公司 磁盘故障诊断方法、装置、终端设备及计算机存储介质
CN111274084A (zh) * 2020-01-14 2020-06-12 中国平安人寿保险股份有限公司 故障诊断方法、装置、设备及计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109905261A (zh) * 2017-12-08 2019-06-18 华为技术有限公司 故障诊断方法及装置
CN112887119B (zh) * 2019-11-30 2022-09-16 华为技术有限公司 故障根因确定方法及装置、计算机存储介质
CN113608916B (zh) * 2021-10-08 2022-01-04 苏州浪潮智能科技有限公司 故障诊断的方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021771A (zh) * 2016-05-30 2016-10-12 天河国云(北京)科技有限公司 一种故障诊断方法及装置
CN108009040A (zh) * 2017-12-12 2018-05-08 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质
CN110888763A (zh) * 2018-09-11 2020-03-17 北京奇虎科技有限公司 磁盘故障诊断方法、装置、终端设备及计算机存储介质
CN111274084A (zh) * 2020-01-14 2020-06-12 中国平安人寿保险股份有限公司 故障诊断方法、装置、设备及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023056723A1 (zh) * 2021-10-08 2023-04-13 苏州浪潮智能科技有限公司 故障诊断的方法、装置、电子设备及存储介质
CN117130819A (zh) * 2023-10-27 2023-11-28 江西师范大学 一种基于时延方差和相关系数值的微服务故障诊断方法
CN117130819B (zh) * 2023-10-27 2024-01-30 江西师范大学 一种基于时延方差和相关系数值的微服务故障诊断方法

Also Published As

Publication number Publication date
WO2023056723A1 (zh) 2023-04-13
CN113608916B (zh) 2022-01-04

Similar Documents

Publication Publication Date Title
CN113608916B (zh) 故障诊断的方法、装置、电子设备及存储介质
WO2019214309A1 (zh) 模型测试的方法及装置
CN108022146A (zh) 征信数据的特征项处理方法、装置、计算机设备
CN111476191B (zh) 基于智慧交通的人工智能图像处理方法及大数据云服务器
CN108182444A (zh) 基于场景分类的视频质量诊断的方法及装置
CN114548280A (zh) 故障诊断模型的训练、故障诊断方法及电子设备
CN112966687B (zh) 图像分割模型训练方法、装置及通信设备
CN111738290B (zh) 图像检测方法、模型构建和训练方法、装置、设备和介质
CN115620083B (zh) 模型训练方法、人脸图像质量评价方法、设备及介质
CN116823793A (zh) 设备缺陷检测方法、装置、电子设备和可读存储介质
CN116304721A (zh) 基于数据类别的大数据治理中数据标准制定方法及系统
CN115908303A (zh) 一种电缆缺陷诊断模型的构建方法和系统
CN112434717B (zh) 一种模型训练方法及装置
CN114387451A (zh) 异常图像检测模型的训练方法、装置及介质
CN113656354A (zh) 日志分类方法、系统、计算机设备和可读存储介质
CN113269678A (zh) 接触网输电线路的故障点定位方法
CN111506038B (zh) 一种麦芽监控巡检数据处理方法及系统
CN113837863B (zh) 一种业务预测模型创建方法、装置及计算机可读存储介质
CN117496419A (zh) 基于智慧建筑的数据处理方法及系统
CN116821777B (zh) 一种新型基础测绘数据整合方法及系统
CN113407450B (zh) 基于参数自动识别的接口测试方法、装置、设备及介质
CN117669364A (zh) 车道保持辅助系统测试场景的提取方法、服务器及介质
CN115080081A (zh) 一种自动更新的自动驾驶功能验证场景库构建方法、系统、设备以及存储介质
CN114444761A (zh) 一种风险预测方法、装置及计算机设备
CN115272309A (zh) 缺陷检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant