CN113515102A - 一种异常归因方法和装置 - Google Patents

一种异常归因方法和装置 Download PDF

Info

Publication number
CN113515102A
CN113515102A CN202010278997.2A CN202010278997A CN113515102A CN 113515102 A CN113515102 A CN 113515102A CN 202010278997 A CN202010278997 A CN 202010278997A CN 113515102 A CN113515102 A CN 113515102A
Authority
CN
China
Prior art keywords
attribution
backtracking
windows
clustering
exceptions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010278997.2A
Other languages
English (en)
Inventor
陈健璋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Qianshi Technology Co Ltd
Original Assignee
Beijing Jingdong Qianshi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Qianshi Technology Co Ltd filed Critical Beijing Jingdong Qianshi Technology Co Ltd
Priority to CN202010278997.2A priority Critical patent/CN113515102A/zh
Publication of CN113515102A publication Critical patent/CN113515102A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种异常归因方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口;对所有所述归因回溯窗口聚类,并计算所述聚类的模块度;在所述模块度大于模块度阈值的情况下,对所述聚类得到的每个簇分别构建状态转移图,以根据所述状态转移图中的异常状态转移关系确定所述簇内的源生异常。该实施方式能够准确定位设备的真实损坏模块,避免对设备异常出现误诊,无需逐一检查出现的异常或更换所有异常模块,减少对生产时间的影响,降低设备维护成本。

Description

一种异常归因方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种AA的方法和装置。
背景技术
在装备自动化设备的无人仓内,生产运营受设备的稳定性影响。其中,AGV(Automated Guided Vehicle,自动导引运输车)是无人仓内搬运任务的主要承担对象。设备异常会影响设备的稳定性,从而影响仓库生产运营。AGV设备异常通常包含异常的产生模块和异常形式,其中模块包含导航、运控、电机、编码器和电池等。为保障无人仓库正常运营,运维人员需要对设备监控,并对上报的异常进行反馈。
现有方式是在设备产生异常后,相关人员赶赴现场或远程对异常进行诊断,然后决定是否停用设备甚至停产,之后制定应急处理措施,并按照处理措施进行措施验证,最后在设备异常处理完成后恢复生产,并在必要时对设备进行一段时间的预防措施跟踪。这种方式对于设备异常缺少对异常产生原因的剖析,会对AGV设备出现误诊,原因如下:当多辆AGV设备在短时间内同时上报异常时,无法对于异常产生源的追溯,运维人员通常进场检查所有出现异常车辆,影响生产时间;当一辆AGV设备在短时间内连续上报异常时,运维人员应对多模块同时上报的异常缺少便捷的归因处理方法,导致鲁莽地对所有上报异常模块都进行更换,对于真实损坏模块定位不利,且大幅增加了维护成本。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
对所有异常进行无差别处理,不利于定位真实损坏模块,导致对设备异常出现误诊,且需逐一检查出现的异常甚至更换所有异常模块,影响生产时间,设备维护成本高。
发明内容
有鉴于此,本发明实施例提供一种异常归因方法和装置,能够准确定位设备的真实损坏模块,避免对设备异常出现误诊,无需逐一检查出现的异常或更换所有异常模块,减少对生产时间的影响,降低设备维护成本。
为实现上述目的,根据本发明实施例的一个方面,提供了一种异常归因方法。
一种异常归因方法,包括:根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口;对所有所述归因回溯窗口聚类,并计算所述聚类的模块度;在所述模块度大于模块度阈值的情况下,对所述聚类得到的每个簇分别构建状态转移图,以根据所述状态转移图中的异常状态转移关系确定所述簇内的源生异常。
可选地,所述根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口,包括:对所述各异常按照发生时间顺序排成序列,对于所述序列中的任意两个相邻异常,如果二者的发生时间间隔和发生地距离分别小于时间间隔阈值和空间距离阈值,则将所述两个相邻异常划分到同一所述归因回溯窗口,否则划分到不同的所述归因回溯窗口。
可选地,所述对所有所述归因回溯窗口聚类,包括:对于每两个归因回溯窗口,计算所述两个归因回溯窗口的异常之间的欧式距离的最小值,作为所述两个归因回溯窗口的欧式距离;基于各所述两个归因回溯窗口的欧式距离,按照聚类算法将所述归因回溯窗口聚类为簇,其中每个簇包括至少一个所述归因回溯窗口中的异常。
可选地,根据所述两个归因回溯窗口的异常的发生时间间隔、发生地距离,计算所述两个归因回溯窗口的异常之间的欧式距离。
可选地,在所述模块度小于或等于所述模块度阈值的情况下,增大所述归因回溯窗口,然后返回到所述根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口的步骤。
根据本发明实施例的另一方面,提供了一种异常归因装置。
一种异常归因装置,包括:异常划分模块,用于根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口;异常聚类模块,用于对所有所述归因回溯窗口聚类;模块度计算模块,用于计算所述聚类的模块度;异常归因模块,用于在所述模块度大于模块度阈值的情况下,对所述聚类得到的每个簇分别构建状态转移图,以根据所述状态转移图中的异常状态转移关系确定所述簇内的源生异常。
可选地,所述异常划分模块还用于:对所述各异常按照发生时间顺序排成序列,对于所述序列中的任意两个相邻异常,如果二者的发生时间间隔和发生地距离分别小于时间间隔阈值和空间距离阈值,则将所述两个相邻异常划分到同一所述归因回溯窗口,否则划分到不同的所述归因回溯窗口。
可选地,所述异常聚类模块还用于:对于每两个归因回溯窗口,计算所述两个归因回溯窗口的异常之间的欧式距离的最小值,作为所述两个归因回溯窗口的欧式距离;基于各所述两个归因回溯窗口的欧式距离,按照聚类算法将所述归因回溯窗口聚类为簇,其中每个簇包括至少一个所述归因回溯窗口中的异常。
可选地,所述异常聚类模块还用于:根据所述两个归因回溯窗口的异常的发生时间间隔、发生地距离,计算所述两个归因回溯窗口的异常之间的欧式距离。
可选地,还包括调整模块,用于在所述模块度小于或等于所述模块度阈值的情况下,增大所述归因回溯窗口,然后返回到所述异常划分模块以根据所述异常之间的发生时间间隔、发生地距离,将所述各异常划分到一个或多个归因回溯窗口。
根据本发明实施例的又一方面,提供了一种电子设备。
一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明实施例所提供的异常归因方法。
根据本发明实施例的又一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例所提供的异常归因方法。
上述发明中的一个实施例具有如下优点或有益效果:根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口;对所有归因回溯窗口聚类,并计算聚类的模块度;在模块度大于模块度阈值的情况下,对聚类得到的每个簇分别构建状态转移图,以根据状态转移图中的异常状态转移关系确定簇内的源生异常。能够准确定位设备的真实损坏模块,避免对设备异常出现误诊,无需逐一检查出现的异常或更换所有异常模块,减少对生产时间的影响,降低设备维护成本。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明一个实施例的异常归因方法的主要步骤示意图;
图2是根据本发明一个实施例的异常归因流程示意图;
图3是根据本发明一个实施例的一个马尔科夫链状态转移图的示意图;
图4是根据本发明一个实施例的异常归因装置的主要模块示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明一个实施例的异常归因方法的主要步骤示意图。
如图1所示,本发明一个实施例的异常归因方法主要包括如下的步骤S101至步骤S103。
步骤S101:根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口。
步骤S102:对所有归因回溯窗口聚类,并计算聚类的模块度。
步骤S103:在模块度大于模块度阈值的情况下,对聚类得到的每个簇分别构建状态转移图,以根据状态转移图中的异常状态转移关系确定簇内的源生异常。
其中,异常之间的发生时间间隔是两次异常发生时间的时间间隔。异常之间的发生地距离是两次异常发生地的空间距离。该两次异常可以是同一设备的异常,也可以是不同设备的异常。
在一个实施例中,设备可以是可行驶设备,例如AGV。
各异常可以是所有设备(例如所有AGV)的异常的集合。
归因回溯窗口可以通过时间间隔阈值和空间距离阈值来框定。
源生异常是指导致其他异常的异常,例如设备多个模块发生异常,其中这些异常都是有某一个模块异常而导致的,那么导致这些异常的模块即源生异常模块,该源生异常模块的该异常即为源生异常。再如,多个设备发生异常,其中,这些异常都是有某个设备的某个异常导致的,那么导致这些异常的那个异常,即为源生异常。
在一个实施例中,根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口,具体可以包括:对各异常按照发生时间顺序排成序列,对于序列中的任意两个相邻异常,如果二者的发生时间间隔和发生地距离分别小于时间间隔阈值和空间距离阈值,则将该两个相邻异常划分到同一归因回溯窗口,否则划分到不同的归因回溯窗口。
其中,序列中各异常可以按照发生时间顺序的升序排列。
在一个实施例中个,对所有归因回溯窗口聚类,具体可以包括:对于每两个归因回溯窗口,计算该两个归因回溯窗口的异常之间的欧式距离的最小值,作为该两个归因回溯窗口的欧式距离;基于各两个归因回溯窗口的欧式距离,按照聚类算法将归因回溯窗口聚类为簇,其中每个簇包括至少一个归因回溯窗口中的异常。
其中,可以根据两个归因回溯窗口的异常的发生时间间隔、发生地距离,计算该两个归因回溯窗口的异常之间的欧式距离。
例如,可以将归因回溯窗口的异常的发生时间间隔、发生地距离分别作为表示该异常的点的横、纵坐标值,从而利用欧式距离计算公式可以计算出两个归因回溯窗口的异常之间的欧式距离。
在一个实施例中,在模块度小于或等于模块度阈值的情况下,增大归因回溯窗口,然后返回到步骤S101,即根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口的步骤。
其中,增大归因回溯窗口具体即增大时间间隔阈值和空间距离阈值,具体增大量可以根据经验设定。模块度阈值也可以根据需要自定义。
下面以无人仓中AGV设备异常归因分析为例,详细介绍本发明实施例的异常归因方法。
本发明实施例提出一种AGV设备异常归因分析方法。归因分析通常指一个状态的激活对应某次动作,本发明实施例旨在锁定导致异常发生的问题模块。首先,通过时间间隔阈值和空间距离阈值定义归因回溯窗口,或称异常归因回溯窗口,应用由下至上的凝聚聚类算法,将各归因回溯窗口聚类,得到一个或多个簇,每个簇包括至少一个归因回溯窗口,从而每个簇包括至少一个归因回溯窗口中的异常,然后以簇为单位进行马尔科夫链状态转移分析,以锁定源生异常模块。
如图2所述,本发明一个实施例的异常归因流程如下:
步骤S201:获取异常明细数据。
异常明细数据包括仓库内所有AGV的异常数据,异常数据包括异常的发生时间、发生地位置等信息。
步骤S202:将异常明细数据按照异常的发生时间顺序升序排列为一个序列。
步骤S203:根据异常之间的发生时间间隔、发生地距离,将序列中的各异常划分到一个或多个归因回溯窗口。
归因回溯窗口由时间间隔阈值和空间距离阈值所框定。时间间隔阈值与空间距离阈值根据仓库的条件,例如场地面积、AGV车数、任务密集程度等而定,例如,一个仓库默认可以取时间间隔阈值为300秒、空间距离阈值为3米。
例如序列为a1,a2,a3……,an,ai(1≤i≤n)表示序列中的第i个异常。那么,假设a1与a2二者的发生时间间隔小于时间间隔阈值,且二者的发生地距离小于空间距离阈值,那么将a1与a2划分到同一个归因回溯窗口。如果a2与a3不满足发生时间间隔小于时间间隔阈值且发生地距离小于空间距离阈值,则将a3划分到另一个归因回溯窗口。后续各异常的划分同理。
以上述a1与a2为例,二者的发生时间间隔即a2的发生时间与a1的发生时间的差值,二者的发生地距离即二者的发生地位置的空间距离(具体为直线距离)。
步骤S204:应用由下至上的凝聚聚类算法,对所有归因回溯窗口聚类,得到N个簇。
N大于或等于1。每个簇包括至少一个归因回溯窗口,从而实现将一个或多个归因回溯窗口中的异常聚类为N个簇。
其中,根据两个归因回溯窗口的异常的发生时间间隔、发生地距离,计算该两个归因回溯窗口的异常之间的欧式距离,并进一步得到这些异常之间的欧式距离最小值,以该欧式距离最小值作为该两个归因回溯窗口的欧式距离;基于每两个归因回溯窗口的欧式距离,通过基于欧式距离的由下至上的凝聚聚类算法进行聚类。
本发明实施例也可以采用其他聚类方法来实现。
步骤S205:计算聚类的模块度。
具体地,以所有异常构建图型网络,模块度采用图型网络的社区划分,其公式为:
Figure BDA0002445848230000081
其中,Q为模块度,模块度越大则表明社区划分效果越好。通常而言,当Q值达到0.7时,聚类效果可以接受。假设有x个节点,每个节点代表一个输入,即一次异常,上述通过凝聚聚类算法将包括所有异常的社区分为了N个簇,节点彼此之间共用m个连接。v和w是x中的任意两个节点,当两个节点直接连接时Avw=1,否则Avw=0。kv和kw分别代表节点v和节点w的度,根据图论,从一个节点出发有几个边这个节点的度即为多少,边表示异常之间的连带关系。δ(Cv,Cw)是用来判断节点v和w是否在同一个簇内,若在一个簇内,则
δ(Cv,Cw)=1,否则δ(Cv,Cw)=0。
步骤S206:判断模块度是否大于模块度阈值,若是,则执行步骤S207,否则调整归因回溯窗口大小,然后返回步骤S203。
具体地,如果模块度小于或等于模块度阈值,则需要调整归因回溯窗口使之更大,调整的数值尺度可以按经验设置。
步骤S207:对每个簇构建马尔科夫链状态转移图。
马尔可夫链是指数学中具有马尔可夫性质的离散事件随机过程。根据概率分布可以从一个状态变到另一个状态,也可以保持当前状态,状态的改变叫做转移。本发明假设某一异常状态的发生只取决于其前一次异常。
步骤S208:根据马尔科夫链状态转移图中的异常状态转移关系,对异常进行归因。
某仓库的一个马尔科夫链状态转移图如图3所示。由图3可得,异常35号为源生异常,并且会导致异常7号,且异常7号的产生多为其他异常引起。因此,在做归因分析时,应排除异常7号所在模块发生异常的原因。同样的,异常3号可以被诊断为源生异常进行排查,而异常55号可以被诊断为连带异常排除(连带异常是指由其他异常引发的异常)。结合实际场景分析,假设AGV左轮模块发生的异常有可能会触发整个车辆失去平衡,从而导致右轮某些模块异常,如左轮失速会导致右轮电机无动作。那么,对于这两起异常上报,维修人员只需要重点检查车辆的左轮模块。
本发明实施例对于在一簇内存在多辆AGV的情况,簇内的状态溯源归因分析可以帮助运维人员锁定异常车辆,对于一辆AGV短时间多次上报异常的情况,运维人员可以逆向搜索异常的状态转移方向,锁定车辆问题模块,或通过异常状态集中情况对模块异常进行归因。从而实现准确定位发生问题的AGV设备模块,节省检查维修的时间和成本。
图4是根据本发明一个实施例的异常归因装置的主要模块示意图。
如图4所示,本发明一个实施例的异常归因装置400主要包括:异常划分模块401、异常聚类模块402、模块度计算模块403、异常归因模块404。
异常划分模块401,用于根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口。
异常聚类模块402,用于对所有归因回溯窗口聚类。
模块度计算模块403,用于计算聚类的模块度。
异常归因模块404,用于在模块度大于模块度阈值的情况下,对聚类得到的每个簇分别构建状态转移图,以根据状态转移图中的异常状态转移关系确定簇内的源生异常。
在一个实施例中,异常划分模块401具体用于:对各异常按照发生时间顺序排成序列,对于序列中的任意两个相邻异常,如果二者的发生时间间隔和发生地距离分别小于时间间隔阈值和空间距离阈值,则将两个相邻异常划分到同一归因回溯窗口,否则划分到不同的归因回溯窗口。
在一个实施例中,异常聚类模块402具体用于:对于每两个归因回溯窗口,计算两个归因回溯窗口的异常之间的欧式距离的最小值,作为两个归因回溯窗口的欧式距离;基于各两个归因回溯窗口的欧式距离,按照聚类算法将归因回溯窗口聚类为簇,其中每个簇包括至少一个归因回溯窗口中的异常。
异常聚类模块402还可以用于:根据两个归因回溯窗口的异常的发生时间间隔、发生地距离,计算两个归因回溯窗口的异常之间的欧式距离。
异常归因装置400还可以包括调整模块,用于在模块度小于或等于模块度阈值的情况下,增大归因回溯窗口,然后返回到异常划分模块401以执行根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口的操作。
另外,在本发明实施例中所述异常归因装置的具体实施内容,在上面所述异常归因方法中已经详细说明了,故在此重复内容不再说明。
图5示出了可以应用本发明实施例的异常归因方法或异常归因装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的异常归因方法一般由服务器505执行,相应地,异常归因装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统600的结构示意图。图6示出的终端设备或服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括异常划分模块、异常聚类模块、模块度计算模块、异常归因模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,异常划分模块还可以被描述为“用于根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口;对所有所述归因回溯窗口聚类,并计算所述聚类的模块度;在所述模块度大于模块度阈值的情况下,对所述聚类得到的每个簇分别构建状态转移图,以根据所述状态转移图中的异常状态转移关系确定所述簇内的源生异常。
根据本发明实施例的技术方案,根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口;对所有归因回溯窗口聚类,并计算聚类的模块度;在模块度大于模块度阈值的情况下,对聚类得到的每个簇分别构建状态转移图,以根据状态转移图中的异常状态转移关系确定簇内的源生异常。能够准确定位设备的真实损坏模块,避免对设备异常出现误诊,无需逐一检查出现的异常或更换所有异常模块,减少对生产时间的影响,降低设备维护成本。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种异常归因方法,其特征在于,包括:
根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口;
对所有所述归因回溯窗口聚类,并计算所述聚类的模块度;
在所述模块度大于模块度阈值的情况下,对所述聚类得到的每个簇分别构建状态转移图,以根据所述状态转移图中的异常状态转移关系确定所述簇内的源生异常。
2.根据权利要求1所述的方法,其特征在于,所述根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口,包括:
对所述各异常按照发生时间顺序排成序列,对于所述序列中的任意两个相邻异常,如果二者的发生时间间隔和发生地距离分别小于时间间隔阈值和空间距离阈值,则将所述两个相邻异常划分到同一所述归因回溯窗口,否则划分到不同的所述归因回溯窗口。
3.根据权利要求1所述的方法,其特征在于,所述对所有所述归因回溯窗口聚类,包括:
对于每两个归因回溯窗口,计算所述两个归因回溯窗口的异常之间的欧式距离的最小值,作为所述两个归因回溯窗口的欧式距离;
基于各所述两个归因回溯窗口的欧式距离,按照聚类算法将所述归因回溯窗口聚类为簇,其中每个簇包括至少一个所述归因回溯窗口中的异常。
4.根据权利要求1所述的方法,其特征在于,根据所述两个归因回溯窗口的异常的发生时间间隔、发生地距离,计算所述两个归因回溯窗口的异常之间的欧式距离。
5.根据权利要求1所述的方法,其特征在于,在所述模块度小于或等于所述模块度阈值的情况下,增大所述归因回溯窗口,然后返回到所述根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口的步骤。
6.一种异常归因装置,其特征在于,包括:
异常划分模块,用于根据异常之间的发生时间间隔、发生地距离,将各异常划分到一个或多个归因回溯窗口;
异常聚类模块,用于对所有所述归因回溯窗口聚类;
模块度计算模块,用于计算所述聚类的模块度;
异常归因模块,用于在所述模块度大于模块度阈值的情况下,对所述聚类得到的每个簇分别构建状态转移图,以根据所述状态转移图中的异常状态转移关系确定所述簇内的源生异常。
7.根据权利要求6所述的装置,其特征在于,所述异常划分模块还用于:
对所述各异常按照发生时间顺序排成序列,对于所述序列中的任意两个相邻异常,如果二者的发生时间间隔和发生地距离分别小于时间间隔阈值和空间距离阈值,则将所述两个相邻异常划分到同一所述归因回溯窗口,否则划分到不同的所述归因回溯窗口。
8.根据权利要求6所述的装置,其特征在于,所述异常聚类模块还用于:
对于每两个归因回溯窗口,计算所述两个归因回溯窗口的异常之间的欧式距离的最小值,作为所述两个归因回溯窗口的欧式距离;
基于各所述两个归因回溯窗口的欧式距离,按照聚类算法将所述归因回溯窗口聚类为簇,其中每个簇包括至少一个所述归因回溯窗口中的异常。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN202010278997.2A 2020-04-10 2020-04-10 一种异常归因方法和装置 Pending CN113515102A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010278997.2A CN113515102A (zh) 2020-04-10 2020-04-10 一种异常归因方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010278997.2A CN113515102A (zh) 2020-04-10 2020-04-10 一种异常归因方法和装置

Publications (1)

Publication Number Publication Date
CN113515102A true CN113515102A (zh) 2021-10-19

Family

ID=78060476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010278997.2A Pending CN113515102A (zh) 2020-04-10 2020-04-10 一种异常归因方法和装置

Country Status (1)

Country Link
CN (1) CN113515102A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024857A (zh) * 2013-01-08 2013-04-03 西安电子科技大学 应用于无线传感器网络的分簇控制方法
CN107776606A (zh) * 2016-08-31 2018-03-09 中车株洲电力机车研究所有限公司 一种轴温监测系统故障检测方法
US20180091378A1 (en) * 2015-01-27 2018-03-29 Moogsoft Inc. Modularity and similarity graphics system with monitoring policy
CN108847994A (zh) * 2018-07-25 2018-11-20 山东中创软件商用中间件股份有限公司 基于数据分析的告警定位方法、装置、设备以及存储介质
CN109597702A (zh) * 2018-12-03 2019-04-09 深圳前海微众银行股份有限公司 消息总线异常的根因分析方法、装置、设备及存储介质
CN109684181A (zh) * 2018-11-20 2019-04-26 华为技术有限公司 告警根因分析方法、装置、设备及存储介质
CN110110870A (zh) * 2019-06-05 2019-08-09 厦门邑通软件科技有限公司 一种基于事件图谱技术的设备故障智能监控方法
CN110351150A (zh) * 2019-07-26 2019-10-18 中国工商银行股份有限公司 故障根源确定方法及装置、电子设备和可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024857A (zh) * 2013-01-08 2013-04-03 西安电子科技大学 应用于无线传感器网络的分簇控制方法
US20180091378A1 (en) * 2015-01-27 2018-03-29 Moogsoft Inc. Modularity and similarity graphics system with monitoring policy
CN107776606A (zh) * 2016-08-31 2018-03-09 中车株洲电力机车研究所有限公司 一种轴温监测系统故障检测方法
CN108847994A (zh) * 2018-07-25 2018-11-20 山东中创软件商用中间件股份有限公司 基于数据分析的告警定位方法、装置、设备以及存储介质
CN109684181A (zh) * 2018-11-20 2019-04-26 华为技术有限公司 告警根因分析方法、装置、设备及存储介质
CN109597702A (zh) * 2018-12-03 2019-04-09 深圳前海微众银行股份有限公司 消息总线异常的根因分析方法、装置、设备及存储介质
CN110110870A (zh) * 2019-06-05 2019-08-09 厦门邑通软件科技有限公司 一种基于事件图谱技术的设备故障智能监控方法
CN110351150A (zh) * 2019-07-26 2019-10-18 中国工商银行股份有限公司 故障根源确定方法及装置、电子设备和可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周勇: "《复杂多源数据的知识获取与知识发现》", 31 October 2015, 中国矿业大学出版社 *

Similar Documents

Publication Publication Date Title
WO2020259421A1 (zh) 一种业务系统的监控方法及装置
CN112436968B (zh) 一种网络流量的监测方法、装置、设备及存储介质
CN110851342A (zh) 故障预测方法、装置、计算设备以及计算机可读存储介质
CN113935497A (zh) 智能运维故障处理方法、装置、设备及其存储介质
CN113837596B (zh) 一种故障确定方法、装置、电子设备及存储介质
US11645540B2 (en) Deep graph de-noise by differentiable ranking
CN117041029A (zh) 网络设备故障处理方法、装置、电子设备及存储介质
CN114780338A (zh) 主机信息处理方法、装置、电子设备和计算机可读介质
CN117688342B (zh) 一种基于模型的设备状态预测方法、电子设备及存储介质
US11410049B2 (en) Cognitive methods and systems for responding to computing system incidents
KR20230051994A (ko) 엣지 클라우드 기반의 정보처리 종합물류 관제시스템
CN112862222A (zh) 空调回风温度的预测方法、异常监控方法和相关装置
CN112306722A (zh) 识别故障的方法、装置、设备和计算机可读介质
CN117132315A (zh) 活跃用户预测方法、装置、设备及存储介质
CN116756616A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN113515102A (zh) 一种异常归因方法和装置
CN113329128B (zh) 话务数据预测方法及装置、电子设备、存储介质
CN114443437A (zh) 告警根因输出方法、装置、设备、介质和程序产品
CN113537519B (zh) 一种识别异常设备的方法和装置
CN113946493A (zh) 一种监控阈值确定及监控报警方法、装置、设备和介质
CN113986671A (zh) 运维数据异常检测方法、装置、设备及介质
CN114710397B (zh) 服务链路的故障根因定位方法、装置、电子设备及介质
CN114089712B (zh) 一种数据处理方法和装置
CN115292339B (zh) 数据库更新方法、装置、电子设备和存储介质
CN115840016B (zh) 色谱分析系统的备份还原方法、装置、设备和计算机介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination