CN115460098B - 基于时间间隔分布特征的网络管理系统故障模型建立方法 - Google Patents

基于时间间隔分布特征的网络管理系统故障模型建立方法 Download PDF

Info

Publication number
CN115460098B
CN115460098B CN202211125054.1A CN202211125054A CN115460098B CN 115460098 B CN115460098 B CN 115460098B CN 202211125054 A CN202211125054 A CN 202211125054A CN 115460098 B CN115460098 B CN 115460098B
Authority
CN
China
Prior art keywords
fault
sequence
time
time interval
association rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211125054.1A
Other languages
English (en)
Other versions
CN115460098A (zh
Inventor
李嘉颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Systems Engineering of PLA Academy of Military Sciences
Original Assignee
Institute of Systems Engineering of PLA Academy of Military Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Systems Engineering of PLA Academy of Military Sciences filed Critical Institute of Systems Engineering of PLA Academy of Military Sciences
Priority to CN202211125054.1A priority Critical patent/CN115460098B/zh
Publication of CN115460098A publication Critical patent/CN115460098A/zh
Application granted granted Critical
Publication of CN115460098B publication Critical patent/CN115460098B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明公开了一种基于时间间隔分布特征的网络管理系统故障模型建立方法,包括:从网络管理信息系统中读取故障信息,形成故障信息序列,生成初始化时间序列的关联规则候选集,并依据相邻原则构造关联事件序列,计算该关联事件的各项统计指标;在满足峰度指标门限、支持度指标阈值、置信度指标等情况下,生成时间序列关联规则,并依据该规则形成新的关联规则候选集成员,并进行下一轮时序关联规则挖掘,直至不能生成新的关联规则候选集成员为止。本发明用时间间隔分布特征代替时间窗口来构建网络管理系统的故障模型过程,能够更准确地描述事件之间的时序关联关系,同时能够有效避免传统方法因时间窗口设定过大而导致消耗太多计算时间的问题。

Description

基于时间间隔分布特征的网络管理系统故障模型建立方法
技术领域
本发明涉及通信网络信息管理领域,尤其涉及一种基于时间间隔分布特征的网络管理系统故障模型建立方法。
背景技术
在网络管理信息系统中,从系统部件的故障信息序列中搜寻故障关联模型,可以为故障的排查定位提供有效的帮助。在利用系统故障信息序列挖掘故障模型时,现有的技术通常采用滑动窗口技术的方法。对于采用滑动窗口技术生成故障模型分析数据集的方法,滑动窗口技术借鉴了计算机网络中的滑动窗口概念,用于分析故障模型的数据集。现有的网络管理系统的故障定位技术通常采用滑动窗口机制,设定一个固定大小的窗口值,将落入窗口的事件作为一组观测值,再令该窗口沿时间轴滑动,每次记录滑动后获得的观测值,得到可用于故障模型分析的数据集。这种基于滑动窗口技术和关联规则挖掘技术的方法存在的2个方面的问题。一方面,在使用过程中,人们很难确定滑动窗口长度。滑动窗窗口的大小与问题本身相关,没有统一的标准。如果滑动窗口设置的太小,则挖掘算法会丢失长度交大的时间序列规则;如果滑动窗口设置的太大,则挖掘算法会消耗更多的时间,所挖掘的时间序列规则也会出现冗余现象。在实际使用过程中,为了尽可能的发现更多的故障模型,往往会设定较大的滑动窗口,从而导致故障分析算法消耗过多的时间,降低了后期故障分析的效率。另一方面,存在前后事件有交叉的情况。滑动窗口的位置不能总是完整的将一个时间序列规则中的事件覆盖,当滑动窗口的位置将一个完整的时间序列分割在两个不同的子序列中时,挖掘算法就会得到前后事件有交叉的时间序列规则。
因此,在时间序列规则挖掘过程中,如果能够避免因滑动窗口技术而带来的问题,就能够有效的改善时间序列规则挖掘方法。如何控制窗口的大小,使得故障分析能够充分发现系统中存在的故障模型,同时又能降低故障分析所需的时间,是目前急需解决的问题。
发明内容
针对基于滑动窗口的网络管理系统故障模型发现中所存在的如何控制窗口的大小,使得故障分析能够充分发现系统中存在的故障模型,同时又能降低故障分析所需的时间的问题,本发明针对网络管理信息系统中的故障信息序列数据,公开了一种基于时间间隔分布特征的网络管理系统故障模型建立方法。该方法能够利用网络管理信息系统的故障序列数据,从中快速发现系统的故障模型。
本发明公开了一种基于时间间隔分布特征的网络管理系统故障模型建立方法,包括:
S1,从网络管理系统中按故障信息形成的时间次序,依次读取网络管理系统的故障信息,利用所读取的故障信息,形成故障信息序列;故障信息序列包括网络管理系统中所发生的所有故障事件及其发生时间;提取出故障信息序列中每相邻两个故障事件的时间间隔,利用所有的时间间隔构成时间间隔序列,计算得到时间间隔序列的时间间隔分布指标;
S2,利用时间间隔序列的时间间隔分布指标,构建时序关联规则;
步骤S2所述利用时间间隔序列的时间间隔分布指标,构建时序关联规则,包括:
S21,构建时序关联规则R的表达式,R的表达式为[A→B,t,p,w],该表达式的含义是,若发生故障事件A,则在以t时刻为中心,关联时间窗口宽度为w的时间范围内,发生故障事件B的概率为p;其中,t由时间间隔序列中时间间隔的均值确定。
S22,根据时间间隔序列的时间间隔分布指标,设置时序关联规则R中的时间间隔分布峰度指标门限K,K由时间间隔序列的时间间隔分布的峰度值确定,其计算方法为:
Figure BDA0003848235010000021
其中,
Figure BDA0003848235010000031
为时间间隔序列的所有时间间隔的均值,xi为时间间隔序列中的第i个时间间隔的取值,n为时间间隔序列所包含的时间间隔的数目;
S23,根据时间间隔序列的时间间隔分布指标,确定时序关联规则R的支持度指标阈值spport;对于时序关联规则R的支持度指标spport(R[A→B,t,p,w]),用满足该时序关联规则R的故障事件A与故障事件B构成的事件组合的发生概率来表示,其计算公式为:
Figure BDA0003848235010000032
其中,Count([A→B,t-w/2,t+w/2])是指时间间隔序列的所有时间间隔中,满足在时间间隔[t-w/2,t+w/2]范围内发生的所有相邻的故障事件A与故障事件B构成的故障事件组合的数量,max(count(E))是指故障信息序列中所有类型的故障事件的发生次数的最大值,E表示故障信息序列。
S24,根据时间间隔序列的时间间隔分布指标,确定时序关联规则R的置信度指标configdence;时序关联规则R的置信度指标configdence(R[A→B,t,p,w])是由在发生故障事件A的情况下,触发时序关联规则R的条件概率来决定,时序关联规则R的置信度指标configdence(R[A→B,t,p,w])的计算公式为:
Figure BDA0003848235010000033
其中,count(A)为故障信息序列中故障事件A发生的次数,Count([A→B,t-w/2,t+w/2])是指时间间隔序列的所有时间间隔中,满足在时间间隔[t-w/2,t+w/2]范围内发生的所有相邻的故障事件A与故障事件B构成的事件组合的数量。
S25,根据时间间隔序列的时间间隔分布指标,确定时序关联规则R的关联概率指标related;时序关联规则R的关联概率指标related用于确定时序关联规则R中的概率p的值,关联概率指标related由时序关联规则的置信度指标决定。
S3,对关联规则候选集Candidate进行初始化;在时间间隔序列中,筛选出同一类型的故障事件及其发生时间,利用所筛选出的同一类型的故障事件及其发生时间,形成该类型故障事件的子序列,并将该子序列加入到关联规则候选集Candidate中。关联规则候选集Candidate包括所有类型故障事件的子序列。
S4,利用关联规则候选集Candidate,建立网络管理系统故障模型。
所述步骤S4,包括:
S41,初始化网络管理系统故障模型;网络管理系统故障模型包括故障关联规则,网络管理系统故障模型用于根据网络管理系统中已知的故障信息序列对网络管理系统的后续可能出现的故障信息进行预测;
S42,从关联规则候选集Candidate中任取两个子序列,根据两个子序列中所有故障事件的发生时间,提取出两个子序列中所有的发生时间最邻近的两个故障事件,作为故障事件对,计算故障事件对中两个故障事件发生的时间间隔;利用所选取的两个子序列中的所有的故障事件对和时间间隔构建关联事件序列,利用关联事件序列中的所有时间间隔构造时间间隔分布序列。故障事件对中的两个故障事件记为故障事件e1和故障事件e2。
所述的两个子序列中的发生时间邻近的两个故障事件,是指第一子序列中第一故障事件的发生时间与第二子序列中第二故障事件的发生时间的间隔,比第一子序列中第一故障事件的发生时间与第一子序列中其他故障事件的发生时间的间隔小,同时也比第二子序列中第二故障事件的发生时间与第二子序列中其他故障事件的发生时间的间隔小。两个子序列是指第一子序列与第二子序列,两个故障事件是指第一故障事件与第二故障事件。
S43,根据步骤S22中所述的时序关联规则中的时间间隔分布峰度指标门限K的计算公式,计算时间间隔分布序列中的所有时间间隔的峰度指标门限k0;若k0小于时间间隔分布峰度指标门限K,则从关联规则候选集Candidate中重新选取两个子序列,返回步骤S42,否则,继续进入步骤S44。
S44,计算时间间隔分布序列中的所有时间间隔的均值t0。
S45,依据时序关联规则的关联概率指标related,计算时间间隔分布序列的关联时间窗口宽度w0;
所述计算时间间隔分布序列的关联时间窗口宽度w0,包括:
计算时间间隔分布序列中的所有时间间隔与均值t0之间的时间差值;利用得到的所有时间差值构建得到时间差值序列,每个时间差值为该时间差值序列中的元素,将时间差值序列中的所有元素按照其元素取值由小至大的顺序依次排列,得到有序时间差值序列;关联时间窗口宽度w0为有序时间差值序列中以related为分位数的时间间隔的两倍,其计算公式为:
Figure BDA0003848235010000051
其中,W表示有序时间差值序列,|W|为有序时间差值序列的长度,
Figure BDA0003848235010000052
表示对|W|×related的结果进行向上取整,
Figure BDA0003848235010000053
表示W中的第
Figure BDA0003848235010000054
个元素。
S46,利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s;利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c;
步骤S46中所述利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s,包括:
将故障事件e1和e2分别作为故障事件A和B,将均值t0作为t,将关联时间窗口宽度w0作为w,将时间间隔分布序列作为时间间隔序列,将关联事件序列作为故障信息序列,利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s。
步骤S46中所述利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c,包括:
将故障事件e1和e2分别作为故障事件A和B,将均值t0作为t,将关联时间窗口宽度w0作为w,将时间间隔分布序列作为时间间隔序列,将关联事件序列作为故障信息序列,利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c。
S47,若s>spport且c>configdence,则生成时序关联规则R0=[e1→e2,t0,related,w],将RO作为一条故障关联规则,将该故障关联规则加入到网络管理系统故障模型中,实现对网络管理系统故障模型的更新,进入步骤S48,否则,从关联规则候选集Candidate中选择其他两个子序列组合,返回步骤S42;若关联规则候选集Candidate中所有两个子序列的组合都已被选择,保存并输出最终的网络管理系统故障模型,完成对网络管理系统故障模型的构建。
S48,利用关联事件序列中的故障事件对的两个故障事件e1和e2,构建组合故障事件e12,e12=(e1,e2),利用故障事件对的两个故障事件e1和e2的发生时间的平均值作为组合故障事件的发生时间;将组合故障事件作为一类新的故障事件类型,利用组合故障事件和其对应的发生时间,构建该组合故障事件类型的子序列;将该组合故障事件类型的子序列加入到关联规则候选集Candidate中,完成对关联规则候选集Candidate的更新,返回步骤S42。
本发明的有益效果为:
本发明用时间间隔分布特征代替时间窗口来构建网络管理系统的故障模型过程,不需要预先设定固定大小的时间窗口,所生成的时间序列关联规则的时间窗口是变化的,能够更准确地描述事件之间的时序关联关系;同时,能够有效避免传统方法因时间窗口设定过大而导致模型构建过程消耗太多计算时间的问题。
附图说明
图1为本发明方法的步骤示意图;
图2为本发明方法的实现流程图。
具体实施方式
为了更好的了解本发明内容,这里给出一个实施例。
本发明公开了一种基于时间间隔分布特征的网络管理系统故障模型建立方法,图1为本发明方法的步骤示意图,其实现流程如图2所示,其包括:
S1,从网络管理系统中按故障信息形成的时间次序,依次读取网络管理系统的故障信息,形成故障信息序列;故障信息序列包括网络管理系统中所发生的所有故障事件及其发生时间;提取出故障信息序列中每相邻两个故障信息的时间间隔,利用所有的时间间隔构成时间间隔序列,计算得到时间间隔序列的时间间隔分布指标;所述的网络管理系统,用于对计算机网络或通信网络进行管理。
S2,利用时间间隔序列的时间间隔分布指标,构建时序关联规则;
步骤S2所述利用时间间隔序列的时间间隔分布指标,构建时序关联规则,包括:
S21,构建时序关联规则R,R的表达式为[A→B,t,p,w],该表达式的含义是,若发生故障事件A,则在以t时刻为中心,关联时间窗口宽度为w的时间范围(即从t-w/2时刻到t+w/2时刻之间)内,发生故障事件B的概率为p;其中,t由时间间隔序列中时间间隔的均值确定。
S22,根据时间间隔序列的时间间隔分布指标,设置时序关联规则中的时间间隔分布峰度指标门限K,K由时间间隔序列的时间间隔分布的峰度值确定,其计算方法为:
Figure BDA0003848235010000071
其中,
Figure BDA0003848235010000072
为时间间隔序列的所有时间间隔的均值,xi为时间间隔序列中的第i个时间间隔的取值,n为时间间隔序列所包含的时间间隔的数目。峰度指标门限K用于对时间间隔序列的统计特性进行正态分布判别;当K>0时,判定时间间隔序列的统计特性为尖锐正态分布,其分布曲线比标准正态分布曲线顶峰更为尖锐;当K<0时,判定时间间隔序列的统计特性为平缓正态分布,其分布曲线比标准正态分布更为平缓;当K=0时,判定时间间隔序列的统计特性为标准正态分布,其分布曲线与标准正态分布相似。时间间隔分布的峰值越高,则所导出的规则更有效。时序关联规则中的时间间隔分布峰度指标门限K用于对时间间隔序列的统计特性进行正态分布判别;当K>0时,判定时间间隔序列的统计特性为尖锐正态分布;当K<0时,判定时间间隔序列的统计特性为平缓正态分布;当K=0时,判定时间间隔序列的统计特性为标准正态分布。
S23,根据时间间隔序列的时间间隔分布指标,确定时序关联规则的支持度指标阈值spport(R[A→B,t,p,w]),时序关联规则R的支持度指标用满足该时序关联规则R的故障事件A与故障事件B构成的事件组合的发生概率来表示,其计算公式为:
Figure BDA0003848235010000081
其中,Count([A→B,t-w/2,t+w/2])是指时间间隔序列的所有时间间隔中,满足在时间间隔[t-w/2,t+w/2]范围内发生的所有相邻的故障事件A与故障事件B构成的事件组合的数量,max(count(E))是指故障信息序列中所有类型的故障事件的发生次数的最大值。
S24,根据时间间隔序列的时间间隔分布指标,确定时序关联规则的置信度指标;置信度指标是由在发生故障事件A的情况下,触发时序关联规则R的条件概率来决定,时序关联规则R的置信度指标configdence(R[A→B,t,p,w])的计算公式为:
Figure BDA0003848235010000082
其中,count(A)为故障事件A发生的次数,Count([A→B,t-w/2,t+w/2])是指时间间隔序列的所有时间间隔中,满足在时间间隔[t-w/2,t+w/2]范围内发生的所有相邻的故障事件A与故障事件B构成的事件组合的数量。
S25,根据时间间隔序列的时间间隔分布指标,确定时序关联规则的关联概率指标related,时序关联规则R的关联概率指标related用于确定时序关联规则R中的概率p的值,关联概率指标related由时序关联规则的置信度指标决定。在实际应用中,可将时序关联规则的置信度指标乘以某系数得到,或者由用户制定。该系数可以是0.5。当p的值比较小时,R的时间间隔窗口w就小,进而降低R的置信度指标;当p的值比较大时,R的时间间隔串口w就大,从而使得R的置信度指标值变高。
S3,在时间间隔序列中,筛选出同一类型的故障事件及其发生时间,形成该类型故障事件的子序列,并该子序列加入到关联规则候选集Candidate中。关联规则候选集Candidate包括所有类型故障事件的子序列。从原始的时间序列中,通过筛选同一种事件,形成子序列,加入到候选集Candidate中,如下所示。
Figure BDA0003848235010000091
S4,利用关联规则候选集Candidate,建立网络管理系统故障模型。
所述步骤S4,包括:
S41,初始化网络管理系统故障初始模型;网络管理系统故障模型包括故障关联规则,网络管理系统故障模型用于根据网络管理系统中已知的故障信息序列对网络管理系统的后续可能出现的故障信息进行预测;
S42,从关联规则候选集Candidate中任取两个子序列,根据两个子序列中所有故障事件的发生时间,提取出两个子序列中发生时间最邻近的故障事件,作为故障事件对,计算故障事件对中两个故障事件发生的时间间隔;利用所选取的两个子序列中的所有的故障事件对和时间间隔构建关联事件序列,利用关联事件序列中的所有时间间隔构造时间间隔分布序列。故障事件对中的两个故障事件记为e1和e2。
所述的两个子序列中的发生时间邻近的两个故障事件,是指第一子序列中第一故障事件的发生时间与第二子序列中第二故障事件的发生时间的间隔,比第一子序列中第一故障事件的发生时间与第一子序列中其他故障事件的发生时间的间隔小,同时也比第二子序列中第二故障事件的发生时间与第二子序列中其他故障事件的发生时间的间隔小。两个子序列是指第一子序列与第二子序列,两个故障事件是指第一故障事件与第二故障事件。
按照相邻原则,将两个序列中最邻近的事件组成一队,构成关联事件序列。以e1,e2为例,关联事件序列Rlte1,e2及其时间间隔分布序列
Figure BDA0003848235010000092
的构造过程如下所示。
Figure BDA0003848235010000101
S43,根据步骤S22中所述的时序关联规则中的时间间隔分布峰度指标门限K的计算公式,计算时间间隔分布序列中的所有时间间隔的峰度指标门限k0,若k0小于时间间隔分布峰度指标门限K,从关联规则候选集Candidate中重新选取两个子序列,返回步骤S42,否则,继续进入步骤S44。
S44,计算时间间隔分布序列中的所有时间间隔的均值t0。
具体的,时间间隔分布序列中的所有时间间隔的峰度指标门限k0的计算方法为:
Figure BDA0003848235010000102
其中,
Figure BDA0003848235010000103
为时间间隔分布序列的所有时间间隔的均值,xi为时间间隔分布序列中的第i个时间间隔的取值,n为时间间隔分布序列所包含的时间间隔的数目。
S45,依据时序关联规则的关联概率指标related,计算时间间隔分布序列的关联时间窗口宽度w0;时间间隔分布序列的关联时间窗口宽度w0的计算方法包括:
计算时间间隔分布序列中的所有时间间隔与均值t0之间的时间差值;利用得到的所有时间差值构建得到时间差值序列,每个时间差值为该时间差值序列中的元素,将时间差值序列中的所有元素按照其元素取值由小至大的顺序依次排列,得到有序时间差值序列,关联时间窗口宽度w0为有序时间差值序列中以related为分位数的时间间隔的两倍,其计算公式为:
Figure BDA0003848235010000104
其中,W表示有序时间差值序列,|W|为有序时间差值序列的长度,
Figure BDA0003848235010000111
表示对|W|×related的结果进行向上取整,
Figure BDA0003848235010000112
表示W中的第
Figure BDA0003848235010000113
个元素。
具体的,取
Figure BDA0003848235010000114
中的时间间隔Δti,计算该时间间隔与均值t之间的距离wi,即wi=|Δt-t0|;将wi按照从小到大的次序进行排列得到有序的时间间隔分布序列W,关联时间窗口宽度w为以related为分位数的时间间隔的两倍,即:
Figure BDA0003848235010000115
其中|W|为时间间隔分布序列的长度,|w|*related经上取整后,w/2在W序列中的位置。
S46,利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s;利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c;
步骤S46中所述的利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s,包括:
将故障事件e1和e2分别作为故障事件A和B,将均值t0作为t,将关联时间窗口宽度w0作为w,将时间间隔分布序列作为时间间隔序列,利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s。将时序关联规则的关联概率指标related作为p。
步骤S46中所述的利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c,包括:
将故障事件e1和e2分别作为故障事件A和B,将均值t0作为t,将关联时间窗口宽度w0作为w,将时间间隔分布序列作为时间间隔序列,利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c。
具体的,两个故障事件的置信度c计算公式为:
Figure BDA0003848235010000116
其中,count(A)为故障事件A发生的次数,Count([A→B,t-w/2,t+w/2])是指满足在时间间隔[t-w/2,t+w/2]范围内发生的所有相邻的故障事件A与故障事件B构成的事件组合的数量。
S47,若s>spport且c>configdence,则生成时序关联规则R0=[e1→e2,t0,related,w],将RO作为一条故障关联规则,将该故障关联规则加入到网络管理系统故障模型中,实现对网络管理系统故障模型的更新,进入步骤S48,否则,从Candidate中选择其他两个子序列组合,返回步骤S42;若关联规则候选集Candidate中所有两个子序列的组合都已被选择,保存并输出最终的网络管理系统故障模型,完成对网络管理系统故障模型的构建。
所述的步骤S47,还包括,若关联规则候选集Candidate中所有两个子序列的组合都已完成计算,利用关联规则候选集Candidate所对应的时间间隔分布序列中的所有时间间隔的峰度指标门限k0,对时间间隔分布序列的统计特性进行正态分布判别,将时间间隔分布序列的统计特性正态分布判别结果,加入到网络管理系统故障模型中,得到最终的网络管理系统故障模型。
S48,利用关联事件序列中的故障事件对的两个故障事件e1和e2,构建组合故障事件e12=(e1,e2),利用故障事件对的两个故障事件e1和e2的发生时间的平均值作为组合故障事件的发生时间;将组合故障事件作为一类新的故障事件类型,利用组合故障事件和其对应的发生时间,构建该组合故障事件类型的子序列,将该组合故障事件类型的子序列加入到关联规则候选集Candidate中,完成对关联规则候选集Candidate的更新,返回步骤S42。
步骤S48其具体包括,定义新的组合故障事件e’=(e1,e2),其候选时间序列为Ce’,其生产方法如下所示:
Figure BDA0003848235010000121
其中,合成的事件e’的发生时间,用组成e’的各个事件发生时间的中间值来表示。将Ce’加入到关联规则候选集中,再跳转至S41,从Candidate中选择两个新的子序列,重新计算新的时间关联规则。
本发明实施例用时间间隔分布特征代替时间窗口来构建网络管理系统的故障模型过程,不需要预先设定固定大小的时间窗口,所生成的时间序列关联规则的时间窗口是变化的,能够更准确地描述事件之间的时序关联关系;同时,能够有效避免传统方法因时间窗口设定过大而导致模型构建过程消耗太多计算时间的问题。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (6)

1.一种基于时间间隔分布特征的网络管理系统故障模型建立方法,其特征在于,包括:
S1,从网络管理系统中按故障信息形成的时间次序,依次读取网络管理系统的故障信息,利用所读取的故障信息,形成故障信息序列;故障信息序列包括网络管理系统中所发生的所有故障事件及其发生时间;提取出故障信息序列中每相邻两个故障事件的时间间隔,利用所有的时间间隔构成时间间隔序列,计算得到时间间隔序列的时间间隔分布指标;
S2,利用时间间隔序列的时间间隔分布指标,构建时序关联规则;
S3,对关联规则候选集Candidate进行初始化;在时间间隔序列中,筛选出同一类型的故障事件及其发生时间,利用所筛选出的同一类型的故障事件及其发生时间,形成该类型故障事件的子序列,并将该子序列加入到关联规则候选集Candidate中;关联规则候选集Candidate包括所有类型故障事件的子序列;
S4,利用关联规则候选集Candidate,建立网络管理系统故障模型;
步骤S2所述利用时间间隔序列的时间间隔分布指标,构建时序关联规则,包括:
S21,构建时序关联规则R的表达式,R的表达式为[A→B,t,p,w],该表达式的含义是,若发生故障事件A,则在以t时刻为中心,关联时间窗口宽度为w的时间范围内,发生故障事件B的概率为p;其中,t由时间间隔序列中时间间隔的均值确定;
S22,根据时间间隔序列的时间间隔分布指标,设置时序关联规则R中的时间间隔分布峰度指标门限K,K由时间间隔序列的时间间隔分布的峰度值确定,其计算方法为:
Figure FDA0004069247650000011
其中,
Figure FDA0004069247650000012
为时间间隔序列的所有时间间隔的均值,xi为时间间隔序列中的第i个时间间隔的取值,n为时间间隔序列所包含的时间间隔的数目;
S23,根据时间间隔序列的时间间隔分布指标,确定时序关联规则R的支持度指标阈值spport;对于时序关联规则R的支持度指标spport(R[A→B,t,p,w]),用满足该时序关联规则R的故障事件A与故障事件B构成的事件组合的发生概率来表示,其计算公式为:
Figure FDA0004069247650000021
其中,Count([A→B,t-w/2,t+w/2])是指时间间隔序列的所有时间间隔中,满足在时间间隔[t-w/2,t+w/2]范围内发生的所有相邻的故障事件A与故障事件B构成的故障事件组合的数量,max(count(E))是指故障信息序列中所有类型的故障事件的发生次数的最大值,E表示故障信息序列;
S24,根据时间间隔序列的时间间隔分布指标,确定时序关联规则R的置信度指标configdence;时序关联规则R的置信度指标configdence(R[A→B,t,p,w])是由在发生故障事件A的情况下,触发时序关联规则R的条件概率来决定,时序关联规则R的置信度指标configdence(R[A→B,t,p,w])的计算公式为:
Figure FDA0004069247650000022
其中,count(A)为故障信息序列中故障事件A发生的次数,Count([A→B,t-w/2,t+w/2])是指时间间隔序列的所有时间间隔中,满足在时间间隔[t-w/2,t+w/2]范围内发生的所有相邻的故障事件A与故障事件B构成的事件组合的数量;
S25,根据时间间隔序列的时间间隔分布指标,确定时序关联规则R的关联概率指标related;时序关联规则R的关联概率指标related用于确定时序关联规则R中的概率p的值,关联概率指标related由时序关联规则的置信度指标决定。
2.如权利要求1所述的基于时间间隔分布特征的网络管理系统故障模型建立方法,其特征在于,所述步骤S4,包括:
S41,初始化网络管理系统故障模型;网络管理系统故障模型包括故障关联规则,网络管理系统故障模型用于根据网络管理系统中已知的故障信息序列对网络管理系统的后续可能出现的故障信息进行预测;
S42,从关联规则候选集Candidate中任取两个子序列,根据两个子序列中所有故障事件的发生时间,提取出两个子序列中所有的发生时间最邻近的两个故障事件,作为故障事件对,计算故障事件对中两个故障事件发生的时间间隔;利用所选取的两个子序列中的所有的故障事件对和时间间隔构建关联事件序列,利用关联事件序列中的所有时间间隔构造时间间隔分布序列;故障事件对中的两个故障事件记为故障事件e1和故障事件e2;
S43,根据步骤S22中所述的时序关联规则中的时间间隔分布峰度指标门限K的计算公式,计算时间间隔分布序列中的所有时间间隔的峰度指标门限k0;若k0小于时间间隔分布峰度指标门限K,则从关联规则候选集Candidate中重新选取两个子序列,返回步骤S41,否则,继续进入步骤S44;
S44,计算时间间隔分布序列中的所有时间间隔的均值t0;
S45,依据时序关联规则的关联概率指标related,计算时间间隔分布序列的关联时间窗口宽度w0;
S46,利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s;利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c;
S47,若s>spport且c>configdence,则生成时序关联规则R0=[e1→e2,t0,related,w],将RO作为一条故障关联规则,将该故障关联规则加入到网络管理系统故障模型中,实现对网络管理系统故障模型的更新,进入步骤S48,否则,从关联规则候选集Candidate中选择其他两个子序列组合,返回步骤S42;若关联规则候选集Candidate中所有两个子序列的组合都已被选择,保存并输出最终的网络管理系统故障模型,完成对网络管理系统故障模型的构建;
S48,利用关联事件序列中的故障事件对的两个故障事件e1和e2,构建组合故障事件e12,e12=(e1,e2),利用故障事件对的两个故障事件e1和e2的发生时间的平均值作为组合故障事件的发生时间;将组合故障事件作为一类新的故障事件类型,利用组合故障事件和其对应的发生时间,构建该组合故障事件类型的子序列;将该组合故障事件类型的子序列加入到关联规则候选集Candidate中,完成对关联规则候选集Candidate的更新,返回步骤S42。
3.如权利要求2所述的基于时间间隔分布特征的网络管理系统故障模型建立方法,其特征在于,所述计算时间间隔分布序列的关联时间窗口宽度w0,包括:
计算时间间隔分布序列中的所有时间间隔与均值t0之间的时间差值;利用得到的所有时间差值构建得到时间差值序列,每个时间差值为该时间差值序列中的元素,将时间差值序列中的所有元素按照其元素取值由小至大的顺序依次排列,得到有序时间差值序列;关联时间窗口宽度w0为有序时间差值序列中以related为分位数的时间间隔的两倍,其计算公式为:
Figure FDA0004069247650000041
其中,W表示有序时间差值序列,|W|为有序时间差值序列的长度,
Figure FDA0004069247650000042
表示对|W|×related的结果进行向上取整,
Figure FDA0004069247650000043
表示W中的第
Figure FDA0004069247650000044
个元素。
4.如权利要求2所述的基于时间间隔分布特征的网络管理系统故障模型建立方法,其特征在于,步骤S46中所述利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s,包括:
将故障事件e1和e2分别作为故障事件A和B,将均值t0作为t,将关联时间窗口宽度w0作为w,将时间间隔分布序列作为时间间隔序列,将关联事件序列作为故障信息序列,利用步骤S23中的时序关联规则的支持度指标阈值计算公式,计算故障事件对中的两个故障事件的支持度s。
5.如权利要求2所述的基于时间间隔分布特征的网络管理系统故障模型建立方法,其特征在于,步骤S46中所述利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c,包括:
将故障事件e1和e2分别作为故障事件A和B,将均值t0作为t,将关联时间窗口宽度w0作为w,将时间间隔分布序列作为时间间隔序列,将关联事件序列作为故障信息序列,利用步骤S24中的时序关联规则R的置信度指标计算公式,计算故障事件对中的两个故障事件的置信度c。
6.如权利要求2所述的基于时间间隔分布特征的网络管理系统故障模型建立方法,其特征在于,所述的两个子序列中的发生时间邻近的两个故障事件,是指第一子序列中第一故障事件的发生时间与第二子序列中第二故障事件的发生时间的间隔,比第一子序列中第一故障事件的发生时间与第一子序列中其他故障事件的发生时间的间隔小,同时也比第二子序列中第二故障事件的发生时间与第二子序列中其他故障事件的发生时间的间隔小;两个子序列是指第一子序列与第二子序列,两个故障事件是指第一故障事件与第二故障事件。
CN202211125054.1A 2022-09-15 2022-09-15 基于时间间隔分布特征的网络管理系统故障模型建立方法 Active CN115460098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211125054.1A CN115460098B (zh) 2022-09-15 2022-09-15 基于时间间隔分布特征的网络管理系统故障模型建立方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211125054.1A CN115460098B (zh) 2022-09-15 2022-09-15 基于时间间隔分布特征的网络管理系统故障模型建立方法

Publications (2)

Publication Number Publication Date
CN115460098A CN115460098A (zh) 2022-12-09
CN115460098B true CN115460098B (zh) 2023-04-07

Family

ID=84304361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211125054.1A Active CN115460098B (zh) 2022-09-15 2022-09-15 基于时间间隔分布特征的网络管理系统故障模型建立方法

Country Status (1)

Country Link
CN (1) CN115460098B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996077A (zh) * 2014-05-22 2014-08-20 中国南方电网有限责任公司电网技术研究中心 一种基于多维时间序列的电气设备故障预测方法
CN109597836A (zh) * 2018-11-29 2019-04-09 武汉大学 一种基于加权矩阵的通信设备告警关联规则挖掘方法
CN113051307A (zh) * 2019-12-27 2021-06-29 深信服科技股份有限公司 告警信号的分析方法、设备、存储介质及装置
CN113704075A (zh) * 2021-09-23 2021-11-26 中国人民解放军国防科技大学 一种基于故障日志的高性能计算系统故障预测方法
JP2022008107A (ja) * 2020-06-24 2022-01-13 株式会社東芝 設備故障予測システム、設備故障予測方法、および、設備故障予測プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996077A (zh) * 2014-05-22 2014-08-20 中国南方电网有限责任公司电网技术研究中心 一种基于多维时间序列的电气设备故障预测方法
CN109597836A (zh) * 2018-11-29 2019-04-09 武汉大学 一种基于加权矩阵的通信设备告警关联规则挖掘方法
CN113051307A (zh) * 2019-12-27 2021-06-29 深信服科技股份有限公司 告警信号的分析方法、设备、存储介质及装置
JP2022008107A (ja) * 2020-06-24 2022-01-13 株式会社東芝 設備故障予測システム、設備故障予測方法、および、設備故障予測プログラム
CN113704075A (zh) * 2021-09-23 2021-11-26 中国人民解放军国防科技大学 一种基于故障日志的高性能计算系统故障预测方法

Also Published As

Publication number Publication date
CN115460098A (zh) 2022-12-09

Similar Documents

Publication Publication Date Title
CN109859054B (zh) 网络社团挖掘方法、装置、计算机设备及存储介质
US6810495B2 (en) Method and system for software rejuvenation via flexible resource exhaustion prediction
CN109753591B (zh) 业务流程预测性监控方法
JP2021533474A (ja) ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム
CN113259325B (zh) 基于麻雀搜索算法优化Bi-LSTM的网络安全态势预测方法
CN110222313B (zh) 反映非一致性干旱特征变量的干旱预警方法和装置
CN108446714B (zh) 一种多工况下的非马尔科夫退化系统剩余寿命预测方法
CN115801463B (zh) 工业互联网平台入侵检测的方法、装置和电子设备
KR20160058891A (ko) 시스템으로부터 획득되는 측정 값들을 평가하기 위한 방법 및 시스템
CN115186762A (zh) 一种基于dtw-knn算法的发动机异常检测方法及系统
CN117078048A (zh) 基于数字孪生的智慧城市资源管理方法及系统
JP2005004658A (ja) 変化点検出装置,変化点検出方法および変化点検出用プログラム
CN115460098B (zh) 基于时间间隔分布特征的网络管理系统故障模型建立方法
CN114721898A (zh) 基于boosting算法的边缘云服务器利用率预测方法、预测装置及存储介质
CN110276689A (zh) 基于动态决策的智能合约实现方法
CN113192627A (zh) 一种基于病人与疾病二部图的再入院预测方法及系统
CN117041017A (zh) 数据中心的智能运维管理方法及系统
CN117827593A (zh) 一种基于异常识别结果确定异常原因的方法和系统
CN114896302B (zh) 小负荷用户的户变关系识别方法及系统、设备、存储介质
CN116047223A (zh) 一种基于实时用电信息及大数据分析的窃电判别方法
CN115660957A (zh) 一种波形数据的重采样方法、装置、设备及介质
CN116186603A (zh) 异常用户的识别方法及装置、计算机存储介质、电子设备
CN115794548A (zh) 日志异常的检测方法及装置
CN111325350B (zh) 可疑组织发现系统和方法
WO2016116958A1 (ja) 系列データ分析装置及プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant