CN107426019A - 网络故障确定方法、计算机设备及计算机可读存储介质 - Google Patents

网络故障确定方法、计算机设备及计算机可读存储介质 Download PDF

Info

Publication number
CN107426019A
CN107426019A CN201710547011.5A CN201710547011A CN107426019A CN 107426019 A CN107426019 A CN 107426019A CN 201710547011 A CN201710547011 A CN 201710547011A CN 107426019 A CN107426019 A CN 107426019A
Authority
CN
China
Prior art keywords
rate
change
index
degree
unbalancedness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710547011.5A
Other languages
English (en)
Inventor
赵会峰
钟成
苏汉
张益辉
胡文建
郭家伟
徐良燕
赵灿
杨宇皓
王琳
王珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Hebei Electric Power Co Ltd
Shijiazhuang Power Supply Co of State Grid Hebei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Hebei Electric Power Co Ltd
Shijiazhuang Power Supply Co of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Hebei Electric Power Co Ltd, Shijiazhuang Power Supply Co of State Grid Hebei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201710547011.5A priority Critical patent/CN107426019A/zh
Publication of CN107426019A publication Critical patent/CN107426019A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种网络故障确定方法、计算机设备及计算机可读存储介质。所述方法包括:获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量;若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。本发明实施例的方法通过获取设备的指标的变化率,并判断获知指标的变化率高于不平衡度一个门限值,可确定对应的设备是故障设备,从而可及时的发现网络故障中的故障设备。

Description

网络故障确定方法、计算机设备及计算机可读存储介质
技术领域
本发明实施例涉及一种信息技术领域,特别是一种网络故障确定方法、计算机设备及计算机可读存储介质。
背景技术
随着智能电网的迅速发展,智能电力通信网络承载着重要的信息交换,对功能的多样化和分布式发电厂协同工作起着非常重要的作用。无保障的通信性能不仅限制智能电网对电能的使用和服务质量,而且对信息决策系统有着潜在的损害。网络故障是导致网络处于非正常状态、业务应用处于非可用状态或者性能下降状态的根本性的原因。故障通常是不会直接被网管系统直接观测到的,往往通过一些外在现象或者告警表现出来。伴随着网络规模的扩大、业务的部署,网络中的故障检测问题呈现出复杂化、不确定性的特点。
现有技术中故障检测的方案主要有以下三种:
技术方案1:基于灰色预测方法,将心跳策略引入到电力通信网络节点的故障检测中,动态地预测出网络节点系统的状态变化;将获取的网络节点系统预测动态序列为依据,利用模糊算法对网络节点的故障信号延迟进行处理,计算出网络节点的故障检测信号的输出值序列。本发明算法在进行网络节点的故障检测时,利用模糊算法对网络节点的故障信号延迟进行模糊化处理,从而有效地保证了改进算法进行多媒体网络节点故障检测的时间效率。
具体地,主要通过两步完成:第一,网络节点系统状态变化的动态预测:将G代表的网络节点系统定义为有限(n)个进程的集合,Pi代表的进程上的故障检测组件Mi会定期发送一条心跳消息给Pj代表的进程上的故障检测组件Mj,除非Pj出现故障,否则Pj会收到该消息,则将网络节点的故障检测系统定义为有限(n)个故障检测组件的集合FDS。将每次发送消息的序号顺序递增,Mj会依据最近K次(K个时刻)接收到的心跳消息到达时间和实时预测策略建立网络节点系统的灰色预测模型,并预测出第K+1次(第K+1个时刻)心跳消息顺利到达的时间,如果在预测的时间内没有收到Mi发送的心跳消息,则进程Pi出现故障。第二、故障状态观测参数的网络节点故障检测。
技术方案2:检测启动后初始化阈值开始出网络流量值信号,并经过小波变换得到序列,然后通过经验模式分解算法得到固有模式函数组件,得普峭值,普峭度值大于阈值,得异常网络业务,执行完所有的小包组件,完成后保存退出,结束。
具体地,主要通过八步完成:第一,初始化阈值α和β,并给出网络流量信号x(t);第二,进行小波包变换,获得序列cs[k];第三,对每一个cs[k],用提出的改进的经验模式分解算法进行分解,然后为cs[k]得到固有模式函数组件gsv[k],;第四,计算每个固有模态函数分量gsv[k]的普峭度值,得到其普峭度值J(gsv[k]);第五,如果J(gsv[k])>α,选择相应的固有模态函数分量,并得到所选的固有模态函数分量集;第六,计算出时域的信号第七,如果成立,中相应的部分被标记为异常网络业务;第八,根据上述步骤,如果执行所有的小波包组件,则将结果保存到文件并退出,否则返回到步骤3。
技术方案3:基于GCRMS(Global Customer Request Management Service,全球客户问题管理服务)系统的方案,通过互操作实时调用GIS的图形展示功能组件,依附电网资源拓扑关联建立电力通信网拓扑,并将通信网设备与PMS设备台账相关联,从而实现对电力通信网故障的分析研判与精确定位,达到融合图形、模型及空间信息资源处理电力通信网故障,提高电力通信网故障抢修调度效率的目标。
具体地,主要通过六步完成:第一,基于PIIF架构集成实现互操作;通过互操作实时调用GIS的图形展示功能组件,依附电网资源拓扑关联建立电力通信网拓扑,并将通信网设备与PMS设备台账相关联;对电力通信网故障进行分析研判与定位,融合图形、模型及空间信息资源处理电力通信网故障,提高电力通信网故障抢修调度效率;第二,基于PIIF架构集成实现GCRMS、GIS及PMS系统间的互操作;第三,通过互操作实时调用GIS的图形展示功能组件,依附电网资源拓扑关联建立电力通信网拓扑,并将通信网设备与PMS设备台账相关联;第四,GCRMS通过互操作实时调用GIS的图形展示功能组件,依附电网资源拓扑关联建立电力通信网拓扑,并通过与PMS的互操作实时订阅PMS的设备台账,在GCRMS中形成通信网设备与电网设备的一体化视图;第五,对电力通信网故障的分析研判与精确定位,融合图形、模型及空间信息资源处理电力通信网故障,提高电力通信网故障抢修调度效率;第六,GCRMS基于电网图形、模型、电网资源的空间信息及通信网故障告警,补偿考虑通信网在接线过程的长度损耗分析计算出故障点的坐标。
现有技术中存在的问题有:
由于上述三个技术方案均是根据采集的测量数据的数值本身进行处理分析,在复杂的电力网络中进行故障定位,均具有发现问题延迟的缺点。
目前,现有技术还没有相应的方法来解决故障发现问题延迟的问题。
发明内容
针对现有技术的缺陷,本发明实施例提供一种网络故障确定方法、计算机设备及计算机可读存储介质。
一方面,本发明实施例提供一种网络故障确定方法,包括:
获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量;
若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。
另一方面,本发明实施例还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如下步骤:
获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量;
若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。
所述获取待测设备的指标在测量时间段的变化率,具体为:
从网络系统采集所述指标在测量时间段的时间序列,所述时间序列包括多个所述指标的测量值;
将所述时间序列进行归一化处理,得到所述指标的变化率。
所述将所述时间序列进行归一化处理,得到所述指标的变化率,具体为:
根据所述时间序列、预设的第一平滑参数以及每一测量值在所述时间序列的序号,得到所述指标的变化率,其中,所述第一平滑参数为对应所述时间序列的参数。
所述若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,具体为:
从网络系统采集所述指标的多个历史时间序列,每一历史时间序列包括多个所述指标的历史值;
将每一历史时间序列进行归一化处理,得到所述指标的不平衡度。
所述将每一历史时间序列进行归一化处理,得到所述指标的不平衡度,具体为:
根据每一历史时间序列、预设的第二平滑参数以及每一历史值在所述历史时间序列的序号,得到所述指标的历史变化率,其中,所述第二平滑参数为对应所述历史时间序列的参数;
根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度。
所述根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度,具体为:
根据所述历史变化率的平均值和所述历史变化率的标准差,得到所述不平衡度。
所述设备为主设备,并具有对应的从设备,相应地,所述若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,具体为:
若判断获知所述变化率高于预先确定的不平衡度一个门限值,且所述从设备的变化率高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。
所述指标为所述设备的吞吐量,所述吞吐量为所述设备在测量时间段内处理数据的数量。
另一方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如下步骤:
获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量;
若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。
所述获取待测设备的指标在测量时间段的变化率,具体为:
从网络系统采集所述指标在测量时间段的时间序列,所述时间序列包括多个所述指标的测量值;
将所述时间序列进行归一化处理,得到所述指标的变化率。
所述将所述时间序列进行归一化处理,得到所述指标的变化率,具体为:
根据所述时间序列、预设的第一平滑参数以及每一测量值在所述时间序列的序号,得到所述指标的变化率,其中,所述第一平滑参数为对应所述时间序列的参数。
所述若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,具体为:
从网络系统采集所述指标的多个历史时间序列,每一历史时间序列包括多个所述指标的历史值;
将每一历史时间序列进行归一化处理,得到所述指标的不平衡度。
所述将每一历史时间序列进行归一化处理,得到所述指标的不平衡度,具体为:
根据每一历史时间序列、预设的第二平滑参数以及每一历史值在所述历史时间序列的序号,得到所述指标的历史变化率,其中,所述第二平滑参数为对应所述历史时间序列的参数;
根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度。
所述根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度,具体为:
根据所述历史变化率的平均值和所述历史变化率的标准差,得到所述不平衡度。
所述设备为主设备,并具有对应的从设备,相应地,所述若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,具体为:
若判断获知所述变化率高于预先确定的不平衡度一个门限值,且所述从设备的变化率高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。
所述指标为所述设备的吞吐量,所述吞吐量为所述设备在测量时间段内处理数据的数量。
由上述技术方案可知,本发明实施例提供的网络故障确定方法、计算机设备及计算机可读存储介质,所述方法通过获取设备的指标的变化率,并判断获知指标的变化率高于不平衡度一个门限值,可确定对应的设备是故障设备,从而可及时的发现网络故障中的故障设备。
附图说明
图1为本发明实施例提供的一种网络故障确定方法的流程示意图;
图2为本发明又一实施例提供的一种网络故障确定方法的流程示意图;
图3为本发明又一实施例提供的一种网络故障确定方法的流程示意图;
图4为本发明又一实施例提供的一种网络故障确定方法的模型示意图;
图5为本发明又一实施例提供的设备吞吐量之间的相关系数的累积分布示意图;
图6为本发明又一实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明实施例一部分实施例,而不是全部的实施例。
本发明实施例可应用至多个网络系统中,为例更好的说明本实施例,以应用至配电通信网络为例进行说明。
图1示出了本发明实施例提供的一种网络故障确定方法的流程示意图。
参照图1,本发明实施例提供的方法具体包括以下步骤:
步骤11、获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量。
针对某一待测设备,获取待测设备的一个指标在在测量时间段内的变化量,得到测量时间段的变化率。
具体地,所述测量时间段可为一天,一个小时,可根据设备的运作情况灵活设置。
可选地,周期性的获取所述测量时间段的指标,通过所述指标变化的快慢可确定所述指标的变化情况。
具体地,所述变化率表征所述指标在测量时间段内的变化量,可通过多种现有技术的计算方法获得。
步骤12、若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。
在本步骤之前,可预先确定所述不平衡度,所述不平衡度表示所述指标变化的平衡程度,可由所述指标的历史数据得到。
在本步骤中,将所述变化率与不平衡度进行比较,若所述变化率高于所述不平衡度一个门限值,表示测量时间段指标的变化量大于该指标的平均变化量,处于异常情况,则将对应设备作为故障原因。
具体地,所述门限值可根据实际情况进行设置,如为0.1,不以此为限。
在本步骤中,通过指标的变化率来识别故障的发生,无需等到指标大于或小于告警临界值,产生告警后才发现,可以理解的是,若指标变化为陡增或骤降,可及时发现并及时处理。
相应地,若判断获知所述变化率不高于不平衡度一个门限值,则所述变化率对应的设备正常。
本实施例提供的网络故障确定方法,至少具有以下技术效果:
通过获取设备的指标的变化率,并判断获知指标的变化率高于不平衡度一个门限值,可确定对应的设备是故障设备,从而可及时的发现网络故障中的故障设备
图2示出了本发明又一实施例提供的一种网络故障确定方法的流程示意图。
参照图2,在上述实施例的基础上,本实施例提供的网络故障确定方法。所述方法步骤11,获取待测设备的指标在测量时间段的变化率的方式可有多种,本实施例举例说明其中一种。
所述步骤11具体包括:
步骤111、从网络系统采集所述指标在测量时间段的时间序列,所述时间序列包括多个所述指标的测量值。
在本步骤中,从网络系统采用高通滤波器采集所述指标在测量时间段的多个测量值,构成一个时间序列。
步骤112、将所述时间序列进行归一化处理,得到所述指标的变化率。
可选地,针对每一测量值,采用归一化模型进行归一化处理,可直接将从网络中测量的数据就变成具归一化的变化率。
其中,归一化是一种简化计算的方式,即将有量纲的测量值,经过变换,化为无量纲的标量。
可选地,采用平滑变异性的归一化速率(normalization rate of smoothvariability,NRSV)的方法来计算变化率,并进行归一化处理。
可选地,根据所述时间序列、预设的第一平滑参数以及每一测量值在所述时间序列的序号,得到所述指标的变化率,其中,所述第一平滑参数为对应所述时间序列的参数。
具体地,可通过以下公式获取所述指标的变化率:
式中,所述指标的变化率为△(wt),wt表示测量值,即在时间t接收测量的值,α是影响时间序列测量的先前值的移动平均值的权重的平滑参数,且α大于1,s是当前测量值在所述时间序列的序号。
在本步骤中,通过上述公式,可直接从测量值获取归一化的变化率。采用NRSV最重要的原因是它不仅可以表征变化,而且以可调节的方式消除测量噪声,能够获取精准的变化率。
当然,因为移动平均值是广泛使用的参数,并且可以以迭代方式计算,得到很好的平滑参数,所以NRSV可有效的应用至本发明实施例中。
此外,NRSV根据当前测量值的规模对变化进行规范化,因此使得能够在不同类型的测量值之间进行直接计算,获取对应的变化率。
本实施例提供的网络故障确定方法,至少具有以下技术效果:
通过采集所述指标在测量时间段的时间序列,进行归一化处理获取所述指标的变化率,可实现准确的计算所述指标的变化率,从而可准确的进行网络故障定位。
图3示出了本发明又一实施例提供的一种网络故障确定方法的流程示意图。
参照图3,在上述实施例的基础上,本实施例提供的网络故障确定方法。所述方法步骤12之前,确定不平衡度的方式可有多种,本实施例举例说明其中一种。
所述步骤12之前,所述方法还包括:
步骤13、从网络系统采集所述指标的多个历史时间序列,每一历史时间序列包括多个所述指标的历史值。
在本步骤中,从网络系统采用高通滤波器采集所述指标在一个历史时间段的多个历史值,构成一个历史时间序列,并在多个历史时间段的多个历史值,构成多个历史时间序列。
步骤14、将每一历史时间序列进行归一化处理,得到所述指标的不平衡度。
其中,步骤13和步骤14可发生在所述步骤11之前,也可发生在步骤11之后,还可同时发生,以发生在所述步骤11之前为例进行说明。
可选地,针对每一历史时间序列的每一历史值,采用归一化模型进行归一化处理,可直接将从网络中测量的数据就变成具归一化的变化率。
其中,归一化是一种简化计算的方式,即将有量纲的测量值,经过变换,化为无量纲的标量。
可选地,采用平滑变异性的归一化速率(normalization rate of smoothvariability,NRSV)的方法来计算变化率,并进行归一化处理。
可选地,根据每一历史时间序列、预设的第二平滑参数以及每一历史值在所述历史时间序列的序号,得到所述指标的历史变化率,其中,所述第二平滑参数为对应所述历史时间序列的参数。
具体地,可通过以下公式获取所述指标的历史变化率:
式中,所述指标的历史变化率为△(wt),wt是表示历史值,即在时间t测量的值,α是影响时间序列测量的先前值的移动平均值的权重的平滑参数,且α大于1,s是当前历史值在所述历史时间序列的序号。
在本步骤中,通过上述公式,可直接从历史值获取归一化的历史变化率。采用NRSV最重要的原因是它不仅可以表征变化,而且以可调节的方式消除测量噪声,能够获取精准的历史变化率。
进一步地,根据多个历史时间序列,得到对应的多个历史变化率,根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度。
具体地,根据多个历史值的变化率计算不平衡度。
可选地,不平衡度是带符号偏差的度量。
其中,在n个值(y1,y2,...,yn)的组中的值yi的不平衡度的定义是值yi和其他值的平均值之间的差,可通过如下公式计算得到不平衡度。
式中,Φ(vi)表示不平衡度,vi表示根据历史值yi得到的变化率,j为其他历史值,n为历史值的总数。
更进一步地,变化率Δ(wt(i))的不平衡度可通过以下公式得到。
在本步骤中,计算n个时间序列时,复杂度仅为O(n),即仅与计算的次数有关,相对较为简单。
本实施例提供的网络故障确定方法,至少具有以下技术效果:
通过根据指标的历史值计算历史变化率,可得到指标的不平衡度,使得所述待测设备的指标的变化率与所述不平衡度进行比较,可及时、准确的进行网络故障确定。
在上述实施例的基础上,本实施例提供的网络故障确定方法。所述方法包括步骤11、获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量。
步骤12、若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。
所述步骤11和步骤12与上述方法步骤的11和12相同,本实施例不再赘述。
所述方法在所述步骤12之后,还包括以下步骤:
根据所述历史变化率的平均值和所述历史变化率的标准差,得到所述不平衡度
具体地,将测量值的变化率与其历史数据获得的不平衡度进行比较,以检查对应的设备是否是异常值。
具体的检测过程如下:
首先,准备历史数据的概率分布。
具体地,为根据指标的历史时间序列获得的历史变化率得到不平衡度,并进行概率分布统计,得到相应的概率分布。
其次,当变化率与不平衡度相比,变化率出现新值时,即高于或低于所述不平衡度时,使用所准备的概率分布来计算该变化率的外概率。
最后,将外概率与预定义的阈值进行比较。其中,外概率是表示变化率与不平衡度不同的概率,当外概率小于阈值时,变化率是离群值,并且指示检测到网络异常发生。
可选地,外概率的计算较为复杂,在许多情况下,不平衡度的历史数据接近正态分布,并且可以使用绝对标准分数来代替外概率,以简化计算。
具体地,可根据以下公式得到绝对标准分数,以对得到的不平衡度进行优化。
式中,μ是所述历史变化率的平均值,σ分别是所述历史变化率的标准差。
本实施例提供的网络故障确定方法,至少具有以下技术效果:
通过对所述不平衡度进行优化,可得到更准确的不平衡度,以更好的衡量所述指标的变化率,可达到准确确定网络故障的效果。
在上述实施例的基础上,本实施例提供的网络故障确定方法。所述设备为主设备,并具有对应的从设备。
网络系统是复杂、大规模、含有噪声、故障根源具有不确定性的环境,本发明实施例在这样的环境中进行有效的故障检测。
为了提高网络的可靠性,基于双路由和双设备的配电通信网应运而生。
本发明实施例以双路由和双设备为例进行说明。
其中,双路由表示由两条链路可以实现接入设备到核心设备的通道;中断一条,业务不受影响,另一条还可以正常使用,也就是说,到核心设备的不同通路上具有两个节点,一个为主设备,另一个为从设备,二者的性能相同,也可将从设备做备份的功能。
可以理解的是,具有双路由或双设备的配电通信网可靠性增加,本发明实施例针对此种设计进行研究。
图4示出了本发明又一实施例提供的一种网络故障确定方法的模型示意图。
参照图4,所述指标为所述设备的吞吐量,所述吞吐量为所述设备在测量时间段内处理数据的数量,当然所述指标可为其他测量指标,不以此为限。
通过研究,发现了一系列在许多网络故障中常见的现象。该现象的一个重要点是,在配电通信网故障发生之前或期间,一些设备,尤其是主设备和从设备的测量指标之间的相关性下降。
基于此现象进行建模以识别网络故障:
1)至少存在一个测量的指标A与有问题的网络设备的服务成功率相关,A在网络故障发生之前或期间相对于正常状态偏小。
2)A的减少过程存在不同变化率的多个阶段,并且阶段的数目取决于网络故障的机制。图4中示出了具有2阶段减少/增加速率的网络故障现象。
3)在正常条件下还存在与A相关的至少一个测量的指标B,A减少之后B相较于正常状态偏大。
具体地,可将这种现象归因于双路由或双设备的配电通信网的设计。
例如,当单个设备在适当配置的网络中其服务能力下降时,业务可能通过穿越替代设备得到服务,这导致该设备上的测量值的增加。
相应地,在这种情况下,测量的指标A和B可以是有问题的设备和备选路由上的另一设备的指标。
具体地,通过图4可直观地观测到吞吐量A和B的变化。
现有技术中的阈值违反原则可以在阶段2之后,指标超过/低于阈值后检测到故障,在本发明实施例中通过对变化率的分析处理,能够在早期阶段检测网络故障。
此外,在一些故障事件中,由于“静默失败”的发生,导致阶段1持续很长时间或永久持续,导致已发生故障,但指标未超过/低于阈值,从而采用现有技术中的方法不易检测到。
相应地,步骤12具体为:
步骤12’、若判断获知所述变化率高于预先确定的不平衡度一个门限值,且所述从设备的变化率高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。
具体地,除了判断主设备的变化率,还判断从设备的变化率,在两个变化率均高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。
例如,主设备的吞吐量骤降,对应的变化率高于不平衡度一个门限值,同时从设备的吞吐量陡增,对应的变化率也高于不平衡度一个门限值,可确定所述主设备运作异常。
可以理解的是,判断主设备的变化率的同时,还联合判断从设备的变化率,若主设备的变化率骤降,但从设备的变化率没有陡增,将对应的主设备列为疑似故障设备。
相应地,若主设备的变化率正常,但从设备的变化率骤降,将对应的从设备列为疑似故障设备。
本实施例提供的网络故障确定方法,至少具有以下技术效果:
在双设备的网络系统中,通过判断主设备的变化率的同时,还联合判断从设备的变化率,可提高网络故障确定的准确率。
为了更清楚的说明本发明实施例,以应用到双设备网络系统中进行详细说明。
具体地,使用如图4所示的网络故障确定的模型,在给定多个设备多个时间序列的连续测量,通过检测相关测量指标,产生可用于描述故障发生的评分。且据提出的模型,故障发生的特征更好地通过变化速率而不是数值本身来识别。
具体地,可由三个步骤组成:
一、分别从每个设备的吞吐量提取变化率;
二、计算一组可变性的不平衡程度;
三、将不平衡度值与其历史值进行比较,以确定其是否是离群值。
在第一步中,从配电通信网设备收集的吞吐量信息中提取其变化率。通常采用高通滤波器来提取信息变化。采用平滑变异性的归一化速率(NRSV)的方法来计算变化率,并对其进行归一化处理,归一化模型由以下公式表示。
式中,wt表示在时间t接收的一些时间序列测量的值,α是影响时间序列测量的先前值的移动平均值的权重的平滑参数,s是当前测量值的序号。通过上述公式的处理,直接从网络中测量的数据就变成了归一化的变化率。
采用NRSV最重要的原因是它不仅可以表征变化,而且以可调节的方式消除测量噪声。当然,因为移动平均值被广泛使用并且可以以迭代方式计算,所以NRSV是有效的。
使用NRSV的不平衡度计算方式,进而进行有效且可扩展的不平衡变化检测,保证故障检测精度,提高故障检测效率。
此外,NRSV根据当前值的规模对变化进行规范化,因此使得能够在不同类型的测量之间进行直接计算,诸如在下一步中进行的。
在第二步中,在一组测量值的变化率中计算不平衡度。不平衡度是带符号偏差的度量。在n个值(y1,y2,...,yn)的组中的值yi的不平衡度的定义是值yi和该组中的其他值的平均值之间的差,如由以下公式获得:
式中,Φ(vi)表示不平衡度,vi表示根据历史值yi得到的变化率,j为其他历史值,n为历史值的总数。
据此,变化率Δ(wt(i))的不平衡度可以表示为以下公式:
其中,优势在于,计算n个时间序列的吞吐量时,复杂度仅为O(n);但它只能处理正相关。
根据研究,大多数时间序列测量具有彼此之间的正相关性。
此外,可以将时间序列测量划分为由彼此正相关的测量组成的组。增加组的数量提高了不平衡变化检测的精度,但是当对于不同组计算多次时间序列测量时,计算复杂度也增加,衡量得到精度和性能之间的折衷。
在最后一步中,将每个时间序列测量的变化率的不平衡程度与其历史数据进行比较,以检查其是否是异常值。具体的检测过程如下:
首先,准备历史数据的概率分布。第二,当不平衡度出现新值时,使用所准备的分布来计算该值的外概率。最后,将外概率与一些预定义的阈值进行比较。当外部概率小于阈值时,新值是离群值,并且其指示检测到网络异常发生。在许多情况下,不平衡度的历史数据接近正态分布,并且可以使用由以下公式表示的绝对标准分数来代替外概率,以简化计算。
式中,μ是所述历史变化率的平均值,σ分别是所述历史变化率的标准差。
由于异常值检测步骤的存在,不平衡变化检测方法可以处理具有不同相关程度(从弱的到强的)的各种各样的时间序列测量。
可选地,如前所述,多数序列测量具有彼此之间的正相关性,本发明实施例提供以下实例予以证明。
图5示出了本发明又一实施例提供的设备吞吐量之间的相关系数的累积分布示意图。
如图5所示,从一个月的数据集中选择没有任何网络故障发生的两天。对所有超过72,000,000对测量指标计算斯皮尔曼等级相关系数。
相关系数的累积分布显示超过60%的测量指标之间的相关性是正的。如果考虑统计显着性为95%置信水平,则为35%。
因此,证明了本发明实施例适用于网络中的大多数测量指标。
将计算时间投影到整个一个月长的情况下,所提出的方法预期在10秒内完成计算。实验结果证明所提出的方法对于实际的网络故障检测是有效的和可扩展的。
更进一步地,应用本发明实施例获得的故障设备,进行复检,评价本发明实施例的准确性。
具体地,对整个一个月长的数据集执行实际的网络故障检测,以检查所提出的方法的准确性,其中所有超过12,000个条目被采用作为测量指标。
实验中的网络故障检测以无监督的异常检测方式进行。也就是说,在没有关于实际网络故障的任何知识的情况下,算法将未被检测为网络故障发生的先前测量的网络数据作为正常数据用于其它数据。
在实际检测中,将平滑参数α设置为α=2.0。
检测结果的概要如下表所示。提出的方法已成功检测到23次网络故障,5次漏错和1次假阳性。
检测结果 次数
检测故障发生情况 23
未检测到故障发生情况 5
错误检测发生 1
因此,所提出的方法的命中率,即灵敏度为约82.1%,并且其错误检测率为约4.2%。
结果证明,应用本发明实施例对于实际的网络故障检测具有可接受的精度。
本实施例提供的网络故障确定方法,至少具有以下技术效果:
将观察到的网络故障特性模型转化为设备吞吐量之间的不平衡变化,自动提取设备吞吐量之间的不平衡变化,而不需要识别它们的物理意义。
因为所提出的网络故障模型是基于观察到的常见现象,所以该模型是适用于不同类型的网络故障的通用模型,并且可以用于开发进一步的网络故障检测方法。同时,所提出的故障检测方法能够进行有效且可扩展的不平衡变化检测,保证故障检测精度,提高故障检测效率。
图6示出了本发明又一实施例提供的一种计算机设备的结构示意图。
参阅图6,发明又一实施例提供的一种计算机设备,所述计算机设备包括存储器61、处理器62以及存储在存储器61上并可在处理器上运行的计算机程序。
所述处理器执行所述程序时实现如下步骤:
获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量;
若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。
针对某一待测设备,获取待测设备的一个指标在在测量时间段内的变化量,得到测量时间段的变化率。
具体地,所述测量时间段可为一天,一个小时,可根据设备的运作情况灵活设置。
可选地,通常情况下,网络故障发生不是一个瞬态的,而是一直发生直到抢修成功,周期性的获取所述测量时间段的指标,通过所述指标变化的快慢可确定所述指标的变化情况。
具体地,所述变化率可通过多种现有技术的计算方法获得。
可预先确定的不平衡度,所述不平衡度表示所述指标变化的平衡程度,可由所述指标的历史数据而得到。将所述变化率与不平衡度进行比较,若所述变化率高于所述不平衡度一个门限值,表示测量时间段指标的变化量大于该指标的平均变化量,则当前设备可能故障。
具体地,所述门限值可根据实际情况进行设置,如为0.1,不以此为限。
通过指标的变化率来识别故障发生,可以理解的是,若指标的测量值陡增或骤降,可及时发现、及时处理,无需等到指标的测量大于或小于告警临界值,产生告警后才发现。
相应地,若判断获知所述变化率不高于不平衡度一个门限值,则所述变化率对应的设备正常。
在另一种实施方式中,所述处理器执行所述程序时实现如下步骤:
所述获取待测设备的指标在测量时间段的变化率,具体为:
从网络系统采集所述指标在测量时间段的时间序列,所述时间序列包括多个所述指标的测量值;将所述时间序列进行归一化处理,得到所述指标的变化率。
所述将所述时间序列进行归一化处理,得到所述指标的变化率,具体为:
根据所述时间序列、预设的第一平滑参数以及每一测量值在所述时间序列的序号,得到所述指标的变化率,其中,所述第一平滑参数为对应所述时间序列的参数。
从网络系统采用高通滤波器采集所述指标在测量时间段的多个测量值,构成一个时间序列。
可选地,针对每一测量值,采用归一化模型进行归一化处理,可直接将从网络中测量的数据就变成具归一化的变化率。其中,归一化是一种简化计算的方式,即将有量纲的测量值,经过变换,化为无量纲的标量。
可选地,采用平滑变异性的归一化速率(normalization rate of smoothvariability,NRSV)的方法来计算变化率,并进行归一化处理。
可选地,根据所述时间序列、预设的第一平滑参数以及每一测量值在所述时间序列的序号,得到所述指标的变化率,其中,所述第一平滑参数为对应所述时间序列的参数。
具体地,可通过以下公式获取所述指标的变化率:
式中,所述指标的变化率为△(wt),wt是表示测量值,即在时间t接收测量的值,α是影响时间序列测量的先前值的移动平均值的权重的平滑参数,且α大于1,s是当前测量值在所述时间序列的序号。
通过上述公式,可直接从测量值获取归一化的变化率。采用NRSV最重要的原因是它不仅可以表征变化,而且以可调节的方式消除测量噪声,能够获取精准的变化率。
当然,因为移动平均值是广泛使用的参数,并且可以以迭代方式计算,得到很好的平滑参数,所以NRSV可有效的应用至本发明实施例中。
此外,NRSV根据当前测量值的规模对变化进行规范化,因此使得能够在不同类型的测量值之间进行直接计算,获取对应的变化率。
在另一种实施方式中,所述处理器执行所述程序时实现如下步骤:
从网络系统采集所述指标的多个历史时间序列,每一历史时间序列包括多个所述指标的历史值;将每一历史时间序列进行归一化处理,得到所述指标的不平衡度。
所述将每一历史时间序列进行归一化处理,得到所述指标的不平衡度,具体为:
根据每一历史时间序列、预设的第二平滑参数以及每一历史值在所述历史时间序列的序号,得到所述指标的历史变化率,其中,所述第二平滑参数为对应所述历史时间序列的参数;
根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度。可选地,针对每一历史时间序列的每一历史值,采用归一化模型进行归一化处理,可直接将从网络中测量的数据就变成具归一化的变化率。其中,归一化是一种简化计算的方式,即将有量纲的测量值,经过变换,化为无量纲的标量。
可选地,采用平滑变异性的归一化速率(normalization rate of smoothvariability,NRSV)的方法来计算变化率,并进行归一化处理。
可选地,根据每一历史时间序列、预设的第二平滑参数以及每一历史值在所述历史时间序列的序号,得到所述指标的历史变化率,其中,所述第二平滑参数为对应所述历史时间序列的参数。
具体地,可通过以下公式获取所述指标的历史变化率:
式中,所述指标的历史变化率为△(wt),wt是表示历史值,即在时间t测量的值,α是影响时间序列测量的先前值的移动平均值的权重的平滑参数,且α大于1,s是当前历史值在所述历史时间序列的序号。
通过上述公式,可直接从历史值获取归一化的历史变化率。采用NRSV最重要的原因是它不仅可以表征变化,而且以可调节的方式消除测量噪声,能够获取精准的历史变化率。
进一步地,在另一种实施方式中,所述处理器执行所述程序时实现如下步骤:
根据多个历史时间序列,得到对应的多个历史变化率,根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度。
具体地,根据多个历史值的变化率计算不平衡度。
可选地,不平衡度是带符号偏差的度量。
其中,在n个值(y1,y2,...,yn)的组中的值yi的不平衡度的定义是值yi和其他值的平均值之间的差,可通过如下公式计算得到不平衡度。
式中,Φ(vi)表示不平衡度,vi表示根据历史值yi得到的变化率,j为其他历史值,n为历史值的总数。
更进一步地,变化率Δ(wt(i))的不平衡度可通过以下公式得到。
计算n个时间序列时,复杂度仅为O(n),即仅与计算的次数有关,相对较为简单。
在另一种实施方式中,所述处理器执行所述程序时实现如下步骤:
根据所述历史变化率的平均值和所述历史变化率的标准差,得到所述不平衡度。在许多情况下,不平衡度的历史数据接近正态分布,并且可以使用绝对标准分数来代替外概率,以简化计算。
具体地,可根据以下公式得到绝对标准分数,以对得到的不平衡度进行优化。
式中,μ是所述历史变化率的平均值,σ分别是所述历史变化率的标准差。
更进一步地,在另一种实施方式中,所述处理器执行所述程序时实现如下步骤:
所述设备为主设备,并具有对应的从设备,相应地,所述若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,具体为:
若判断获知所述变化率高于预先确定的不平衡度一个门限值,且所述从设备的变化率高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。所述指标为所述设备的吞吐量,所述吞吐量为所述设备在测量时间段内处理数据的数量。
具体地,除了判断主设备的变化率,还判断从设备的变化率,在两个变化率均高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。例如,主设备的吞吐量骤降,对应的变化率高于不平衡度一个门限值,同时从设备的吞吐量陡增,对应的变化率也高于不平衡度一个门限值,可确定所述主设备运作异常。
可以理解的是,判断主设备的变化率的同时,还联合判断从设备的变化率,若主设备的变化率骤降,但从设备的变化率没有陡增,将对应的主设备列为疑似故障设备。相应地,若主设备的变化率正常,但从设备的变化率骤降,将对应的从设备列为疑似故障设备。
本实施例提供的计算机设备,可用于执行上述方法实施例的方法对应的程序,本实施不再赘述。
本实施例提供的计算机设备,具有以下技术效果:
1、通过执行获取指标的变化率,并判断获知指标的变化率高于不平衡度一个门限值的程序,可确定对应的设备作为故障设备,从而可及时的发现网络故障中的故障设备。
2、通过执行采集所述指标在测量时间段的时间序列,进行归一化处理获取所述指标的变化率的程序,可实现准确的计算所述指标的变化率,从而可准确的进行网络故障定位。
3、通过执行根据指标的历史值计算历史变化率,可得到指标的不平衡度,使得所述待测设备的指标的变化率与所述不平衡度进行比较的程序,可及时、准确的进行网络故障确定。
4、通过执行对所述不平衡度进行优化的程序,可得到更准确的不平衡度,以更好的衡量所述指标的变化率,可达到准确确定网络故障的效果。
5、在双设备的网络系统中,通过执行判断主设备的变化率的同时,还联合判断从设备的变化率的程序,可提高网络故障确定的准确率。
本发明又一实施例提供的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述程序被处理器执行时实现如下步骤:
获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量;
若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。
针对某一待测设备,获取待测设备的一个指标在在测量时间段内的变化量,得到测量时间段的变化率。
具体地,所述测量时间段可为一天,一个小时,可根据设备的运作情况灵活设置。
可选地,通常情况下,网络故障发生不是一个瞬态的,而是一直发生直到抢修成功,周期性的获取所述测量时间段的指标,通过所述指标变化的快慢可确定所述指标的变化情况。
具体地,所述变化率可通过多种现有技术的计算方法获得。
可预先确定的不平衡度,所述不平衡度表示所述指标变化的平衡程度,可由所述指标的历史数据而得到。将所述变化率与不平衡度进行比较,若所述变化率高于所述不平衡度一个门限值,表示测量时间段指标的变化量大于该指标的平均变化量,则当前设备可能故障。
具体地,所述门限值可根据实际情况进行设置,如为0.1,不以此为限。
通过指标的变化率来识别故障发生,可以理解的是,若指标的测量值陡增或骤降,可及时发现、及时处理,无需等到指标的测量大于或小于告警临界值,产生告警后才发现。
相应地,若判断获知所述变化率不高于不平衡度一个门限值,则所述变化率对应的设备正常。
在另一种实施方式中,所述程序被处理器执行时实现如下步骤:
从网络系统采集所述指标在测量时间段的时间序列,所述时间序列包括多个所述指标的测量值;将所述时间序列进行归一化处理,得到所述指标的变化率。
所述将所述时间序列进行归一化处理,得到所述指标的变化率,具体为:
根据所述时间序列、预设的第一平滑参数以及每一测量值在所述时间序列的序号,得到所述指标的变化率,其中,所述第一平滑参数为对应所述时间序列的参数。
从网络系统采用高通滤波器采集所述指标在测量时间段的多个测量值,构成一个时间序列。
可选地,针对每一测量值,采用归一化模型进行归一化处理,可直接将从网络中测量的数据就变成具归一化的变化率。其中,归一化是一种简化计算的方式,即将有量纲的测量值,经过变换,化为无量纲的标量。
可选地,采用平滑变异性的归一化速率(normalization rate of smoothvariability,NRSV)的方法来计算变化率,并进行归一化处理。
可选地,根据所述时间序列、预设的第一平滑参数以及每一测量值在所述时间序列的序号,得到所述指标的变化率,其中,所述第一平滑参数为对应所述时间序列的参数。
具体地,可通过以下公式获取所述指标的变化率:
式中,所述指标的变化率为△(wt),wt是表示测量值,即在时间t接收测量的值,α是影响时间序列测量的先前值的移动平均值的权重的平滑参数,且α大于1,s是当前测量值在所述时间序列的序号。
通过上述公式,可直接从测量值获取归一化的变化率。采用NRSV最重要的原因是它不仅可以表征变化,而且以可调节的方式消除测量噪声,能够获取精准的变化率。
当然,因为移动平均值是广泛使用的参数,并且可以以迭代方式计算,得到很好的平滑参数,所以NRSV可有效的应用至本发明实施例中。
此外,NRSV根据当前测量值的规模对变化进行规范化,因此使得能够在不同类型的测量值之间进行直接计算,获取对应的变化率。
在另一种实施方式中,所述程序被处理器执行时实现如下步骤:
从网络系统采集所述指标的多个历史时间序列,每一历史时间序列包括多个所述指标的历史值;将每一历史时间序列进行归一化处理,得到所述指标的不平衡度。
所述将每一历史时间序列进行归一化处理,得到所述指标的不平衡度,具体为:
根据每一历史时间序列、预设的第二平滑参数以及每一历史值在所述历史时间序列的序号,得到所述指标的历史变化率,其中,所述第二平滑参数为对应所述历史时间序列的参数;
根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度。
可选地,针对每一历史时间序列的每一历史值,采用归一化模型进行归一化处理,可直接将从网络中测量的数据就变成具归一化的变化率。其中,归一化是一种简化计算的方式,即将有量纲的测量值,经过变换,化为无量纲的标量。
可选地,采用平滑变异性的归一化速率(normalization rate of smoothvariability,NRSV)的方法来计算变化率,并进行归一化处理。
可选地,根据每一历史时间序列、预设的第二平滑参数以及每一历史值在所述历史时间序列的序号,得到所述指标的历史变化率,其中,所述第二平滑参数为对应所述历史时间序列的参数。
具体地,可通过以下公式获取所述指标的历史变化率:
式中,所述指标的历史变化率为△(wt),wt是表示历史值,即在时间t测量的值,α是影响时间序列测量的先前值的移动平均值的权重的平滑参数,且α大于1,s是当前历史值在所述历史时间序列的序号。通过上述公式,可直接从历史值获取归一化的历史变化率。采用NRSV最重要的原因是它不仅可以表征变化,而且以可调节的方式消除测量噪声,能够获取精准的历史变化率。
进一步地,在另一种实施方式中,所述程序被处理器执行时实现如下步骤:
根据多个历史时间序列,得到对应的多个历史变化率,根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度。
具体地,根据多个历史值的变化率计算不平衡度。
可选地,不平衡度是带符号偏差的度量。
其中,在n个值(y1,y2,...,yn)的组中的值yi的不平衡度的定义是值yi和其他值的平均值之间的差,可通过如下公式计算得到不平衡度。
式中,Φ(vi)表示不平衡度,vi表示根据历史值yi得到的变化率,j为其他历史值,n为历史值的总数。
更进一步地,变化率Δ(wt(i))的不平衡度可通过以下公式得到。
计算n个时间序列时,复杂度仅为O(n),即仅与计算的次数有关,相对较为简单。
在另一种实施方式中,所述程序被处理器执行时实现如下步骤:
根据所述历史变化率的平均值和所述历史变化率的标准差,得到所述不平衡度。
在许多情况下,不平衡度的历史数据接近正态分布,并且可以使用绝对标准分数来代替外概率,以简化计算。
具体地,可根据以下公式得到绝对标准分数,以对得到的不平衡度进行优化。
式中,μ是所述历史变化率的平均值,σ分别是所述历史变化率的标准差。
更进一步地,在另一种实施方式中,所述程序被处理器执行时实现如下步骤:
所述设备为主设备,并具有对应的从设备,相应地,所述若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,具体为:
若判断获知所述变化率高于预先确定的不平衡度一个门限值,且所述从设备的变化率高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。所述指标为所述设备的吞吐量,所述吞吐量为所述设备在测量时间段内处理数据的数量。
具体地,除了判断主设备的变化率,还判断从设备的变化率,在两个变化率均高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。
例如,主设备的吞吐量骤降,对应的变化率高于不平衡度一个门限值,同时从设备的吞吐量陡增,对应的变化率也高于不平衡度一个门限值,可确定所述主设备运作异常。
可以理解的是,判断主设备的变化率的同时,还联合判断从设备的变化率,若主设备的变化率骤降,但从设备的变化率没有陡增,将对应的主设备列为疑似故障设备。相应地,若主设备的变化率正常,但从设备的变化率骤降,将对应的从设备列为疑似故障设备。
本实施例提供的计算机可读存储介质,其上存储所述程序可被处理器执行时实现上述方法实施例的方法,本实施不再赘述。
本实施例提供的计算机可读存储介质,具有以下技术效果:
1、通过所述程序可被处理器执行获取指标的变化率,并判断获知指标的变化率高于不平衡度一个门限值,可确定对应的设备作为故障设备,从而可及时的发现网络故障中的故障设备。
2、通过所述程序可被处理器执行采集所述指标在测量时间段的时间序列,进行归一化处理获取所述指标的变化率,可实现准确的计算所述指标的变化率,从而可准确的进行网络故障定位。
3、通过所述程序可被处理器执行根据指标的历史值计算历史变化率,可得到指标的不平衡度,使得所述待测设备的指标的变化率与所述不平衡度进行比较,可及时、准确的进行网络故障确定。
4、通过所述程序可被处理器执行对所述不平衡度进行优化,可得到更准确的不平衡度,以更好的衡量所述指标的变化率,可达到准确确定网络故障的效果。
5、在双设备的网络系统中,通过所述程序可被处理器执行判断主设备的变化率的同时,还联合判断从设备的变化率,可提高网络故障确定的准确率。
最后应说明的是:以上实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。

Claims (10)

1.一种网络故障确定方法,其特征在于,包括:
获取待测设备的指标在测量时间段的变化率,所述变化率表征所述指标在测量时间段内的变化量;
若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,其中,所述不平衡度是由所述指标的历史数据得到的平均变化率。
2.根据权利要求1所述的方法,其特征在于:所述获取待测设备的指标在测量时间段的变化率,具体为:
从网络系统采集所述指标在测量时间段的时间序列,所述时间序列包括多个所述指标的测量值;
将所述时间序列进行归一化处理,得到所述指标的变化率。
3.根据权利要求2所述的方法,其特征在于:所述将所述时间序列进行归一化处理,得到所述指标的变化率,具体为:
根据所述时间序列、预设的第一平滑参数以及每一测量值在所述时间序列的序号,得到所述指标的变化率,其中,所述第一平滑参数为对应所述时间序列的参数。
4.根据权利要求1所述的方法,其特征在于:所述若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,具体为:
从网络系统采集所述指标的多个历史时间序列,每一历史时间序列包括多个所述指标的历史值;
将每一历史时间序列进行归一化处理,得到所述指标的不平衡度。
5.根据权利要求4所述的方法,其特征在于:所述将每一历史时间序列进行归一化处理,得到所述指标的不平衡度,具体为:
根据每一历史时间序列、预设的第二平滑参数以及每一历史值在所述历史时间序列的序号,得到所述指标的历史变化率,其中,所述第二平滑参数为对应所述历史时间序列的参数;
根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度。
6.根据权利要求5所述的方法,其特征在于:所述根据所述历史变化率与所述历史时间序列的数量,得到平均变化率,并作为所述不平衡度,具体为:
根据所述历史变化率的平均值和所述历史变化率的标准差,得到所述不平衡度。
7.根据权利要求1所述的方法,其特征在于:所述设备为主设备,并具有对应的从设备,相应地,所述若判断获知所述变化率高于预先确定的不平衡度一个门限值,则将所述变化率对应的设备作为故障设备,具体为:
若判断获知所述变化率高于预先确定的不平衡度一个门限值,且所述从设备的变化率高于预先确定的不平衡度的所述门限值,则将所述主设备作为所述故障设备。
8.根据权利要求1-7任一项所述的方法,其特征在于:所述指标为所述设备的吞吐量,所述吞吐量为所述设备在测量时间段内处理数据的数量。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8任一项所述的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述程序被处理器执行时实现如权利要求1-8任一项所述的步骤。
CN201710547011.5A 2017-07-06 2017-07-06 网络故障确定方法、计算机设备及计算机可读存储介质 Pending CN107426019A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710547011.5A CN107426019A (zh) 2017-07-06 2017-07-06 网络故障确定方法、计算机设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710547011.5A CN107426019A (zh) 2017-07-06 2017-07-06 网络故障确定方法、计算机设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN107426019A true CN107426019A (zh) 2017-12-01

Family

ID=60427867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710547011.5A Pending CN107426019A (zh) 2017-07-06 2017-07-06 网络故障确定方法、计算机设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107426019A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108923952A (zh) * 2018-05-31 2018-11-30 北京百度网讯科技有限公司 基于服务监控指标的故障诊断方法、设备及存储介质
CN108989124A (zh) * 2018-08-10 2018-12-11 中国移动通信集团海南有限公司 网络故障发现方法、电子装置及计算机可读存储介质
CN109213654A (zh) * 2018-07-05 2019-01-15 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN109239265A (zh) * 2018-09-11 2019-01-18 清华大学合肥公共安全研究院 监测设备故障检测方法及装置
CN109831356A (zh) * 2019-01-29 2019-05-31 网联清算有限公司 数据处理方法、装置、系统、计算机可读存储介质
CN110277158A (zh) * 2019-05-23 2019-09-24 广州博而济信息科技有限公司 一种适合于各类呼吸机进行自动化适配并整理存储数据的方法
CN110597703A (zh) * 2018-06-13 2019-12-20 中国移动通信集团浙江有限公司 一种回归测试方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103178990A (zh) * 2011-12-20 2013-06-26 中国移动通信集团青海有限公司 一种网络设备性能监控方法及网络管理系统
CN103901306A (zh) * 2014-04-09 2014-07-02 南京航空航天大学 一种检测电网电压突变故障的方法
CN105681063A (zh) * 2014-11-18 2016-06-15 中国移动通信集团北京有限公司 一种网络指标的监控方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103178990A (zh) * 2011-12-20 2013-06-26 中国移动通信集团青海有限公司 一种网络设备性能监控方法及网络管理系统
CN103901306A (zh) * 2014-04-09 2014-07-02 南京航空航天大学 一种检测电网电压突变故障的方法
CN105681063A (zh) * 2014-11-18 2016-06-15 中国移动通信集团北京有限公司 一种网络指标的监控方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
柏东辉: "面向混合异构配用电通信网的综合监测技术", 《计算机科学与应用》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108923952A (zh) * 2018-05-31 2018-11-30 北京百度网讯科技有限公司 基于服务监控指标的故障诊断方法、设备及存储介质
CN108923952B (zh) * 2018-05-31 2021-11-30 北京百度网讯科技有限公司 基于服务监控指标的故障诊断方法、设备及存储介质
CN110597703A (zh) * 2018-06-13 2019-12-20 中国移动通信集团浙江有限公司 一种回归测试方法及装置
CN109213654A (zh) * 2018-07-05 2019-01-15 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN109213654B (zh) * 2018-07-05 2023-01-03 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN108989124A (zh) * 2018-08-10 2018-12-11 中国移动通信集团海南有限公司 网络故障发现方法、电子装置及计算机可读存储介质
CN109239265A (zh) * 2018-09-11 2019-01-18 清华大学合肥公共安全研究院 监测设备故障检测方法及装置
CN109239265B (zh) * 2018-09-11 2021-01-22 清华大学合肥公共安全研究院 监测设备故障检测方法及装置
US11385122B2 (en) 2018-09-11 2022-07-12 Hefei Institute For Public Safety Research, Tsinghua University Method and device for detecting fault of monitoring device
CN109831356A (zh) * 2019-01-29 2019-05-31 网联清算有限公司 数据处理方法、装置、系统、计算机可读存储介质
CN110277158A (zh) * 2019-05-23 2019-09-24 广州博而济信息科技有限公司 一种适合于各类呼吸机进行自动化适配并整理存储数据的方法

Similar Documents

Publication Publication Date Title
CN107426019A (zh) 网络故障确定方法、计算机设备及计算机可读存储介质
CN108418841B (zh) 基于ai的下一代关键信息基础设施网络安全态势感知系统
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN112698975A (zh) 一种微服务架构信息系统的故障根因定位方法及系统
CN105825271B (zh) 基于证据推理的卫星故障诊断与预测方法
JP2004523843A (ja) 流れ系統を診断するシステム、装置および方法
CN105975797B (zh) 一种基于模糊数据处理的产品早期故障根原因识别方法
US20220341996A1 (en) Method for predicting faults in power pack of complex equipment based on a hybrid prediction model
CN110555477A (zh) 一种市政设施故障预测方法及装置
CN111624986A (zh) 基于案例库的故障诊断方法和系统
CN108199899A (zh) 一种无线传感器网络故障检测方法、装置及系统
CN111124852A (zh) 一种基于bmc健康管理模块的故障预测方法及系统
CN103023028A (zh) 一种基于实体间依赖关系图的电网故障快速定位方法
CN115237717A (zh) 一种微服务异常检测方法和系统
CN111080484A (zh) 一种配电网异常数据监测方法及装置
CN112128950B (zh) 一种基于多种模型对比的机房温湿度预测方法及系统
CN114385403A (zh) 基于双层知识图谱架构的分布式协同故障诊断方法
CN115114124A (zh) 主机风险的评估方法及评估装置
KR20220132824A (ko) 배전설비 상태 이상 개소 감시 시스템 및 방법
CN117312972A (zh) 一种刮板输送机减速器健康状态识别方法
CN117827593A (zh) 一种基于异常识别结果确定异常原因的方法和系统
CN116346405A (zh) 基于数据统计的网络安全运维能力评估系统及方法
CN110007171A (zh) 变压器在线监测数据误报警的筛查方法及系统
CN113376562B (zh) 基于滚动时窗—fcm聚类的cvt校验方法、设备及介质
CN114003466A (zh) 一种用于微服务应用程序的故障根因定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171201

RJ01 Rejection of invention patent application after publication