CN111510345B - 一种边缘节点异常检测的方法及装置 - Google Patents
一种边缘节点异常检测的方法及装置 Download PDFInfo
- Publication number
- CN111510345B CN111510345B CN202010261367.4A CN202010261367A CN111510345B CN 111510345 B CN111510345 B CN 111510345B CN 202010261367 A CN202010261367 A CN 202010261367A CN 111510345 B CN111510345 B CN 111510345B
- Authority
- CN
- China
- Prior art keywords
- detection
- edge node
- period
- statistical
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000001514 detection method Methods 0.000 claims abstract description 470
- 230000002159 abnormal effect Effects 0.000 claims abstract description 148
- 238000004891 communication Methods 0.000 claims abstract description 126
- 230000005856 abnormality Effects 0.000 claims description 10
- 238000004140 cleaning Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 6
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 239000000523 sample Substances 0.000 description 39
- 230000008569 process Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 230000001934 delay Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0681—Configuration of triggering conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
- H04L43/0829—Packet loss
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
- H04L43/087—Jitter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提供一种边缘节点异常检测的方法及装置,获取第一边缘节点在统计周期内的探测数据包;其中,所述第一边缘节点所在区域内的各边缘节点之间按探测周期互相发送多种网络通信协议的探测数据包;根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值;根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。该方案根据统计周期的历史探测数据,得到第一边缘节点的实时网络质量,从而可以确定第一边缘节点是否发生异常,实现了对边缘节点进行异常检测的目的。
Description
技术领域
本申请实施例涉及异常检测领域,尤其涉及一种边缘节点异常检测的方法及装置。
背景技术
目前,在边缘计算的场景中,当用于执行边缘计算的边缘节点面临网络质量不佳的情形时,导致在使用边缘节点对归属于该边缘节点上的待处理的业务进行计算时,往往无法保证边缘节点在对待处理的业务进行计算过程中的稳定性和可靠性。
对于以上问题,现有技术目前无法提供一种较为准确地判定边缘节点是否发生异常的方法。
发明内容
本申请提供一种边缘节点异常检测的方法及装置,用以解决现有技术无法准确判定边缘节点是否发生异常的问题。
第一方面,本申请实施例提供一种边缘节点异常检测的方法,该方法包括:获取第一边缘节点在统计周期内的探测数据包;其中,所述第一边缘节点所在区域内的各边缘节点之间按探测周期互相发送多种网络通信协议的探测数据包;根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值;根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。
基于该方案,通过第一边缘节点向与它所在区域的各边缘节点发送多种网络通信协议的探测数据包,以及根据对探测数据包的获取情况的分析,从而对于统计周期内的每一个探测周期,很容易确定探测指标在统计周期的统计值,通过将该统计值与预设的统计值阈值进行比较,即可以判断第一边缘节点的网络质量是否发生异常。该方案根据统计周期的历史探测数据,得到第一边缘节点的实时网络质量,从而可以确定第一边缘节点是否发生异常,实现了对边缘节点进行异常检测的目的。
在一种可能的实现方法中,根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值,包括:获取在所述探测周期的所述网络通信协议下所述第一边缘节点与第二边缘节点之间的探测数据包;针对任一探测指标,根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与所述第二边缘节点在所述探测指标下的探测值;若存在不少于设定比例的第二边缘节点的探测值不满足所述探测指标的设定值,则确定所述探测周期下所述探测指标发生异常;根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值。
基于该方案,通过第一边缘节点向与它所在区域的各个边缘节点(第二边缘节点)发送多种网络通信协议的探测数据包,在每一个探测周期中,获取第一边缘节点与任一个第二边缘节点之间的探测数据包的发送情况,通过对探测数据包的发送情况的分析:若存在不少于设定比例的第二边缘节点的探测值不满足探测指标的设定值,则对于每一个探测指标,可以确定出该探测指标在该探测周期中是否发生异常。该方案通过所给出的用于确定探测指标在探测周期内是否发生异常的方法,则依据所获取的探测数据包,可以快速确定探测指标在探测周期内是否发生异常。
在一种可能的实现方法中,根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值,包括:根据所述探测周期的所述网络通信协议的探测指标的异常状态,确定所述探测指标在所述统计周期内的可用时段;根据所述探测指标在所述统计周期内的可用时段及所述探测指标的权重,确定所述探测指标在所述统计周期的统计值。
基于该方案,由于探测指标的异常状态用于表示探测指标所在的探测周期为异常时段,因此对于每一个探测指标,通过统计出统计周期内的异常时段,则可以快速确定出该探测指标在统计周期内的可用时段;通过探测指标的可用时段与权重的结合,可以得到该探测指标在统计周期的统计值。该方案通过对每一个探测指标都做统计值的计算,便于根据每一个探测指标的统计值以确定第一边缘节点的实时网络质量。
在一种可能的实现方法中,所述至少一探测指标包括下列部分或全部:丢包率、时延、网络抖动;所述多种网络通信协议包括下列部分或全部:TCP、UDP。
基于该方案,在对第一边缘节点的实时网络质量进行评估时,通过综合丢包率、时延和网络抖动等探测指标,从而使得该评估过程更全面,以及所述得到的实时网络质量也更为接近真实的实时网络质量;对于第一边缘节点所在区域内的各边缘节点,它们彼此之间会互相发送多种网络通信协议,其中包括但不限于TCP、UDP,从而得到的关于各边缘节点的实时网络质量也更为合理与真实。
在一种可能实现的方法中,所述探测指标为时延时;根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与每一个第二边缘节点之间的时延平均值;确定前N个探测周期时间中所述第一边缘节点与所述第二边缘节点之间的时延参考值;若不少于J%个第二边缘节点的时延平均值与前N个探测周期的时延参考值满足时延阈值,则确定所述探测周期下所述探测指标发生异常。
基于该方案,当探测指标为时延时,根据第一边缘节点向与它所在区域的各个边缘节点(第二边缘节点)发送多种网络通信协议的数据包的获取情况,可以确定第一边缘节点与每一个第二边缘节点之间的时延平均值;同时确定出前N个探测周期内的时延参考值,将时延平均值、时延参考值与时延阈值结合,即可以判断时延这一探测指标在探测周期内是否发生异常。
在一种可能实现的方法中,确定所述探测周期下所述探测指标发生异常之后,还包括:针对任一探测指标,确定所述探测指标的前一告警的告警时刻,若前一告警的告警时刻与当前时刻满足设定条件,则发起所述探测指标的告警信息;根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的网络质量是否发生异常,包括:根据所述探测指标在所述统计周期的统计值、所述探测指标的告警信息的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。
基于该方案,通过定义如何发起探测指标的告警信息,从而在确定第一边缘节点的网络质量是否发生异常时,除了考虑探测指标在统计周期的统计值,还进一步考虑了探测指标的告警信息的统计值,从而可以更加全面地评估第一边缘节点的网络质量。
在一种可能实现的方法中,根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值之前,还包括:从所述统计周期内的多种网络通信协议的探测数据包去除符合清洗规则的探测数据包;其中,所述清洗规则至少包括以下之一:人为因素导致网络异常、业务因素导致网络异常。
基于该方案,由于在对第一边缘节点做异常检测时,主要需要考虑由于网络质量本身导致第一边缘节点发生异常的因素(如丢包率、时延、网络抖动),而非其他一些非网络质量本身导致第一边缘节点发生异常的因素,如人为因素、业务因素,通过对这些非网络质量本身导致第一边缘节点发生异常的因素进行排除,所得到的第一边缘节点的实时网络质量可以更为接近真实的实时网络质量。
第二方面,本申请实施例提供一种边缘节点异常检测的装置,该装置包括:获取单元,用于获取第一边缘节点在统计周期内的探测数据包;其中,所述第一边缘节点所在区域内的各边缘节点之间按探测周期互相发送多种网络通信协议的探测数据包;统计值确定单元,用于根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值;异常确定单元,用于根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。
基于该方案,通过第一边缘节点向与它所在区域的各边缘节点发送多种网络通信协议的探测数据包,以及根据对探测数据包的获取情况的分析,从而对于统计周期内的每一个探测周期,很容易确定探测指标在统计周期的统计值,通过将该统计值与预设的统计值阈值进行比较,即可以判断第一边缘节点的网络质量是否发生异常。该方案根据统计周期的历史探测数据,得到第一边缘节点的实时网络质量,从而可以确定第一边缘节点是否发生异常,实现了对边缘节点进行异常检测的目的。
在一种可能的实现方法中,所述统计值确定单元具体用于:获取在所述探测周期的所述网络通信协议下所述第一边缘节点与第二边缘节点之间的探测数据包;针对任一探测指标,根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与所述第二边缘节点在所述探测指标下的探测值;若存在不少于设定比例的第二边缘节点的探测值不满足所述探测指标的设定值,则确定所述探测周期下所述探测指标发生异常;根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值。
基于该方案,通过第一边缘节点向与它所在区域的各个边缘节点(第二边缘节点)发送多种网络通信协议的探测数据包,在每一个探测周期中,获取第一边缘节点与任一个第二边缘节点之间的探测数据包的发送情况,通过对探测数据包的发送情况的分析:若存在不少于设定比例的第二边缘节点的探测值不满足探测指标的设定值,则对于每一个探测指标,可以确定出该探测指标在该探测周期中是否发生异常。该方案通过所给出的用于确定探测指标在探测周期内是否发生异常的方法,则依据所获取的探测数据包,可以快速确定探测指标在探测周期内是否发生异常。
在一种可能的实现方法中,所述统计值确定单元具体用于:根据所述探测周期的所述网络通信协议的探测指标的异常状态,确定所述探测指标在所述统计周期内的可用时段;根据所述探测指标在所述统计周期内的可用时段及所述探测指标的权重,确定所述探测指标在所述统计周期的统计值。
基于该方案,由于探测指标的异常状态用于表示探测指标所在的探测周期为异常时段,因此对于每一个探测指标,通过统计出统计周期内的异常时段,则可以快速确定出该探测指标在统计周期内的可用时段;通过探测指标的可用时段与权重的结合,可以得到该探测指标在统计周期的统计值。该方案通过对每一个探测指标都做统计值的计算,便于根据每一个探测指标的统计值以确定第一边缘节点的实时网络质量。
在一种可能的实现方法中,所述至少一探测指标包括下列部分或全部:丢包率、时延、网络抖动;所述多种网络通信协议包括下列部分或全部:TCP、UDP。
基于该方案,在对第一边缘节点的实时网络质量进行评估时,通过综合丢包率、时延和网络抖动等探测指标,从而使得该评估过程更全面,以及所述得到的实时网络质量也更为接近真实的实时网络质量;对于第一边缘节点所在区域内的各边缘节点,它们彼此之间会互相发送多种网络通信协议,其中包括但不限于TCP、UDP,从而得到的关于各边缘节点的实时网络质量也更为合理与真实。
在一种可能的实现方法中,所述探测指标为时延;所述统计值确定单元还用于:根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与每一个第二边缘节点之间的时延平均值;确定前N个探测周期时间中所述第一边缘节点与所述第二边缘节点之间的时延参考值;若不少于J%个第二边缘节点的时延平均值与前N个探测周期的时延参考值满足时延阈值,则确定所述探测周期下所述探测指标发生异常。
基于该方案,当探测指标为时延时,根据第一边缘节点向与它所在区域的各个边缘节点(第二边缘节点)发送多种网络通信协议的数据包的获取情况,可以确定第一边缘节点与每一个第二边缘节点之间的时延平均值;同时确定出前N个探测周期内的时延参考值,将时延平均值、时延参考值与时延阈值结合,即可以判断时延这一探测指标在探测周期内是否发生异常。
在一种可能的实现方法中,所述统计值确定单元还用于:针对任一探测指标,确定所述探测指标的前一告警的告警时刻,若前一告警的告警时刻与当前时刻满足设定条件,则发起所述探测指标的告警信息;所述异常确定单元具体用于:根据所述至少一探测指标在所述统计周期的统计值、所述探测指标的告警信息的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。
基于该方案,通过定义如何发起探测指标的告警信息,从而在确定第一边缘节点的网络质量是否发生异常时,除了考虑探测指标在统计周期的统计值,还进一步考虑了探测指标的告警信息的统计值,从而可以更加全面地评估第一边缘节点的网络质量。
在一种可能的实现方法中,所述统计值确定单元还用于:从所述统计周期内的多种网络通信协议的探测数据包去除符合清洗规则的探测数据包;其中,所述清洗规则至少包括以下之一:人为因素导致网络异常、业务因素导致网络异常。
基于该方案,由于在对第一边缘节点做异常检测时,主要需要考虑由于网络质量本身导致第一边缘节点发生异常的因素(如丢包率、时延、网络抖动),而非其他一些非网络质量本身导致第一边缘节点发生异常的因素,如人为因素、业务因素,通过对这些非网络质量本身导致第一边缘节点发生异常的因素进行排除,所得到的第一边缘节点的实时网络质量可以更为接近真实的实时网络质量。
第三方面,本申请实施例提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如第一方面任一所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面任一所述的方法。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种可能的系统架构示意图;
图2为本申请实施例提供的一种边缘节点异常检测的方法;
图3为本申请实施例提供的一种边缘节点异常检测的装置。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
如图1所示,为本申请实施提供一种可能的系统架构示意图,包括大数据平台101和多个不同区域边缘节点102。作为示例,本申请实施例中,该系统架构包括了2个不同区域边缘节点102。
其中,大数据平台101可以为具有强大的数据存储性能、强大的数据处理性能的一台独立服务器或者由多台服务器组成的服务器集群。
其中一个区域的边缘节点102中具体包括的边缘节点A、边缘节点B、边缘节点C和边缘节点D,它们为同一设定区域内同运营商的边缘计算节点,用于对它们所在区域的边缘业务进行处理。其中,对于边缘节点A、边缘节点B、边缘节点C和边缘节点D这4个边缘节点,它们彼此之间可以互相发送多种网络通信协议的探测数据包,以实现对任一个边缘节点的实时网络质量进行评估。
其中另一个区域的边缘节点102具体包括边缘节点S、边缘节点P、边缘节点O和边缘节点T,它们为另一同一设定区域内同运营商的边缘计算节点,用于对它们所在区域的边缘业务进行处理。其中,对于边缘节点S、边缘节点P、边缘节点O和边缘节点T这4个边缘节点,它们彼此之间可以互相发送多种网络通信协议的探测数据包,以实现对任一个边缘节点的实时网络质量进行评估。
需要说明的是,本申请实施例不对由边缘节点A、边缘节点B、边缘节点C和边缘节点D构成的同一区域内所存在的边缘节点数目做限定。作为示例,本申请实施例中以边缘节点A、边缘节点B、边缘节点C和边缘节点D这4个边缘节点为同一区域的同运营商的边缘节点为例进行说明。
在以上边缘节点A、边缘节点B、边缘节点C和边缘节点D这4个边缘节点这4个边缘节点彼此之间互相发送多种网络通信协议的探测数据包时,大数据平台101可以主动获取一个或多个边缘节点在实时网络质量探测过程中的网络质量探测数据;也可以由任一个或多个边缘节点主动向大数据平台101上报各自的网络质量探测数据,具体不做限定。
在大数据平台101获取到一个或多个边缘节点的网络质量探测数据后,即可以根据所获取的网络质量探测数据对这一个或多个边缘节点的实时网络质量进行评估。当大数据平台101确定边缘节点的实时网络质量低于预设网络质量时,也即边缘节点发生异常,此时大数据平台101会在第一时间发出告警,以提示维护人员对发生异常的边缘节点上的业务进行适应调整,进而可以保证边缘节点对外界提供服务的性能,也减小由于边缘节点网络质量不佳时对客户业务产生的影响。
基于图1所示意的系统架构,图2为本申请实施例提供的一种边缘节点异常检测的方法,该方法包括以下步骤:
步骤201,获取第一边缘节点在统计周期内的探测数据包;其中,所述第一边缘节点所在区域内的各边缘节点之间按探测周期互相发送多种网络通信协议的探测数据包。
这里的第一边缘节点可以为图1所示意的任一边缘节点,比如第一边缘节点可以为边缘节点A,可以为边缘节点B,可以为边缘节点C,也可以为边缘节点的D,具体不做限定;作为示例,本申请实施例中以边缘节点A作为第一边缘节点来进行说明。
由于本申请实施例中需要确定第一边缘节点的实时网络质量,因此可以根据第一边缘节点历史的网络质量探测数据来对第一边缘节点在当前时刻的实时网络质量作出评估。比如可以根据第一边缘节点在刚刚过去的一周、一个月或者更长的一段历史时间的网络质量探测数据来对第一边缘节点在当前时刻的实时网络质量作出评估,也即,这里的统计周期为刚刚过去的一周,可以为刚刚过去的一个月,也可以为其他历史时间,具体不做限定;作为示例,本申请实施例中以刚刚过去的一个月(以30天计)作为统计周期来进行说明。
在评估第一边缘节点的实时网络质量时,可以通过第一边缘节点向它所在区域内的同运营商的其他边缘节点、周期性地发送多种网络通信协议的探测数据包,以及第一边缘节点接收它所在区域内的同运营商的其他边缘节点、周期性地发送给自己的多种网络通信协议的探测数据包;当大数据平台101获取到第一边缘节点在进行网络质量探测过程中的探测数据包后,则可以根据所获取到的网络质量探测数据、来对第一边缘节点的实时网络质量进行评估。这里的探测周期可以为1分钟,还可以为其他时长,具体不做限定,作为示例,本申请实施例中以1分钟作为一个探测周期来进行说明。
因此,当1分钟作为一个探测周期,历史30天作为统计周期,则该统计周期内包括了43200个探测周期(60*24*30=43200)。
可选的,多种网络通信协议包括以下部分或全部:TCP、UDP。作为示例,本申请实施例中以TCP和UDP同时被使用来进行说明。
对于以上内容,举如下例子进行说明。
设当前时刻为2020年3月30日09:06:00,那么在确定边缘节点A在当前时刻(2020年3月30日09:06:00)的实时网络质量时,则需要获取当前时刻之前的历史30天(2020年3月1日09:06:00至2020年3月30日09:05:00)的实时网络质量探测数据,然后基于历史30天的实时网络质量探测数据,大数据平台101即可以确定边缘节点A在当前时刻(2020年3月30日09:06:00)的实时网络质量如何,再根据实时网络质量与预设的网络质量阈值,最终确定是否需要在当前时刻来重新调整已经分在边缘节点A的业务。
需要说明的是,这里的当前时刻——2020年3月30日09:06:00,实际上还未真实到来,本申请实施例中主要是为了评估当前时刻的实时网络质量,因此需要结合当前时刻之前的历史30天的实时网络质量探测数据来对即将到来的当前时刻的实时网络质量作出评估。
在统计周期的每一个探测周期内,可以通过以下方式得到边缘节点A的实时网络质量探测数据:
对于边缘节点A,作为探测数据包的发出方,它将用TCP的网络通信协议、以每分钟100个探测数据包的发包频率,分别向边缘节点B、边缘节点C和边缘节点D进行探测数据包的发送;同时,在同一个探测周期内,边缘节点A还会用UDP的网络通信协议、以每分钟100个探测数据包的发包频率,分别向边缘节点B、边缘节点C和边缘节点D进行探测数据包的发送。
对于边缘节点A,作为探测数据包的接收方,在同一个探测周期内,它会接收到边缘节点B、边缘节点C和边缘节点D分别用TCP的网络通信协议、以每分钟100个探测数据包的发包频率,向自己发送的探测数据包;同时,在同一个探测周期内,它还会接收到边缘节点B、边缘节点C和边缘节点D分别用UDP的网络通信协议、以每分钟100个探测数据包的发包频率,向自己发送的探测数据包。
由于边缘节点之间网络质量存在差异的原因,对于边缘节点A,无论是作为探测数据包的发出方还是作为探测数据包的接收方,在同一个探测周期内会得到不同的网络质量探测数据,具体表现为探测指标对应的值不同。
可选的,所述探测指标包括下列部分或全部:丢包率、时延、网络抖动。
举个例子,边缘节点A作为探测数据包的发出方,那么:
在同一个探测周期内,由边缘节点A向边缘节点B发送TCP的网络通信协议的探测数据包的过程中,边缘节点B实际共接收到99个探测数据包,因此对应的丢包率为1%;由边缘节点A向边缘节点C发送TCP的网络通信协议的探测数据包的过程中,边缘节点C实际共接收到98个探测数据包,因此对应的丢包率为2%;由边缘节点A向边缘节点D发送TCP的网络通信协议的探测数据包的过程中,边缘节点D实际共接收到99个探测数据包,因此对应的丢包率也为1%。
在同一个探测周期内,由边缘节点A向边缘节点B发送TCP的网络通信协议的探测数据包的过程中,通过统计每一个探测数据包在实际发送过程中的时延,然后计算探测数据包的时延平均值,并将计算得到的时延平均值作为边缘节点A向边缘节点B发送TCP的网络通信协议的探测数据包的过程的时延,比如对应的时延为25毫秒;由边缘节点A向边缘节点C发送TCP的网络通信协议的探测数据包的过程中,通过统计每一个探测数据包在实际发送过程中的时延,然后计算探测数据包的时延平均值,并将计算得到的时延平均值作为边缘节点A向边缘节点C发送TCP的网络通信协议的探测数据包的过程的时延,比如对应的时延为40毫秒;由边缘节点A向边缘节点D发送TCP的网络通信协议的探测数据包的过程中,通过统计每一个探测数据包在实际发送过程中的时延,然后计算探测数据包的时延平均值,并将计算得到的时延平均值作为边缘节点A向边缘节点D发送TCP的网络通信协议的探测数据包的过程的时延,比如对应的时延为38毫秒。
在同一个探测周期内,由边缘节点A向边缘节点B发送TCP的网络通信协议的探测数据包的过程中,通过统计每一个探测数据包在实际发送过程中的时延,然后计算探测数据包的时延平均值,进一步根据每一个探测数据包在实际发送过程中的时延和时延平均值计算时延标准差,并将计算得到的时延标准差作为边缘节点A向边缘节点B发送TCP的网络通信协议的探测数据包的过程的网络抖动,比如对应的时延标准差为15;由边缘节点A向边缘节点C发送TCP的网络通信协议的探测数据包的过程中,通过统计每一个探测数据包在实际发送过程中的时延,然后计算探测数据包的时延平均值,进一步根据每一个探测数据包在实际发送过程中的时延和时延平均值计算时延标准差,并将计算得到的时延标准差作为边缘节点A向边缘节点C发送TCP的网络通信协议的探测数据包的过程的网络抖动,比如对应的时延标准差为85;由边缘节点A向边缘节点D发送TCP的网络通信协议的探测数据包的过程中,通过统计每一个探测数据包在实际发送过程中的时延,然后计算探测数据包的时延平均值,进一步根据每一个探测数据包在实际发送过程中的时延和时延平均值计算时延标准差,并将计算得到的时延标准差作为边缘节点A向边缘节点D发送TCP的网络通信协议的探测数据包的过程的网络抖动,比如对应的时延标准差为55。
需要说明的是,对于同一个探测周期内,边缘节点A作为探测数据包的发出方,它用UDP的网络通信协议分别向边缘节点B、边缘节点C和边缘节点D发送探测数据的过程以及数据处理过程可以参考该探测周期内边缘节点A用TCP的网络通信协议向外发送探测数据包的过程,在此不赘述;另外,对于同一个探测周期内,边缘节点A作为探测数据包的接收方,它分别接收到边缘节点B、边缘节点C和边缘节点D以TCP/UDP的网络通信协议向自己发送探测数据包的数据处理过程,在此也不赘述。
步骤202,根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值。
可选的,获取在所述探测周期的所述网络通信协议下所述第一边缘节点与第二边缘节点之间的探测数据包;针对任一探测指标,根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与所述第二边缘节点在所述探测指标下的探测值;若存在不少于设定比例的第二边缘节点的探测值不满足所述探测指标的设定值,则确定所述探测周期下所述探测指标为异常状态;根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值。
作为示例,对于统计周期内的每一个探测周期,获取到边缘节点A在该探测周期内、分别向边缘节点B、边缘节点C和边缘节点D发送TCP的网络通信协议的探测数据包的网络质量探测数据,通过对该探测周期的TCP的网络通信协议探测数据包的分析,即可以得到边缘节点A的丢包率、时延和网络抖动等各探测指标是否发生异常的结论。
如前述的例子,同一个探测周期中,边缘节点A分别向边缘节点B、边缘节点C和边缘节点D发送TCP的网络通信协议的探测数据包时,该探测周期中的丢包率分别为1%、2%和1%,由于该探测周期中涉及到3条探测链路(边缘节点A向边缘节点B发送探测数据包为一条探测链路,边缘节点A向边缘节点C发送探测数据包为一条探测链路、边缘节点A向边缘节点D发送探测数据包为一条探测链路;下文如有出现,不再一一描述)的丢包率,因此,需要综合这3条探测链路的丢包率,以确定边缘节点A在该探测周期中、基于TCP的网络通信协议的“丢包率”这一探测指标是否发生异常。
同理,在同一个探测周期中,边缘节点A分别向边缘节点B、边缘节点C和边缘节点D发送TCP的网络通信协议的探测数据包时,该探测周期中的时延分别为25毫秒、40毫秒和38毫秒,由于该探测周期中涉及到3条探测链路的时延,因此,需要综合这3条探测链路的时延,以确定边缘节点A在该探测周期中、基于TCP的网络通信协议的“时延”这一探测指标是否发生异常。
同理,在同一个探测周期中,边缘节点A分别向边缘节点B、边缘节点C和边缘节点D发送TCP的网络通信协议的探测数据包时,该探测周期中的时延标准差分别为15、85和55,由于该探测周期中涉及到3条探测链路的网络抖动,因此,需要综合这3条探测链路的网络抖动,以确定边缘节点A在该探测周期中、基于TCP的网络通信协议的“网络抖动”这一探测指标是否发生异常。
需要说明的是,本申请实施例中不再赘述同一个探测周期中、边缘节点A基于UDP的网络通信协议的丢包率、时延和网络抖动这些探测指标的异常状态;同时,本申请实施例中也不再赘述同一个探测周期中、边缘节点A作为探测数据包的接收方,它在基于TCP/UDP的网络通信协议的丢包率、时延和网络抖动这些探测指标的异常状态。
如前述的例子,同一个探测周期中,边缘节点A分别向边缘节点B、边缘节点C和边缘节点D发送TCP的网络通信协议的探测数据包时,该探测周期中的丢包率分别为1%、2%和1%;则对于丢包率这一探测指标来说,当满足以下规则:存在至少K%个探测链路的丢包率超过L%,则确定边缘节点A在该探测周期内、基于TCP的网络通信协议的丢包率指标发生异常。比如,当K取值为50,L取值为2时,则确定丢包率指标发生异常的规则可以被理解为:存在至少2(虽然3*50%=1.5,但根据实际意义,因此这里的探测链路的个数取值为2)个探测链路的丢包率大于等于2%时,则丢包率指标发生异常。由于边缘节点A在该探测周期内、基于TCP的网络通信协议的丢包率分别为1%、2%和1%,因此,可以确定边缘节点A的丢包率指标在该探测周期内并未发生异常。其中,这里的边缘节点A为第一边缘节点,这里的边缘节点B、边缘节点C和边缘节点D均为第二边缘节点。
如前述的例子,同一个探测周期中,边缘节点A分别向边缘节点B、边缘节点C和边缘节点D发送TCP的网络通信协议的探测数据包时,该探测周期中的时延标准差分别为15、85和55;则对于网络抖动这一探测指标来说,当满足以下规则:存在至少Q%个探测链路的时延标准差超过参数X,则确定边缘节点A在该探测周期内、基于TCP的网络通信协议的网络抖动指标发生异常。比如,当Q取值为50,参数X取值为40时,则确定网络抖动指标发生异常的规则可以被理解为:存在至少2(虽然3*50%=1.5,但根据实际意义,因此这里的探测链路的个数取值为2)个探测链路的时延标准差大于等于40时,则网络抖动指标发生异常。由于边缘节点A在该探测周期内、基于TCP的网络通信协议的时延标准差分别为15、85和55,因此,可以确定边缘节点A的网络抖动指标在该探测周期内发生异常。
可选的,所述探测指标为时延时;根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与每一个第二边缘节点之间的时延平均值;确定前N个探测周期时间中所述第一边缘节点与所述第二边缘节点之间的时延参考值;若不少于J%个第二边缘节点的时延平均值与前N个探测周期的时延参考值满足时延阈值,则确定所述探测周期下所述探测指标发生异常。
如前述的例子,同一个探测周期中,边缘节点A分别向边缘节点B、边缘节点C和边缘节点D发送TCP的网络通信协议的探测数据包时,该探测周期中的时延分别为25毫秒、40毫秒和38毫秒;则对于时延这一探测指标来说,当满足以下规则:存在不少于J%个探测链路的时延平均值与前N个探测周期时间内的时延参考值满足时延阈值,则确定边缘节点A在该探测周期内、基于TCP的网络通信协议的时延指标发生异常。
比如,当J取值为50;N取值为100;时延参考值可以由业务人员根据实际经验进行设定,比如可以被定义为前100个探测周期时间内的每一个探测周期对应的时延(100个)所构成的中位数:如对于由边缘节点A向边缘节点B发送TCP的网络通信协议的链路,它的前100个探测周期时间内的每一个探测周期对应的时延(100个)所构成的中位数为50毫秒,对于由边缘节点A向边缘节点C发送TCP的网络通信协议的链路,它的前100个探测周期时间内的每一个探测周期对应的时延(100个)所构成的中位数为40毫秒,对于由边缘节点A向边缘节点D发送TCP的网络通信协议的链路,它的前100个探测周期时间内的每一个探测周期对应的时延(100个)所构成的中位数为24毫秒;时延阈值也可以由业务人员根据实际经验进行设定,比如可以定义为30毫秒。则确定时延指标发生异常的规则可以被理解为:存在至少2(虽然3*50%=1.5,但根据实际意义,因此这里的探测链路的个数取值为2)个探测链路的时延平均值与对应链路的前100个探测周期时间内的时延参考值的差值的绝对值大于等于时延阈值时,则时延指标发生异常。由于边缘节点A在该探测周期内、基于TCP的网络通信协议的时延分别为25毫秒、40毫秒和38毫秒,因此,可以确定边缘节点A的时延指标在该探测周期内并未发生异常。
需要说明的是,本申请实施例中不再赘述同一个探测周期中、边缘节点A基于UDP的网络通信协议的丢包率、时延和网络抖动这些探测指标是否发生异常的过程;同时,本申请实施例中也不再赘述同一个探测周期中、边缘节点A作为探测数据包的接收方,它在基于TCP/UDP的网络通信协议的丢包率、时延和网络抖动这些探测指标是否发生异常的过程。
需要说明的是,根据如何确定边缘节点A在同一个探测周期内各探测指标是否发生异常的方法,遵照相同的方法,可以确定出边缘节点A在统计周期(共43200个探测周期)中的每一个探测周期,它的各探测指标是否发生异常。
可选的,根据所述探测周期的所述网络通信协议的探测指标的异常状态,确定所述探测指标在所述统计周期内的可用时段;根据所述探测指标在所述统计周期内的可用时段及所述探测指标的权重,确定所述探测指标在所述统计周期的统计值。
如前述的例子,对于统计周期(2020年3月1日09:06:00至2020年3月30日09:05:00)中的每一个探测周期,可以统计出边缘节点A分别向边缘节点B、边缘节点C和边缘节点D均以相同发包频率(1分钟发送100个探测数据包)、发送TCP的网络通信协议的探测数据包时,丢包率是否发生异常、时延是否发生异常以及网络抖动是否发生异常。如果该探测周期中,丢包率发生异常,时延并未发生异常,网络抖动发生异常,则该探测周期对于丢包率指标则为异常时段,对于时延则不是异常时段,对于网络抖动为异常时段。
因此,可以得出在统计周期内由边缘节点A向其他边缘节点(边缘节点B、边缘节点C和边缘节点D)发送TCP的网络通信协议的丢包率的异常时长T11,时延的异常时长T21和网络抖动的异常时长T31。其中,异常时长为所有异常时段的累加。
同理,可以得到由边缘节点A向其他边缘节点(边缘节点B、边缘节点C和边缘节点D)发送UDP的网络通信协议的丢包率的异常时长T41,时延的异常时长T51和网络抖动的异常时长T61。
根据统计周期与异常时长,可以分别得到由边缘节点A向其他边缘节点(边缘节点B、边缘节点C和边缘节点D)发送TCP的网络通信协议的丢包率的可用时段T12(T12=43200-T11),时延的可用时段T22(T22=43200-T21)和网络抖动的可用时段T32(T32=43200-T31)。其中,可用时段为统计周期与异常时长的差值。
同理,可以得到由边缘节点A向其他边缘节点(边缘节点B、边缘节点C和边缘节点D)发送UDP的网络通信协议的丢包率的可用时段T42(T42=43200-T41),时延的可用时段T52(T52=43200-T51)和网络抖动的可用时段T62(T62=43200-T61)。其中,可用时段为统计周期与异常时长的差值。
可选的,根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值之前,还包括:从所述统计周期内的多种网络通信协议的探测数据包去除符合清洗规则的探测数据包;其中,所述清洗规则至少包括以下之一:人为因素导致网络异常、业务因素导致网络异常。
由于边缘节点相对于传统云计算数据中心具有数量多、分布广的特点,同时也会带来相对不稳定的问题,例如会有相对较多的割接和节点跑高(网络拥塞)等情况导致网络质量不佳。因此,本申请实施例中在评估边缘节点的实时网络质量时,希望获取到的是真的由网络质量因素导致的网络质量不佳的数据,而不希望获取到非网络质量因素导致网络质量不佳的数据。
由此,在评估边缘节点的实时网络质量时,还需要对所获取的数据进行清洗,主要表现为对人为因素导致网络异常和业务因素导致网络异常的数据进行清洗,也即将割接、节点跑高(网络拥塞)和极少数人为失误等对应时间的网络质量异常数据从原始数据中排除。
举个例子,比如由于在统计周期(2020年3月1日09:06:00至2020年3月30日09:05:00)中的一小段时间,如在2020年3月12日10:00:00至2020年3月12日11:00:00这60分钟期间,由于操作人员的失误,误拔了插座,导致边缘节点A在这60分钟内不能向边缘节点B、边缘节点C和边缘节点D发送探测数据包了。因此,边缘节点A在这60分钟内的每一分钟的实时网络质量都不满足预设网络质量,也即边缘节点A发生了网络异常;但由于这60分钟并非是由网络质量因素导致的边缘节点A发生网络异常,而是由人为因素导致的边缘节点A发生网络异常,因此在统计边缘节点A的可用时段时,需要扣除这种已知的异常时长T。
比如,在确定由边缘节点A向其他边缘节点(边缘节点B、边缘节点C和边缘节点D)发送TCP的网络通信协议的丢包率的可用时段T12、时延的可用时段T22和网络抖动的可用时段T32时,需要进行校正。通过校正后,由边缘节点A向其他边缘节点(边缘节点B、边缘节点C和边缘节点D)发送TCP的网络通信协议的丢包率的可用时段为T12’(T12’=(43200-(T11-T))=43200-T11+T=T12+T),时延的可用时段为T22’(T22’=(43200-(T21-T))=43200-T21+T=T22+T),网络抖动的可用时段为T32’(T32’=(43200-(T31-T))=43200-T31+T=T32+T)。
同理,在确定由边缘节点A向其他边缘节点(边缘节点B、边缘节点C和边缘节点D)发送UDP的网络通信协议的丢包率的可用时段T42、时延的可用时段T52和网络抖动的可用时段T62时,需要进行校正。通过校正后,由边缘节点A向其他边缘节点(边缘节点B、边缘节点C和边缘节点D)发送UDP的网络通信协议的丢包率的可用时段为T42’(T42’=(43200-(T41-T))=43200-T41+T=T42+T),时延的可用时段为T52’(T52’=(43200-(T51-T))=43200-T51+T=T52+T),网络抖动的可用时段为T62’(T62’=(43200-(T61-T))=43200-T61+T=T62+T)。
因此,对边缘节点A以相同的发包频率(1分钟100个探测数据包)分别向边缘节点B、边缘节点C和边缘节点D发送基于TCP的网络通信协议的探测数据包和基于UDP的网络通信协议的探测数据包的过程,可以得到在统计周期中基于TCP的网络通信协议的丢包率的可用时段T12’、时延的可用时段T22’和网络抖动的可用时段T32’,以及,可以得到在统计周期中基于UDP的网络通信协议的丢包率的可用时段T42’、时延的可用时段T52’和网络抖动的可用时段T62’。
在得到上述的多个可用时段后,进一步可以计算每一个可用时段对应的百分比Q。如:
对于可用时段为T12’,它的可用时段对应的百分比Q1=(T12’/43200)*100%;
对于可用时段为T22’,它的可用时段对应的百分比Q2=(T22’/43200)*100%;
对于可用时段为T32’,它的可用时段对应的百分比Q3=(T32’/43200)*100%;
对于可用时段为T42’,它的可用时段对应的百分比Q4=(T42’/43200)*100%;
对于可用时段为T52’,它的可用时段对应的百分比Q5=(T52’/43200)*100%;
对于可用时段为T62’,它的可用时段对应的百分比Q6=(T62’/43200)*100%。
需要说明的是,可用时段不同,Q可以表现为不同的形式,如Q1、Q2、Q3、Q4、Q5和Q6,但实质不变。
进一步的,在得到上述的多个可用时段对应的百分比后,还可以根据预设的百分比与得分的对应关系,确定每一个可用时段对应的得分。比如:
当百分比Q>=99.99%时,则得分D=100;
当百分比99.95%<=Q<=99.99%时,则得分D=80;
当百分比99.9%<=Q<=99.95%时,则得分D=50;
当百分比Q<99.9%时,则得分D=0。
需要说明的是,预设的百分比与得分的对应关系是由业务人员根据实际工作经验和业务需要而进行设定的。
比如,通过计算,得到的Q1、Q2、Q3、Q4、Q5和Q6分别为100%,99.97%,99.0%,99.999%,99.94%,100%,则Q1、Q2、Q3、Q4、Q5和Q6对应的得分分别为100,80,0,100,50和100。
在统计周期(2020年3月1日09:06:00至2020年3月30日09:05:00)中,边缘节点A的基于TCP的网络通讯协议的丢包率指标的得分(100)、时延指标的得分(80)和网络抖动指标的得分(0),以及边缘节点A基于UDP的网络通讯协议的丢包率指标的得分(100)、时延指标的得分(50)和网络抖动指标的得分(100),均可以计算得到,具体得分参见括号的数值。那么接下来根据得分与探测指标的权重,即可以确定每一个探测指标的统计值。
比如,可以根据业务人员的经验,预先设定各探测指标的权重:如边缘节点A的基于TCP的网络通讯协议的丢包率指标的权重为A1、时延指标的权重为A2和网络抖动指标的权重为A3,以及边缘节点A的基于UDP的网络通讯协议的丢包率指标的权重为A4、时延指标的权重为A5和网络抖动指标的权重为A6。则:
对于边缘节点A的基于TCP的网络通讯协议的丢包率指标的统计值为100*A1;
对于边缘节点A的基于TCP的网络通讯协议的时延指标的统计值为80*A2;
对于边缘节点A的基于TCP的网络通讯协议的网络抖动指标的统计值为0*A3;
对于边缘节点A的基于UDP的网络通讯协议的丢包率指标的统计值为100*A4;
对于边缘节点A的基于UDP的网络通讯协议的时延指标的统计值为50*A5;
对于边缘节点A的基于UDP的网络通讯协议的网络抖动指标的统计值为100*A6。
在使用以上6个维度的探测指标来评估边缘节点A的实时网络质量之余,还需要使用告警信息这一维度的探测指标来对边缘节点A的实时网络质量进行评估。
可选的,确定所述探测周期下所述探测指标发生异常之后,还包括:针对任一探测指标,确定所述探测指标的前一告警的告警时刻,若前一告警的告警时刻与当前时刻满足设定条件,则发起所述探测指标的告警信息。
如前述的例子,对于统计周期(2020年3月1日09:06:00至2020年3月30日09:05:00)中的每一个探测周期,可以获取到在该探测周期内、由边缘节点A作为探测数据包的发出方时,它在基于TCP/UDP的网络通信协议的丢包率指标、时延指标和网络抖动指标的数据;同时,也可以获取到在该探测周期内、由边缘节点A作为探测数据包的接收方,它在基于TCP/UDP的网络通信协议的丢包率指标、时延指标和网络抖动指标的数据。
在得到边缘节点A分别作为探测数据包的发出方(又称为出方向)和探测数据包的接收方(又称为入方向)、发出和接收基于TCP/UDP的网络通信协议的探测数据包过程中的丢包率指标、时延指标和网络抖动指标的数据后,则可以根据TCP的网络通信协议的丢包率指标、或者根据TCP的网络通信协议的时延指标、或者根据TCP的网络通信协议的网络抖动指标、或者根据UDP的网络通信协议的丢包率指标、或者根据UDP的网络通信协议的时延指标、或者根据UDP的网络通信协议的网络抖动指标来判断边缘节点A在该探测周期的实时网络质量是否发生异常,具体不做限定。
作为示例,以根据TCP的网络通信协议的丢包率指标来判断边缘节点A在该探测周期的实时网络质量是否发生异常为例,其规则为:若边缘节点A在该探测周期的出方向或者入方向存在超过K%个探测链路的丢包率超过L%时,则确定边缘节点A在该探测周期的实时网络质量发生异常。
以上方法与前述的确定丢包率是否发生异常的逻辑相似,二者区别仅在于:在确定丢包率是否发生异常时,仅需要考虑边缘节点A作为探测数据包的发出方即可;而在确定任一个探测周期的实时网络质量是否发生异常时,既需要考虑边缘节点A作为探测数据包的发出方,还需要考虑边缘节点A作为探测数据包的接收方。
因此,对于统计周期——2020年3月1日09:06:00至2020年3月30日09:05:00,可以确定它的每一个探测周期的实时网络质量是否发生异常。
例如,根据以上判定边缘节点A在每一个探测周期的实时网络质量是否发生异常的方法,设可以得出:边缘节点A在2020年3月1日09:06:00这一探测周期的实时网络质量未发生异常,它在2020年3月1日09:07:00这一探测周期的实时网络质量发生异常,它在2020年3月1日09:08:00这一探测周期的实时网络质量发生异常,它在2020年3月1日09:09:00这一探测周期的实时网络质量未发生异常,它在2020年3月1日09:10:00这一探测周期的实时网络质量发生异常;且业务人员可以根据实际工作经验得到以下发出异常告警的规则:连续5个探测周期内,若存在至少3个探测周期的实时网络质量发生异常,则在第6个探测周期发出一次告警。因此,根据边缘节点A在2020年3月1日09:06:00至2020年3月1日09:10:00这连续5个探测周期的实时网络质量数据(3个探测周期的实时网络质量发生异常和2个探测周期的实时网络质量未发生异常)以及这个预设的告警规则,则可以在2020年3月1日09:11:00这一探测周期发出一次告警。
以上设置了告警规则,接下来需要确定告警收敛规则:若最新探测周期的网络质量发生异常,但最新探测周期对应的时刻与上一告警时刻相隔的时间小于预设时长,则最新探测周期并不发出新一次的告警,只更新上一告警时刻;若最新探测周期对应的时刻与上一告警时刻相隔的时间大于等于预设时长时,则将最新探测周期的网络质量异常作为新一次的告警,同时告警时刻也更新为最新探测周期对应的时刻。其中,预设时长可以由业务人员根据实际工作经验进行设定。作为示例,本申请实施例中以预设时长是10分钟为例,下文不赘述。
如前述的例子,若对于2020年3月1日09:12:00这一最新探测周期,它的实时网络质量被确定为发生异常,但由于2020年3月1日09:12:00这一时刻与上一告警时刻2020年3月1日09:11:00相隔的时长小于预设时长10分钟,则2020年3月1日09:12:00这一最新探测周期并不会发出新一次的告警,而只是将2020年3月1日09:11:00这一告警时刻记为2020年3月1日09:12:00这一最新探测周期的告警时刻;同理,对于2020年3月1日09:13:00至2020年3月1日09:20:00这连续的8个探测周期,即使其中的一个或者一些探测周期的实时网络质量也被确定为发生异常,但依然不会发出新一次的告警。对于2020年3月1日09:21:00这一最新探测周期,若它的实时网络质量被确定为发生异常,由于2020年3月1日09:21:00这一时刻与上一告警时刻2020年3月1日09:11:00相隔的时长等于预设时长,则2020年3月1日09:21:00这一最新探测周期将会发出新一次的告警,并且告警时刻也将会被更新为2020年3月1日09:21:00这一时刻。
像这样,对于统计周期中的每一天:2020年3月1日09:06:00至2020年3月2日09:05:00为一天,2020年3月2日09:06:00至2020年3月3日09:05:00为一天,2020年3月3日09:06:00至2020年3月4日09:05:00为一天……2020年3月29日09:06:00至2020年3月30日09:05:00为一天,一共30天,依据上述的告警规则和告警收敛规则,即可得到关于边缘节点A在统计周期中(共30天)共有多少天发出了异常告警。其中,对于30天中的每一天来说,但凡这一天发出了哪怕一次告警,则可以将这一天累加到边缘节点A的异常告警的天数中。
基于上述得到的边缘节点A的告警天数,以及预设的告警天数F与得分D的对应关系,则可以得到关于边缘节点A在统计周期内的得分。比如:
当F=0,则得分D=100;
当F=1,则得分D=80;
当F=2,则得分D=50;
当F>=3,则得分D=0。
需要说明的是,预设的告警天数F与得分D的对应关系是由业务人员根据实际工作经验和业务需要而进行设定的。
比如,边缘节点A在统计周期——2020年3月1日09:06:00至2020年3月30日09:05:00中的,它的告警天数有2天,则边缘节点A的告警信息得分为50。
接下来,根据预先设定的告警信息的权重为A7,则对于边缘节点A,它的告警信息的统计值为50*A7。
步骤203,根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的网络质量是否发生异常。
可选的,根据所述探测指标在所述统计周期的统计值、所述探测指标的告警信息的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。
如前述的例子,关于边缘节点A,它的统计值共7项(其中6项为探测指标在统计周期的统计值,1项为探测指标的告警信息的统计值),分别如下:
基于TCP的网络通讯协议的丢包率指标的统计值为100*A1,基于TCP的网络通讯协议的时延指标的统计值为80*A2,基于TCP的网络通讯协议的网络抖动指标的统计值为0*A3,UDP的网络通讯协议的丢包率指标的统计值为100*A4,基于UDP的网络通讯协议的时延指标的统计值为50*A5,基于UDP的网络通讯协议的网络抖动指标的统计值为100*A6,以及告警信息的统计值为50*A7。
基于以上7项统计值,通过对这7项统计值求和值,最后得到的和值即为边缘节点A在当前时刻——2020年3月30日09:06:00的实时网络质量。作为示例,本申请实施例中,可以设以上7项统计值的和值为98,下文不赘述。
这里的预设的统计值阈值可以为业务人员根据实际工作经验进行设定,比如为100。
如前述的例子,由于边缘节点A在当前时刻——2020年3月30日09:06:00的实时网络质量为98,小于预设的统计值阈值100,因此可以确定边缘节点A的实时网络质量在当前时刻发生异常。
由于是通过当前时刻——2020年3月30日09:06:00之前的历史30天的实时网络质量来评估2020年3月30日09:06:00这一时刻的实时网络质量(可以理解的是,2020年3月30日09:06:00这一时刻还未真实发生),因此在评估出边缘节点A即将要处于的2020年3月30日09:06:00这一时刻的实时网络质量低于预设网络质量后,也即边缘节点A将会在2020年3月30日09:06:00这一时刻发生异常,从而可以提示业务人员及时地对已经分配在边缘节点A上的客户业务进行调整,以减少由于边缘节点A的网络质量异常所导致的客户业务无法按质按量的施行,增强了客户体验感。
基于同样的构思,本申请实施例还提供一种边缘节点异常检测的装置。
如图3所示,该装置包括:
获取单元301,用于获取第一边缘节点在统计周期内的探测数据包;其中,所述第一边缘节点所在区域内的各边缘节点之间按探测周期互相发送多种网络通信协议的探测数据包;
统计值确定单元302,用于根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值;
异常确定单元303,用于根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。
进一步地,对于该装置,统计值确定单元302,具体用于:获取在所述探测周期的所述网络通信协议下所述第一边缘节点与第二边缘节点之间的探测数据包;针对任一探测指标,根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与所述第二边缘节点在所述探测指标下的探测值;若存在不少于设定比例的第二边缘节点的探测值不满足所述探测指标的设定值,则确定所述探测周期下所述探测指标发生异常;根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值。
进一步地,对于该装置,统计值确定单元302,具体用于:根据所述探测周期的所述网络通信协议的探测指标的异常状态,确定所述探测指标在所述统计周期内的可用时段;根据所述探测指标在所述统计周期内的可用时段及所述探测指标的权重,确定所述探测指标在所述统计周期的统计值。
进一步的,对于该装置,所述至少一探测指标包括下列部分或全部:丢包率、时延、网络抖动;所述多种网络通信协议包括下列部分或全部:TCP、UDP。
进一步的,对于该装置,所述探测指标为时延;所述统计值确定单元302,还用于:根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与每一个第二边缘节点之间的时延平均值;确定前N个探测周期时间中所述第一边缘节点与所述第二边缘节点之间的时延参考值;若不少于J%个第二边缘节点的时延平均值与前N个探测周期的时延参考值满足时延阈值,则确定所述探测周期下所述探测指标发生异常。
进一步的,对于该装置,所述统计值确定单元302,还用于:针对任一探测指标,确定所述探测指标的前一告警的告警时刻,若前一告警的告警时刻与当前时刻满足设定条件,则发起所述探测指标的告警信息;所述异常确定单元303,具体用于:根据所述探测指标在所述统计周期的统计值、所述探测指标的告警信息的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。
进一步的,对于该装置,所述统计值确定单元302,还用于:从所述统计周期内的多种网络通信协议的探测数据包去除符合清洗规则的探测数据包;其中,所述清洗规则至少包括以下之一:人为因素导致网络异常、业务因素导致网络异常。
本申请实施例还提供了一种计算设备,该计算设备具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理(Personal Digital Assistant,PDA)等。该计算设备可以包括中央处理器(Center Processing Unit,CPU)、存储器、输入/输出设备等,输入设备可以包括键盘、鼠标、触摸屏等,输出设备可以包括显示设备,如液晶显示器(Liquid Crystal Display,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器,可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器提供存储器中存储的程序指令和数据。在本申请实施例中,存储器可以用于执行边缘节点异常检测方法的程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行边缘节点异常检测的方法。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行边缘节点异常检测的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (8)
1.一种边缘节点异常检测的方法,其特征在于,包括:
获取第一边缘节点在统计周期内的探测数据包;其中,所述第一边缘节点所在区域内的各边缘节点之间按探测周期互相发送多种网络通信协议的探测数据包;
根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值;所述统计值是根据所述至少一探测指标在所述统计周期中的可用时段确定的,所述可用时段是根据所述至少一探测指标在所述统计周期中的异常状态确定的;
根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常;
根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值,包括:
获取在所述探测周期的所述网络通信协议下所述第一边缘节点与第二边缘节点之间的探测数据包;
针对任一探测指标,根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与所述第二边缘节点在所述探测指标下的探测值;若存在不少于设定比例的第二边缘节点的探测值不满足所述探测指标的设定值,则确定所述探测周期下所述探测指标发生异常;
根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值;
根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值,包括:
根据所述探测周期的所述网络通信协议的探测指标的异常状态,确定所述探测指标在所述统计周期内的可用时段;所述可用时段为所述统计周期与异常时长的差值,所述异常时长为各异常状态分别对应的时长的累加值;
根据所述探测指标在所述统计周期内的可用时段及所述探测指标的权重,确定所述探测指标在所述统计周期的统计值。
2.如权利要求1所述的方法,其特征在于,所述至少一探测指标包括下列部分或全部:丢包率、时延、网络抖动;所述多种网络通信协议包括下列部分或全部:TCP、UDP。
3.如权利要求2所述的方法,其特征在于,所述探测指标为时延时;
根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与每一个第二边缘节点之间的时延平均值;
确定前N个探测周期时间中所述第一边缘节点与所述第二边缘节点之间的时延参考值;
若不少于J%个第二边缘节点的时延平均值与前N个探测周期的时延参考值满足时延阈值,则确定所述探测周期下所述探测指标发生异常。
4.如权利要求1所述的方法,其特征在于,
确定所述探测周期下所述探测指标发生异常之后,还包括:
针对任一探测指标,确定所述探测指标的前一告警的告警时刻,若前一告警的告警时刻与当前时刻满足设定条件,则发起所述探测指标的告警信息;
根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的网络质量是否发生异常,包括:
根据所述探测指标在所述统计周期的统计值、所述探测指标的告警信息的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常。
5.如权利要求1所述的方法,其特征在于,
根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值之前,还包括:
从所述统计周期内的多种网络通信协议的探测数据包去除符合清洗规则的探测数据包;其中,所述清洗规则至少包括以下之一:人为因素导致网络异常、业务因素导致网络异常。
6.一种边缘节点异常检测的装置,其特征在于,包括:
获取单元,用于获取第一边缘节点在统计周期内的探测数据包;其中,所述第一边缘节点所在区域内的各边缘节点之间按探测周期互相发送多种网络通信协议的探测数据包;
统计值确定单元,用于根据各探测周期的探测数据包,确定至少一探测指标在所述统计周期的统计值;所述统计值是根据所述至少一探测指标在所述统计周期中的可用时段确定的,所述可用时段是根据所述至少一探测指标在所述统计周期中的异常状态确定的;
异常确定单元,用于根据所述至少一探测指标在所述统计周期的统计值和预设的统计值阈值,确定所述第一边缘节点的实时网络质量是否发生异常;
所述统计值确定单元,具体用于:
获取在所述探测周期的所述网络通信协议下所述第一边缘节点与第二边缘节点之间的探测数据包;针对任一探测指标,根据所述第一边缘节点与所述第二边缘节点之间的探测数据包,确定所述第一边缘节点与所述第二边缘节点在所述探测指标下的探测值;若存在不少于设定比例的第二边缘节点的探测值不满足所述探测指标的设定值,则确定所述探测周期下所述探测指标发生异常;根据所述探测周期下所述探测指标的异常状态,确定所述探测指标在所述统计周期的统计值;
所述统计值确定单元具体用于:根据所述探测周期的所述网络通信协议的探测指标的异常状态,确定所述探测指标在所述统计周期内的可用时段;所述可用时段为所述统计周期与异常时长的差值,所述异常时长为各异常状态分别对应的时长的累加值;根据所述探测指标在所述统计周期内的可用时段及所述探测指标的权重,确定所述探测指标在所述统计周期的统计值。
7.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如权利要求1-5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010261367.4A CN111510345B (zh) | 2020-04-03 | 2020-04-03 | 一种边缘节点异常检测的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010261367.4A CN111510345B (zh) | 2020-04-03 | 2020-04-03 | 一种边缘节点异常检测的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111510345A CN111510345A (zh) | 2020-08-07 |
CN111510345B true CN111510345B (zh) | 2022-04-26 |
Family
ID=71875940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010261367.4A Expired - Fee Related CN111510345B (zh) | 2020-04-03 | 2020-04-03 | 一种边缘节点异常检测的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111510345B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112511454A (zh) * | 2020-10-14 | 2021-03-16 | 网宿科技股份有限公司 | 一种网络质量的探测方法、系统及装置 |
CN114650450A (zh) * | 2020-12-17 | 2022-06-21 | 中盈优创资讯科技有限公司 | 一种基于时序关联分析实现iptv智能扩容方法及装置 |
CN112688822B (zh) * | 2021-02-07 | 2022-07-19 | 浙江御安信息技术有限公司 | 基于多点协同的边缘计算故障或安全威胁监测系统与方法 |
CN113395319B (zh) * | 2021-04-26 | 2022-09-16 | 国网江西省电力有限公司经济技术研究院 | 网络故障感知的方法、系统、电子设备及存储介质 |
CN113691390A (zh) * | 2021-07-13 | 2021-11-23 | 中国电力科学研究院有限公司 | 一种云端协同的边缘节点报警系统及方法 |
CN114584485B (zh) * | 2022-01-30 | 2023-10-31 | 阿里巴巴(中国)有限公司 | 检测边缘网络质量的方法、装置、设备和计算机可读存储介质 |
CN115002001B (zh) * | 2022-02-25 | 2023-08-04 | 苏州浪潮智能科技有限公司 | 一种检测集群网络亚健康的方法、装置、设备及介质 |
CN117273547B (zh) * | 2023-11-17 | 2024-01-30 | 建平慧营化工有限公司 | 基于边缘计算的生产设备运行数据处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101145944B (zh) * | 2007-07-04 | 2011-01-05 | 中兴通讯股份有限公司 | 一种实现告警处理的方法 |
CN103634131A (zh) * | 2012-08-24 | 2014-03-12 | 杭州华三通信技术有限公司 | 一种虚拟化网络设备互联链路检测方法及设备 |
CN106878109A (zh) * | 2017-03-13 | 2017-06-20 | 网宿科技股份有限公司 | 服务器检测方法及服务器系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6089884B2 (ja) * | 2013-03-29 | 2017-03-08 | 富士通株式会社 | 情報処理システム,情報処理装置,情報処理装置の制御プログラム,及び情報処理システムの制御方法 |
-
2020
- 2020-04-03 CN CN202010261367.4A patent/CN111510345B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101145944B (zh) * | 2007-07-04 | 2011-01-05 | 中兴通讯股份有限公司 | 一种实现告警处理的方法 |
CN103634131A (zh) * | 2012-08-24 | 2014-03-12 | 杭州华三通信技术有限公司 | 一种虚拟化网络设备互联链路检测方法及设备 |
CN106878109A (zh) * | 2017-03-13 | 2017-06-20 | 网宿科技股份有限公司 | 服务器检测方法及服务器系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111510345A (zh) | 2020-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111510345B (zh) | 一种边缘节点异常检测的方法及装置 | |
CN110191094B (zh) | 异常数据的监控方法及装置、存储介质、终端 | |
CN108075925B (zh) | 基于端到端性能观察与评估来改进通信网络的性能 | |
US7574502B2 (en) | Early warning of potential service level agreement violations | |
US11144556B2 (en) | Dynamic streaming of query responses | |
CN110471821B (zh) | 异常变更检测方法、服务器及计算机可读存储介质 | |
CN110890972B (zh) | 一种业务系统的健康度评估方法及装置 | |
CN107864063A (zh) | 一种异常监控方法、装置及电子设备 | |
CN112152833B (zh) | 一种网络异常报警方法、装置及电子设备 | |
CN105721184A (zh) | 一种网络链路质量的监控方法及装置 | |
JP7046073B2 (ja) | リアルタイムデータ処理方法及び装置 | |
CN108377201A (zh) | 网络异常感知方法、装置、设备及计算机可读存储介质 | |
US20160308745A1 (en) | Presenting application performance monitoring data in distributed computer systems | |
CN107294799A (zh) | 一种分布式系统中节点的处理方法和装置 | |
CN101997709A (zh) | 一种根告警数据分析的方法及其系统 | |
CN111338903B (zh) | 一种交易异常的报警方法及装置 | |
CN111130912A (zh) | 内容分发网络的异常定位方法、服务器及存储介质 | |
CN107943522A (zh) | 一种项目延误率计算处理方法及装置 | |
US20170163509A1 (en) | Inter-node distance metric method and system | |
CN110673973B (zh) | 应用程序编程接口api的异常确定方法和装置 | |
CN115426284A (zh) | 一种网络质量探测方法、装置、终端设备以及存储介质 | |
JP6085576B2 (ja) | ネットワーク評価装置及び方法及びプログラム | |
CN111552566B (zh) | 一种数据处理系统、方法、电子设备及存储介质 | |
CN112866767B (zh) | 一种投屏控制方法、装置、电子设备及存储介质 | |
US20160352600A1 (en) | Abnormality detection method, abnormality detection device, and network system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220426 |