CN114615701A - 一种流量健康度评价的方法 - Google Patents

一种流量健康度评价的方法 Download PDF

Info

Publication number
CN114615701A
CN114615701A CN202210244067.4A CN202210244067A CN114615701A CN 114615701 A CN114615701 A CN 114615701A CN 202210244067 A CN202210244067 A CN 202210244067A CN 114615701 A CN114615701 A CN 114615701A
Authority
CN
China
Prior art keywords
flow
ratethreshold
rate
timethreshold
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210244067.4A
Other languages
English (en)
Inventor
叶晓斌
程亚锋
马丹丹
曾思祖
方遒铿
徐海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210244067.4A priority Critical patent/CN114615701A/zh
Publication of CN114615701A publication Critical patent/CN114615701A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2483Traffic characterised by specific attributes, e.g. priority or QoS involving identification of individual flows

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种流量健康度评价的方法,包括:步骤1)通过SNMP或Telemetry采集专线的流量信息;步骤2)对流量序列进行各类统计分析,得到流量的特征;步骤3)根据流量特征的分布,对专线进行打分,进而得到专线的健康评价。本方法适用于客户专线、中继,以及针对流量进行行为分析的场景。

Description

一种流量健康度评价的方法
技术领域
本发明属于互联网领域,同时也可以应用于其他领域涉及到流量及其相关应用,属于一种流量健康度评价的方法。
背景技术
在电信运营商专线的运营过程中,一些专线的使用会处于非健康的状态,包括、带宽利用率过大(带宽不足)、带宽利用率波动过大、带宽利用率过小(带宽浪费)的情况。
现有通用的发现专线电路非健康状况的方法,主要依赖人工设定的经验阈值,对于流量利用率超出阈值的专线进行告警,再由人工判定是否为非健康状况。
现有技术方案缺点:
1、阈值的设定为静态规则,无法根据使用行为不同变化。
2、经验规则存在一定主观性,需要针对不同实际情况修改。
3、人工分析流量指标通常采用日峰值,需要很长统计区间。
4、人工对于流量经常波动的情况难以判断。
发明内容
基于上述问题,本发明提出一种流量健康度评价的方法,实现了自动对流量(客户专线、中继,以及针对流量进行行为分析的场景)健康状况进行检测,并定位到非健康的原因。
本发明解决上述技术问题所采取的技术方案如下:
一种流量健康度评价的方法,包括:
步骤1)通过SNMP或Telemetry采集专线的流量信息;
步骤2)对流量序列进行各类统计分析,得到流量的特征;
步骤3)根据流量特征的分布,对专线进行打分,进而得到专线的健康评价。
本方法适用于客户专线、中继,以及针对流量进行行为分析的场景。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
下面结合附图对本发明进行详细的描述,以使得本发明的上述优点更加明确。其中,
图1是本发明流量监控度评价的方法的流程示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
具体来说,本技术方案依托于SNMP/Telemetry、大数据分析、统计分析技术实现。通过SNMP/Telemetry采集专线的流量信息,对流量序列进行各类统计分析,得到流量的特征,然后根据流量特征的分布,对专线进行打分,进而得到专线的健康评价,具体步骤包括:
步骤1)通过SNMP或Telemetry采集专线的流量信息;
步骤2)对流量序列进行各类统计分析,得到流量的特征;
步骤3)根据流量特征的分布,对专线进行打分,进而得到专线的健康评价。
其中,结合实施例对上述步骤详细说明:
各符号定义如下表:
Figure BSA0000268432980000031
Figure BSA0000268432980000041
其中,步骤2)对流量序列进行各类统计分析,得到流量的特征,包括:
获取SNMP或Telemetry采集流量Flowi,t
获取专线分配带宽Bandwidthi
其中i为专线编号,t为流量采集的时间点。由此可计算每个专线每个时间点的流量利用率:Ratei,t=Flowi,t/Bandwidthi
步骤2)中,进一步包括:
设定流量利用率阈值:RateThresholdK
设定异常时间占比阈值:TimeThresholdK
其中K为不同统计特征,包括MAX(高利用率)、MIN(低利用率)、AVOL(绝对波动率)、RVOL(相对波动率)。
步骤2)中,进一步包括:
针对每条专线,根据输入数据和可变参数,可以计算得到以下统计指标:
流量利用率高,包括:
h)峰值利用率过高:
IsMaxRateHigh=max(Ratei,t)>RateThresholdMAX
i)利用率过高时间占比大:
IsMaxRateLong=sum(if(Ratei,t>RateThresholdMAX,1,0)/count(t)>TimeThresholdMAX
流量利用率低,包括:
j)平均利用率比峰值利用率过小:
IsAvgRateLow=sum(Ratei,t)/count(t)/max(Ratei,t)<RateThresholdMIN
k)利用率过低时间占比大:
IsLowRateLong=sum(if(Ratei,t<RateThresholdMIN,1,0)/count(t)>TimeThresholdMIN
流量波动大,包括:
波动率:Voli,t=abs(Ratei,t+1-Ratei,t)
l)绝对波动平均值大:
IsAbsVolHigh=sum(Voli,t)/(count(t)-1)<RateThresholdAVOL
m)相对波动平均值大:
IsRelVolHigh=sum(Voli,t/max(Ratei,t+1,Ratei,t))/(count(t)-1)<RateThresholdRVOL
n)波动过大时间占比大:
IsHighVolLong=sum(if(Voli,t<RateThresholdAVOL,1,0))/(count(t)-1)>TimeThresholdAVOL
此外,还包括:
根据全部专线统计指标结果,对RateThresholdK和TimeThresholdK进行优化,具体方法如下:
对于同时使用RateThresholdK和TimeThresholdK的指标,采用网格遍历方法,搜索RateThresholdK
对于网格搜索指标的每个RateThresholdK对应的TimeThresholdK,以及不需要网格搜索的,计算TimeThresholdK不等式左侧部分,统计其在所有样本中的统计参数,包括:均值、方差、偏度、峰度,以及位于全部样本5%、1%、0.5%关键位置的指标值;
对于网格搜索的RateThresholdK,选择分布的偏度、峰度最接近正太分布的作为最终值;
对于剩余的RateThresholdK和TimeThresholdK,根据实际不健康专线大致比例,选择位于全部样本5%、1%、0.5%的指标值作为最终值。
步骤3中,具体包括:
选择5~7个指标作为健康评价依据,任一指标超出阈值不等式成立,则认为专线不健康。
对于不健康的专线,通过计算每个指标的评分值,按照评分值计算专线不健康的贡献权重;
根据指标阈值、最大值、最小值,确定对指标打分的定义域和值域,以在阈值处达到0,在最大值或最小值处达到1为基准;
指标值在超阈值范围内不是线性分布的,因此需要根据其曲线选择合适的多项式函数进行评分,并尽量拟合其在超出阈值范围内的分布。
本发明具有以下的有益效果:
评价规则从数据生成,可随用户行为的演变而变化。
对不同地区使用相同算法生成不同规则,不需要进行二次调整。
可以直接分析5分钟粒度流量数据,最短1天可判定健康;
同时可以抓住分钟级别的精细波动,除利用率高低指标外还可以参考波动指标。
不健康原因定位的权重系统可选取多种函数,不再基于线性阈值的划分。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种流量健康度评价的方法,其特征在于,包括:
步骤1)通过SNMP或Telemetry采集专线的流量信息;
步骤2)对流量序列进行各类统计分析,得到流量的特征;
步骤3)根据流量特征的分布,对专线进行打分,进而得到专线的健康评价。
2.根据权利要求1所述的流量健康度评价的方法,其特征在于,步骤2)对流量序列进行各类统计分析,得到流量的特征,包括:
获取SNMP或Telemetry采集流量Flowi,t
获取专线分配带宽Bandwidthi
其中i为专线编号,t为流量采集的时间点。由此可计算每个专线每个时间点的流量利用率:Ratei,t=Flowi,t/Bandwidthi
3.根据权利要求2所述的流量健康度评价的方法,其特征在于,步骤2)中,进一步包括:
设定流量利用率阈值:RateThresholdK
设定异常时间占比阈值:TimeThresholdK
其中K为不同统计特征,包括MAX(高利用率)、MIN(低利用率)、AVOL(绝对波动率)、RVOL(相对波动率)。
4.根据权利要求3所述的流量健康度评价的方法,其特征在于,步骤2)中,进一步包括:
针对每条专线,根据输入数据和可变参数,可以计算得到以下统计指标:
流量利用率高,包括:
a)峰值利用率过高:
IsMaxRateHigh=max(Ratei,t)>RateThresholdMAX
b)利用率过高时间占比大:
IsMaxRateLong=sum(if(Ratei,t>RateThresholdMAX,1,0)/count(t)>TimeThresholdMAx
流量利用率低,包括:
c)平均利用率比峰值利用率过小:
IsAvgRateLow=sum(Ratei,t)/count(t)/max(Ratei,t)<RateThresholdMIN
d)利用率过低时间占比大:
IsLowRateLong=sum(if(Ratei,t<RateThresholdMIN,1,0)/count(t)>TimeThresholdMIN
流量波动大,包括:
波动率:Voli,t=abs(Ratei,t+1-Ratei,t)
e)利用率绝对波动平均值大:
IsAbsVolHigh=sum(Voli,t)/(count(t)-1)<RateThresholdAVOL
f)相对波动平均值大:
IsRelVolHigh=sum(Voli,t/max(Ratei,t+1,Ratei,t))/(count(t)-1)<RateThresholdRVOL
g)波动过大时间占比大:
IsHighVolLong=sum(if(Voli,t<RateThresholdAVOL,1,0))/(count(t)-1)>TimeThresholdAVOL
5.根据权利要求4所述的流量健康度评价的方法,其特征在于,还包括:
根据全部专线统计指标结果,对RateThresholdK和TimeThresholdK进行优化,具体方法如下:
对于同时使用RateThresholdK和TimeThresholdK的指标,采用网格遍历方法,搜索RateThresholdK
对于网格搜索指标的每个RateThresholdK对应的TimeThresholdK,以及不需要网格搜索的,计算TimeThresholdK不等式左侧部分,统计其在所有样本中的统计参数,包括:均值、方差、偏度、峰度,以及位于全部样本5%、1%、0.5%关键位置的指标值;
对于网格搜索的RateThresholdK,选择分布的偏度、峰度最接近正太分布的作为最终值;
对于剩余的RateThresholdK和TimeThresholdK,根据实际不健康专线大致比例,选择位于全部样本5%、1%、0.5%的指标值作为最终值。
6.根据权利要求4所述的流量健康度评价的方法,其特征在于,步骤3中,具体包括:
选择5~7个指标作为健康评价依据,任一指标超出阈值不等式成立,则认为专线不健康。
7.根据权利要求6所述的流量健康度评价的方法,其特征在于,还包括:
对于不健康的专线,通过计算每个指标的评分值,按照评分值计算专线不健康的贡献权重;
根据指标阈值、最大值、最小值,确定对指标打分的定义域和值域,以在阈值处达到0,在最大值或最小值处达到1为基准;
指标值在超阈值范围内不是线性分布的,因此需要根据其曲线选择合适的多项式函数进行评分,并尽量拟合其在超出阈值范围内的分布。
CN202210244067.4A 2022-03-14 2022-03-14 一种流量健康度评价的方法 Pending CN114615701A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210244067.4A CN114615701A (zh) 2022-03-14 2022-03-14 一种流量健康度评价的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210244067.4A CN114615701A (zh) 2022-03-14 2022-03-14 一种流量健康度评价的方法

Publications (1)

Publication Number Publication Date
CN114615701A true CN114615701A (zh) 2022-06-10

Family

ID=81863288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210244067.4A Pending CN114615701A (zh) 2022-03-14 2022-03-14 一种流量健康度评价的方法

Country Status (1)

Country Link
CN (1) CN114615701A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716867A (zh) * 2004-06-29 2006-01-04 杭州华为三康技术有限公司 数据流量统计方法及装置
CN106452941A (zh) * 2016-08-24 2017-02-22 重庆大学 网络异常的检测方法及装置
CN107451402A (zh) * 2017-07-13 2017-12-08 北京交通大学 一种基于告警数据分析的设备健康度评估方法及装置
CN108235065A (zh) * 2016-12-21 2018-06-29 青岛祥智电子技术有限公司 基于媒体丢包率指标的iptv业务健康度评价方法
CN111064635A (zh) * 2019-12-10 2020-04-24 中盈优创资讯科技有限公司 一种异常流量的监视方法及系统
CN113553484A (zh) * 2020-04-14 2021-10-26 中国移动通信集团浙江有限公司 无线网络的指标数据的处理装置、方法及计算设备
CN113762421A (zh) * 2021-10-22 2021-12-07 中国联合网络通信集团有限公司 分类模型的训练方法、流量分析方法、装置及设备
CN114124655A (zh) * 2021-10-20 2022-03-01 曙光信息产业(北京)有限公司 网络监控方法、系统、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1716867A (zh) * 2004-06-29 2006-01-04 杭州华为三康技术有限公司 数据流量统计方法及装置
CN106452941A (zh) * 2016-08-24 2017-02-22 重庆大学 网络异常的检测方法及装置
CN108235065A (zh) * 2016-12-21 2018-06-29 青岛祥智电子技术有限公司 基于媒体丢包率指标的iptv业务健康度评价方法
CN107451402A (zh) * 2017-07-13 2017-12-08 北京交通大学 一种基于告警数据分析的设备健康度评估方法及装置
CN111064635A (zh) * 2019-12-10 2020-04-24 中盈优创资讯科技有限公司 一种异常流量的监视方法及系统
CN113553484A (zh) * 2020-04-14 2021-10-26 中国移动通信集团浙江有限公司 无线网络的指标数据的处理装置、方法及计算设备
CN114124655A (zh) * 2021-10-20 2022-03-01 曙光信息产业(北京)有限公司 网络监控方法、系统、装置、计算机设备和存储介质
CN113762421A (zh) * 2021-10-22 2021-12-07 中国联合网络通信集团有限公司 分类模型的训练方法、流量分析方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡康雄: "基于网络健康度评价的网络性能管理系统的研究与设计", 《中国优秀硕士学位论文》, pages 2 - 4 *

Similar Documents

Publication Publication Date Title
CN108462717B (zh) 基于规则匹配命中率和分布方差的防火墙规则集优化方法
US20160140208A1 (en) Fast Grouping of Time Series
Stoev et al. Estimating heavy-tail exponents through max self–similarity
CN111080502A (zh) 一种区域企业数据异常行为的大数据识别方法
CN107026763A (zh) 一种基于流量分解的数据通信网流量预测方法
CN106685757B (zh) 一种评估网络性能的方法及装置
CN106683405B (zh) 基于道路车流密度的道路交通状态评价方法
CN109583679A (zh) 一种多算法融合的窃电疑似度分析方法
CN116780781B (zh) 智能电网接入的功率管理方法
CN104065535B (zh) 一种网络评价方法及装置
CN108206813A (zh) 基于k均值聚类算法的安全审计方法、装置及服务器
CN112395608A (zh) 网络安全威胁监测方法、装置和可读存储介质
CN112101765A (zh) 一种配电网运行指标数据异常数据处理方法及系统
Gospodinov et al. The graphical methods for estimating hurst parameter of self-similar network traffic
CN110011966B (zh) 一种智能变电站过程层网络流量异常检测方法
Mehdi et al. Determination of plotting position formula for the normal, log-normal, Pearson (III), log-Pearson (III) and Gumble distributional hypotheses using the probability plot correlation coefficient test
CN114615701A (zh) 一种流量健康度评价的方法
CN109062992A (zh) 一种经济数据分析方法及系统
CN110969539B (zh) 基于曲线形态分析的光伏窃电发现方法和系统
CN105183612B (zh) 服务器可用内存异常增长及运行状况的评估方法
CN110706004A (zh) 一种基于层次聚类的农田重金属污染物溯源方法
CN110554916A (zh) 基于分布式集群的风险指标计算方法及装置
CN117454095B (zh) 一种桥梁动挠度数据降噪方法
CN117391644B (zh) 一种合同管理过程中参数调整方法、装置、设备及介质
CN114647386B (zh) 基于人工智能的大数据分布式存储方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination