CN105141446A - 一种基于客观权重确定的网络设备健康度评估方法 - Google Patents

一种基于客观权重确定的网络设备健康度评估方法 Download PDF

Info

Publication number
CN105141446A
CN105141446A CN201510442808.XA CN201510442808A CN105141446A CN 105141446 A CN105141446 A CN 105141446A CN 201510442808 A CN201510442808 A CN 201510442808A CN 105141446 A CN105141446 A CN 105141446A
Authority
CN
China
Prior art keywords
network
vaule
equipment
data
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510442808.XA
Other languages
English (en)
Inventor
陈琳
王宝生
张晓哲
黄杰
南洋
张飞朋
胡银辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201510442808.XA priority Critical patent/CN105141446A/zh
Publication of CN105141446A publication Critical patent/CN105141446A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于客观权重确定的网络设备健康度评估方法,其步骤为:S1:按层次划分设备;网络管理员通过导入静态网络拓扑信息,将设备按层次进行划分,层次号越大表示对应设备在网络中的位置越重要;S2:据设备层次号为每个设备设置初始优先级;S3:采集数据中心网络设备的运行数据信息,将采集信息按照采集时间写入到数据库中;S4:采集参数数据的处理;S5:网络设备健康度计算:根据网络设备集合信息,按照网络设备数据采集时间序列,分别分析单个网络设备,获得其经过处理后的参数数据;利用健康度计算公式得到该网络设备在该时间点的健康值。本发明具有原理简单、操作简便、能够做出客观准确评估等优点。

Description

一种基于客观权重确定的网络设备健康度评估方法
技术领域
本发明主要涉及到网络系统的性能评估及优化技术领域,特指一种主要适用于高速以太网、IP分组网络和InfiniBand高速网络的网络设备健康度评估方法。
背景技术
随着云技术的发展和成熟,数据中心网络承载越来越多种类的应用,如科学计算、生物制药、数学建模、天气预报、集群计算、分布式文件系统等。数据中心作为这些应用的数据计算和存储中心,以供应链方式提供共享的基础设施、信息处理与应用环境等服务。
数据中心不同于传统网络,现代数据中心通常具有上万节点的规模,随着网络规模的不断增大,除了通常的树型结构,一些新型的网络结构被提出,例如:Fat-tree、Portland、VL2、DCell等;这些新型网络结构能够支持多路径、提供更高的带宽。现代数据中心网络有以下特点:1)数据中心网络规模日益庞大,网络异构复杂;2)流量行为复杂,拥塞加剧;3)应用的多样化;4)网络故障率的指数增加;5)细粒度的网络性能评估需求。因此,数据中心网络运行的应用通常对网络设备性能要求严格,需要管理者能更加实时、精确的掌握全网设备态势,在网络性能下降初期能及时发现和定位网络设备性能瓶颈及可能故障点,给出一个快速的性能评估和预测方案。
网络健康度是指通过健康指数来评价网络及设备的性能状况。目前,网络设备健康度评估方法主要分为以下几类:
(1)采用nProbe工具对大规模网络进行被动测量,该方法的优点是结合历史数据得到网络延迟、吞吐率、正常连接率的偏离度,能够反映出网络的整体运行情况。但缺点是作为评估参数的Tcpflags在Tcp连接超时后,会发生Tcp重传提高正常Tcp连接的比率,可能会造成评估值较大,而无法反映真实的网络情况。
(2)基于SVM的网络性能评估方法,该方法的特点是通过对正常样本和故障样本进行SVM分类训练,结合云模型对网络性能进行评估,优点是提高了评估结果的客观性,缺点是在选择样本和样本归一化处理过程,如果样本的差距比较大,或导致归一化后的参数数据距离参数正常运行值偏离较远,会造成评估结果的不准确。
(3)分析不同事件与网络性能之间的关联,考虑的影响事件较多,优点是能够根据发生的网络事件快速的做出反应,缺点是由于影响网络性能各个因素之间存在复杂的关联性,单纯的考虑每个事件对网络性能的影响,难以发现影响网络性能的关键因素,同时也增加了系统的复杂程度。
(4)实现对影响网络运行的单元分层,每层都有若干的设备或链路,当每层的所有设备或链路都大于阈值时,才判断该层网络情况为正常,然后逐层判断,最终得到整个网络的健康度情况。这种方法可以将复杂的网络问题划分成简单的局部的模块,但没有考虑网络设备部署的层次结构,无法根据网络设备的层次结构进行动态的调整。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种原理简单、操作简便、能够做出客观准确评估的基于客观权重确定的网络设备健康度评估方法。
为解决上述技术问题,本发明采用以下技术方案:
一种基于客观权重确定的网络设备健康度评估方法,其特征在于,步骤为:
S1:按层次划分设备;网络管理员通过导入静态网络拓扑信息,将设备按层次进行划分,层次号越大表示对应设备在网络中的位置越重要;
S2:据设备层次号为每个设备设置初始优先级;
S3:采集数据中心网络设备的运行数据信息,将采集信息按照采集时间写入到数据库中;
S4:采集参数数据的处理:根据采集的网络设备的运行数据信息,首先将网络设备掉线情况,各个端口丢包数目和错误包数目转化为掉线率、端口丢包率和端口错误包率,经过进一步数据处理,包括数据归一化处理以及各个参数权值的客观确定,对采集到的原始数据进行处理;
S5:网络设备健康度计算:根据网络设备集合信息,按照网络设备数据采集时间序列,分别分析单个网络设备,获得其经过处理后的参数数据;利用健康度计算公式得到该网络设备在该时间点的健康值,最后将处理过的设备经过分级处理分别定为健康、亚健康、不健康三种状态,得到网络设备集合中所有设备的健康值和运行状态的分布情况。
作为本发明的进一步改进:在所述步骤S1中,数据中心网络拓扑信息描述如下,数据中心网络DN={S,C,E},其中S={S1,S2,S3,...,SM}表示交换机设备集合,C={C1,C2,C3,...,CN}表示网络中终端计算节点的集合,M和N分别为网络中交换设备及计算节点的总数;E={E1,E2,E3,...,EN}表示交换机设备的网络接口集合,每一个交换设备Si都含有X个接口,则有Ei={ei1,ei2,ei3,...,eiXi},其中Ei是交换设备Si的接口集合,ei1,ei2,ei3,...,eiXi是设备Si的所有接口,Xi是Si的接口总数。
作为本发明的进一步改进:在所述步骤S2中,令DLEVEL(Si)为交换机在网络中的层次号,其中计算节点的层次号为1,接入交换机层次号为2,汇聚、核心交换机按照组网上下层关系分别赋予对应层次号,层次号越大表示对应设备在网络中的位置越重要,H为本网络的最大层次深度;网络数据采集模块根据设备层次号,为每个设备设置初始优先级PRIO(vi),有PRIO(vi)=DLEVEL(vi),根据设备优先级采用不同的采集策略,高优先级的设备为重点关注,有较高的采集频率。
作为本发明的进一步改进:在所述步骤S3中,运行数据信息包括网络设备在线和掉线情况,异常的交换设备端口数目PortDropNum,总端口数目DevicePortNum,进入端口的错误包数目InPortErrPkts,总进设备数据包数目InDevicePkts,出端口的错误包数目OutPortErrPkts,总出设备数据包数目OutDevicePkts,进入端口的丢包数目InPortDiscardPkts,总进设备数据包数目InDevicePkts,出端口的丢包数目OutPortDiscardPkts,总出设备数据包数目OutDevicePkts。
作为本发明的进一步改进:所述步骤S4的具体步骤为:
S4.1:PortDropNum是操作状态异常的交换设备端口数目,DevicePortNum是设备正在使用总端口数目,端口掉线率PortDropPer:
PortDropPer=PortDropNum/DevicePortNum;
S4.2:InPortErrper是通信过程中交换机每个端口收到进入端口的错误包数目InPortErrPkts占总进设备数据包数目InDevicePkts的比值,即InPortErrper=InPortErrPkts/InDevicePkts;OutPortErrper是通信过程中交换机每个端口收到出端口的错误包数目OutPortErrPkts占总出设备数据包数目OutDevicePkts的比值,即OutPortErrper=OutPortErrPkts/OutDevicePkts;设备平均错误包率AvgPortErrPer:
AvgPortErrPer=(InPortErrper+OutPortErrper)/DevicePortNum;
S4.3:InPortDiscardper是通信过程中交换机每个端口接收到进入端口的丢包数目InPortDiscardPkts占总进设备数据包数目InDevicePkts的比值,即InPortDiscardper=InPortDiscardPkts/InDevicePkts;OutPortDiscardper是通信过程中交换机每个端口接收到出端口的丢包数目OutPortDiscardPkts占总出设备数据包数目OutDevicePkts的比值,即OutPortDiscardper=OutPortDiscardPkts/OutDevicePkts;设备平均丢包率AvgPortDiscardPer:
AvgPortDiscardPer=(InPortDiscardper+OutPortDiscardper)/DevicePortNum;
S4.4:计算性能参数权值,首先采用基于标准方差系数的权值计算方法,分别求出PortDropPer、AvgPortErrPer、AvgPortDiscardPer在时间点t下的期望值μpdp,μape,μapd,再求出标准方差δpdp,δape,δapd,最后分别得到三个参数的标准差系数Vδpdp,Vδape,Vδapd
由下面的公式得到权值wpdp,wape,wapd
其中wpdp=Vδpdp/(Vδpdp+Vδape+Vδapd);wape=Vδape/(Vδpdp+Vδape+Vδapd);wapd=Vδapd/(Vδpdp+Vδape+Vδapd);
S4.5:数据的归一化阶段:对原始的数据值进行归一处理,让处理后的数据都落入一个较小的范围。
作为本发明的进一步改进:所述步骤S4.5的具体步骤为:
S4.5.1:在时间点t下,把PortDropPer、AvgPortErrPer、AvgPortDiscardPer的所有数据用科学计数法表示,并存入历史数据库;
S4.5.2:在指定时间内的历史数据库中,分别统计所有时间点PortDropPer、AvgPortErrPer、AvgPortDiscardPer各自的nmost中出现频率最高的nmost值设定为nmid,再统计nmax历史的最大值设定为nmaxhis
S4.5.3:取出时间点t下PortDropPer参数的所有数据vaulei,经过归一化处理后得到新值newValuei,具体的处理方法:令x=nmid,y=nmaxhis,如果vaulei大于0并且vaulei小于等10x,则newValuei=0.2*(10x-vaulei)/10x;如果vaulei大于10x并且vaulei小于等于10y,则newValuei=0.6*(vaulei-10x)/vaulei;如果vaulei大10y并且vaulei小于1,则newValuei=1;如果vaulei大于1或者vaulei小于0,则newValuei=0;
S4.5.4:同理,对该时间点t下的另外两个参数AvgPortErrPer、AvgPortDiscardPer,同样采用上述步骤S4.5.1~S4.5.3的方法处理得到归一化后的值。
作为本发明的进一步改进:所述步骤S2和步骤S3的详细流程为:
1)获取单个时间点所有设备在数据库中的原始参数数据,为计算参数权值和数据归一化处理做好准备;
2)将获得的原始参数数据,分别交给步骤3)参数权值计算模块和步骤4)参数归一化模块处理,步骤3)和步骤4)同步执行,负责完成参数的权值计算和参数数据的归一化处理,并将处理后的结果放入数据库中;
3)选择任一个设备参数,计算单个参数期望值,然后计算单个参数方差值,并根据方差系数计算公式,得到单个参数的方差系数值,继续计算其他两个设备参数的方差系数值,并将所有参数的权重值存放到数据库中;
4)先判断数据库中是否有参数数据的历史值,如果存在历史值,根据历史的参数数据动态调整归一化过程所需的参数阈值,然后调至步骤5)计算单个参数数据的归一化结果,得到参数数据的归一化结果后,存放在对应的数据库中,如果不存在历史参数值调至步骤5);
5)进行单个参数的数据归一化处理,具体步骤:
5.7)取出时间点t下PortDropPer参数的所有数据vaulei,经过归一化处理后得到新值newValuei,令x=nmid,y=nmaxhis
5.8)判断vaulei是否在较小的波动范围内,然后处理vaulei,即If(vaulei>0andvaulei<=10x)newValuei=0.2*(10x-vaulei)/10x
5.9)判断vaulei是否超处于较大的波动范围,然后处理vaulei,即If(vaulei>10xandvaulei<=10y)newValuei=0.6*(vaulei-10x)/vaulei
5.10)判断vaulei是否超出了合理的波动范围内,然后处理vaulei,即If(vaulei>10yandvaulei<=1)newValuei=1;
5.11)判断vaulei是否为不合理数据,然后处理vaulei,即If(vaulei>1orvaulei<=0)newValuei=0;
5.12)重复5.1)至5.5)所有的数据处理过程,对该时间点t下的另外两个参数AvgPortErrPer、AvgPortDiscardPer同样采用上述方法处理得到归一化后的值,然后调至步骤6);
6)结束本次采集参数数据的处理流程。
与现有技术相比,本发明的优点在于:本发明的基于客观权重确定的网络设备健康度评估方法,原理简单、操作简便,通过利用数据中心网络的历史数据动态调整各性能参数,并基于客观参数确定方法,实现了对大规模网络设备健康度进行客观、较准确的评估方法。本发明可直接应用于高速以太网、IP分组网络和InfiniBand高速网络,用于上述网络大规模网络设备健康度评估。
附图说明
图1是本发明的流程示意图。
图2是本发明在具体应用实例中的逻辑框架示意图。
图3是本发明在具体应用实例采集参数数据的处理流程示意图。
具体实施方式
以下将结合说明书附图和具体实施例对本发明做进一步详细说明。
如图1所示,本发明的基于客观权重确定的网络设备健康度评估方法,其步骤为:
S1:按层次划分设备;
网络管理员通过管理客户端导入静态网络拓扑信息,调用拓扑分析模块,将设备按层次进行划分,层次号越大表示对应设备在网络中的位置越重要。
数据中心网络拓扑信息描述如下,数据中心网络DN={S,C,E},其中S={S1,S2,S3,...,SM}表示交换机设备集合,C={C1,C2,C3,...,CN}表示网络中终端计算节点的集合,M和N分别为网络中交换设备及计算节点的总数;E={E1,E2,E3,...,EN}表示交换机设备的网络接口集合,每一个交换设备Si都含有X个接口,则有Ei={ei1,ei2,ei3,...,eiXi},其中Ei是交换设备Si的接口集合,ei1,ei2,ei3,...,eiXi是设备Si的所有接口,Xi是Si的接口总数。
S2:据设备层次号为每个设备设置初始优先级;
令DLEVEL(Si)为交换机在网络中的层次号,其中计算节点的层次号为1,接入交换机层次号为2,汇聚、核心交换机按照组网上下层关系分别赋予对应层次号,层次号越大表示对应设备在网络中的位置越重要,H为本网络的最大层次深度。
网络数据采集模块根据设备层次号,为每个设备设置初始优先级PRIO(vi),有PRIO(vi)=DLEVEL(vi),根据设备优先级采用不同的采集策略,高优先级的设备需要重点关注,有较高的采集频率。
S3:采集数据中心网络设备的运行数据信息,将采集信息按照采集时间写入到数据库中;
运行数据信息包括网络设备在线和掉线情况,异常的交换设备端口数目PortDropNum,总端口数目DevicePortNum,进入端口的错误包数目InPortErrPkts,总进设备数据包数目InDevicePkts,出端口的错误包数目OutPortErrPkts,总出设备数据包数目OutDevicePkts,进入端口的丢包数目InPortDiscardPkts,总进设备数据包数目InDevicePkts,出端口的丢包数目OutPortDiscardPkts,总出设备数据包数目OutDevicePkts等等。
S4:采集参数数据的处理:根据采集的网络设备的运行数据信息,首先将网络设备掉线情况,各个端口丢包数目和错误包数目转化为掉线率、端口丢包率和端口错误包率,经过进一步数据处理,包括数据归一化处理,以及各个参数权值的客观确定,对采集到的原始数据进行处理。
S5:网络设备健康度计算:根据网络设备集合信息,按照网络设备数据采集时间序列,分别分析单个网络设备,获得其经过处理后的参数数据,利用健康度计算公式得到该网络设备在该时间点的健康值,最后将处理过的设备经过分级处理分别定为健康、亚健康、不健康三种状态,得到网络设备集合中所有设备的健康值和运行状态的分布情况。
在本实施例中,步骤S4的具体步骤为:
S4.1:PortDropNum是操作状态异常的交换设备端口数目,DevicePortNum是设备正在使用总端口数目,端口掉线率是交换设备整体可用性的一个重要指标,异常率的高低代表了交换设备的运行健康好坏,端口掉线率PortDropPer:
PortDropPer=PortDropNum/DevicePortNum;
S4.2:InPortErrper是通信过程中交换机每个端口收到进入端口的错误包数目InPortErrPkts占总进设备数据包数目InDevicePkts的比值,即InPortErrper=InPortErrPkts/InDevicePkts;OutPortErrper是通信过程中交换机每个端口收到出端口的错误包数目OutPortErrPkts占总出设备数据包数目OutDevicePkts的比值,即OutPortErrper=OutPortErrPkts/OutDevicePkts。设备平均错误包率AvgPortErrPer:
AvgPortErrPer=(InPortErrper+OutPortErrper)/DevicePortNum。
S4.3:InPortDiscardper是通信过程中交换机每个端口接收到进入端口的丢包数目InPortDiscardPkts占总进设备数据包数目InDevicePkts的比值,即InPortDiscardper=InPortDiscardPkts/InDevicePkts;OutPortDiscardper是通信过程中交换机每个端口接收到出端口的丢包数目OutPortDiscardPkts占总出设备数据包数目OutDevicePkts的比值,即OutPortDiscardper=OutPortDiscardPkts/OutDevicePkts。设备平均丢包率AvgPortDiscardPer:
AvgPortDiscardPer=(InPortDiscardper+OutPortDiscardper)/DevicePortNum。
S4.4:计算性能参数权值,首先采用基于标准方差系数的权值计算方法,分别求出PortDropPer、AvgPortErrPer、AvgPortDiscardPer在时间点t下的期望值μpdp,μape,μapd,再求出标准方差δpdp,δape,δapd,最后分别得到三个参数的标准差系数Vδpdp,Vδape,Vδapd
由下面的公式得到权值wpdp,wape,wapd
其中wpdp=Vδpdp/(Vδpdp+Vδape+Vδapd);wape=Vδape/(Vδpdp+Vδape+Vδapd);wapd=Vδapd/(Vδpdp+Vδape+Vδapd)。
S4.5:数据的归一化阶段:网络设备的各个性能参数,由于各自数据的单位不同,无法直接乘以权重来得到设备的性能评分。因此,要对原始的数据值进行归一处理,让处理后的数据都落入一个较小的特定范围。
在具体应用时,作为优化的实施例,本发明采用一种结合历史参数分布的归一化方法来处理各个性能参数的数据。该步骤4.5的具体步骤为:
S4.5.1:在时间点t下,把PortDropPer、AvgPortErrPer、AvgPortDiscardPer的所有数据用科学计数法表示,比如m*10-n,其中0<m<1,分别统计出三个参数该时间点下出现次数最多的幂值nmost以及最大的幂值nmax,即出现概率最大的幂值nmost和最大上限幂值nmax,并将该值存入历史数据库;
S4.5.2:在指定时间内的历史数据库中,分别统计所有时间点PortDropPer、AvgPortErrPer、AvgPortDiscardPer各自的nmost中出现频率最高的nmost值设定为nmid,再统计nmax历史的最大值设定为nmaxhis
S4.5.3:取出时间点t下PortDropPer参数的所有数据vaulei,经过归一化处理后得到新值newValuei,具体的处理方法:令x=nmid,y=nmaxhis,如果vaulei大于0并且vaulei小于等10x,则newValuei=0.2*(10x-vaulei)/10x;如果vaulei大于10x并且vaulei小于等于10y,则newValuei=0.6*(vaulei-10x)/vaulei;如果vaulei大10y并且vaulei小于1,则newValuei=1;如果vaulei大于1或者vaulei小于0,则newValuei=0。
同理,对该时间点t下的另外两个参数AvgPortErrPer、AvgPortDiscardPer,同样采用上述方法处理得到归一化后的值。
在本实施例中,步骤S5中,令集合S等于t时间点所有设备集合,循环直到集合S为空,取集合S中首个节点vi,执行以下操作:
S5.1:首先,从数据库中读取设备PortDropPer,AvgPortErrPer,AvgPortDiscardPer三个参数在t时间点下的权重,对该设备各个参数归一化的数值求加权和,得到设备的综合评价值HealthValue,具体公式:
HealthValue=(1–wpdp*newValuePortDropPer–wape*newValueAvgPortErrPer–wapd*newValueAvgPortDiscardPer)*100。
S5.2:如果健康值HealthValue<60,为设备运行不正常,或者是综合计算不正常,或者是单项指标超出了动态阈值的上限;如果健康值HealthValue>=60,且健康值HealthValue<80,为设备运行正常,但相对网络中的其他大部分设备,在端口掉线率,平均错误包率或平均丢包率三方面的某一方面或多个方面有些落后;如果健康值HealthValue>=80,设备与网络中其他大部分健康设备的运行状态一致,说明设备运行良好。
S5.3:将上述步骤S5.1和步骤S5.2评估结果存入数据库中,并从集合S中取下一个设备,然后循环执行步骤5.1和步骤5.2,直至t时间点下设备集合S为空。
如图3所示,在具体应用实例中,步骤S2和步骤S3的详细流程为:
1)获取单个时间点所有设备在数据库中的原始参数数据,为计算参数权值和数据归一化处理做好准备;
2)将获得的原始参数数据,分别交给步骤3)参数权值计算模块和步骤4)参数归一化模块处理,步骤3)和步骤4)同步执行,负责完成参数的权值计算和参数数据的归一化处理,并将处理后的结果放入数据库中;
3)选择任一个设备参数,计算单个参数期望值,然后计算单个参数方差值,并根据方差系数计算公式,得到单个参数的方差系数值,继续计算其他两个设备参数的方差系数值,并将所有参数的权重值存放到数据库中;
4)先判断数据库中是否有参数数据的历史值,如果存在历史值,根据历史的参数数据动态调整归一化过程所需的参数阈值,然后调至步骤5)计算单个参数数据的归一化结果,得到参数数据的归一化结果后,存放在对应的数据库中,如果不存在历史参数值调至步骤5);
5)进行单个参数的数据归一化处理,具体步骤:
5.13)取出时间点t下PortDropPer参数的所有数据vaulei,经过归一化处理后得到新值newValuei,令x=nmid,y=nmaxhis
5.14)判断vaulei是否在较小的波动范围内,然后处理vaulei,即If(vaulei>0andvaulei<=10x)newValuei=0.2*(10x-vaulei)/10x
5.15)判断vaulei是否超处于较大的波动范围,然后处理vaulei,即If(vaulei>10xandvaulei<=10y)newValuei=0.6*(vaulei-10x)/vaulei
5.16)判断vaulei是否超出了合理的波动范围内,然后处理vaulei,即If(vaulei>10yandvaulei<=1)newValuei=1;
5.17)判断vaulei是否为不合理数据,然后处理vaulei,即If(vaulei>1orvaulei<=0)newValuei=0。
5.18)重复5.1)至5.5)所有的数据处理过程,对该时间点t下的另外两个参数AvgPortErrPer、AvgPortDiscardPer同样采用上述方法处理得到归一化后的值,然后调至步骤6)。
6)结束本次采集参数数据的处理流程。
结合图2所示,本发明在具体应用之后所形成的逻辑框图,其主要包括网络管理客户端、数据采集模块、数据库、参数归一化模块、参数权值计算模块、网络设备健康度计算模块和数据采集策略模块。网络管理客户端为网络管理员提供交互界面,对整个网络设备健康度系统进行控制,提交分析请求并查看分析结果。数据采集模块根据采集策略对网络设备的性能参数进行采集,并存储到数据库中。数据库保存数据中心网络的网络拓扑描述信息和采集的设备性能数据信息,网络拓扑描述信息包含交换机、计算节点之间的连接关系和交换机层次编号等,设备性能数据信息包括设备网络接口进出报文信息、错误和丢弃报文计数信息以及设备在线状态信息。数据采集策略模块根据网络设备的层次信息、设备历史健康值等信息动态调整设备数据采集策略。参数归一化模块和参数权值计算模块根据性能指标发生的比例分布和网络中设备健康值的标准方差的分布动态调整性能参数的权值,使得设备健康值的计算结果更加合理。网络设备健康度计算模块进行网络设备健康度的计算,将计算结果反馈给性能参数权值调整模块,对参数权值进行调优,同时将最终计算获得的设备健康值作为数据采集策略的调整依据。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (7)

1.一种基于客观权重确定的网络设备健康度评估方法,其特征在于,步骤为:
S1:按层次划分设备;网络管理员通过导入静态网络拓扑信息,将设备按层次进行划分,层次号越大表示对应设备在网络中的位置越重要;
S2:据设备层次号为每个设备设置初始优先级;
S3:采集数据中心网络设备的运行数据信息,将采集信息按照采集时间写入到数据库中;
S4:采集参数数据的处理:根据采集的网络设备的运行数据信息,首先将网络设备掉线情况,各个端口丢包数目和错误包数目转化为掉线率、端口丢包率和端口错误包率,经过进一步数据处理,包括数据归一化处理以及各个参数权值的客观确定,对采集到的原始数据进行处理;
S5:网络设备健康度计算:根据网络设备集合信息,按照网络设备数据采集时间序列,分别分析单个网络设备,获得其经过处理后的参数数据;利用健康度计算公式得到该网络设备在该时间点的健康值,最后将处理过的设备经过分级处理分别定为健康、亚健康、不健康三种状态,得到网络设备集合中所有设备的健康值和运行状态的分布情况。
2.根据权利要求1所述的基于客观权重确定的网络设备健康度评估方法,其特征在于,在所述步骤S1中,数据中心网络拓扑信息描述如下,数据中心网络DN={S,C,E},其中S={S1,S2,S3,...,SM}表示交换机设备集合,C={C1,C2,C3,...,CN}表示网络中终端计算节点的集合,M和N分别为网络中交换设备及计算节点的总数;E={E1,E2,E3,...,EN}表示交换机设备的网络接口集合,每一个交换设备Si都含有X个接口,则有Ei={ei1,ei2,ei3,...,eiXi},其中Ei是交换设备Si的接口集合,ei1,ei2,ei3,...,eiXi是设备Si的所有接口,Xi是Si的接口总数。
3.根据权利要求1所述的基于客观权重确定的网络设备健康度评估方法,其特征在于,在所述步骤S2中,令DLEVEL(Si)为交换机在网络中的层次号,其中计算节点的层次号为1,接入交换机层次号为2,汇聚、核心交换机按照组网上下层关系分别赋予对应层次号,层次号越大表示对应设备在网络中的位置越重要,H为本网络的最大层次深度;网络数据采集模块根据设备层次号,为每个设备设置初始优先级PRIO(vi),有PRIO(vi)=DLEVEL(vi),根据设备优先级采用不同的采集策略,高优先级的设备为重点关注,有较高的采集频率。
4.根据权利要求1所述的基于客观权重确定的网络设备健康度评估方法,其特征在于,在所述步骤S3中,运行数据信息包括网络设备在线和掉线情况,异常的交换设备端口数目PortDropNum,总端口数目DevicePortNum,进入端口的错误包数目InPortErrPkts,总进设备数据包数目InDevicePkts,出端口的错误包数目OutPortErrPkts,总出设备数据包数目OutDevicePkts,进入端口的丢包数目InPortDiscardPkts,总进设备数据包数目InDevicePkts,出端口的丢包数目OutPortDiscardPkts,总出设备数据包数目OutDevicePkts。
5.根据权利要求1或2或3或4所述的基于客观权重确定的网络设备健康度评估方法,其特征在于,所述步骤S4的具体步骤为:
S4.1:PortDropNum是操作状态异常的交换设备端口数目,DevicePortNum是设备正在使用总端口数目,端口掉线率PortDropPer:
PortDropPer=PortDropNum/DevicePortNum;
S4.2:InPortErrper是通信过程中交换机每个端口收到进入端口的错误包数目InPortErrPkts占总进设备数据包数目InDevicePkts的比值,即InPortErrper=InPortErrPkts/InDevicePkts;OutPortErrper是通信过程中交换机每个端口收到出端口的错误包数目OutPortErrPkts占总出设备数据包数目OutDevicePkts的比值,即OutPortErrper=OutPortErrPkts/OutDevicePkts;设备平均错误包率AvgPortErrPer:
AvgPortErrPer=(InPortErrper+OutPortErrper)/DevicePortNum;
S4.3:InPortDiscardper是通信过程中交换机每个端口接收到进入端口的丢包数目InPortDiscardPkts占总进设备数据包数目InDevicePkts的比值,即InPortDiscardper=InPortDiscardPkts/InDevicePkts;OutPortDiscardper是通信过程中交换机每个端口接收到出端口的丢包数目OutPortDiscardPkts占总出设备数据包数目OutDevicePkts的比值,即OutPortDiscardper=OutPortDiscardPkts/OutDevicePkts;设备平均丢包率AvgPortDiscardPer:
AvgPortDiscardPer=(InPortDiscardper+OutPortDiscardper)/DevicePortNum;
S4.4:计算性能参数权值,首先采用基于标准方差系数的权值计算方法,分别求出PortDropPer、AvgPortErrPer、AvgPortDiscardPer在时间点t下的期望值μpdp,μape,μapd,再求出标准方差δpdp,δape,δapd,最后分别得到三个参数的标准差系数Vδpdp,Vδape,Vδapd
由下面的公式得到权值wpdp,wape,wapd
其中wpdp=Vδpdp/(Vδpdp+Vδape+Vδapd);wape=Vδape/(Vδpdp+Vδape+Vδapd);wapd=Vδapd/(Vδpdp+Vδape+Vδapd);
S4.5:数据的归一化阶段:对原始的数据值进行归一处理,让处理后的数据都落入一个较小的范围。
6.根据权利要求5所述的基于客观权重确定的网络设备健康度评估方法,其特征在于,所述步骤S4.5的具体步骤为:
S4.5.1:在时间点t下,把PortDropPer、AvgPortErrPer、AvgPortDiscardPer的所有数据用科学计数法表示,并存入历史数据库;
S4.5.2:在指定时间内的历史数据库中,分别统计所有时间点PortDropPer、AvgPortErrPer、AvgPortDiscardPer各自的nmost中出现频率最高的nmost值设定为nmid,再统计nmax历史的最大值设定为nmaxhis
S4.5.3:取出时间点t下PortDropPer参数的所有数据vaulei,经过归一化处理后得到新值newValuei,具体的处理方法:令x=nmid,y=nmaxhis,如果vaulei大于0并且vaulei小于等10x,则newValuei=0.2*(10x-vaulei)/10x;如果vaulei大于10x并且vaulei小于等于10y,则newValuei=0.6*(vaulei-10x)/vaulei;如果vaulei大10y并且vaulei小于1,则newValuei=1;如果vaulei大于1或者vaulei小于0,则newValuei=0;
S4.5.4:同理,对该时间点t下的另外两个参数AvgPortErrPer、AvgPortDiscardPer,同样采用上述步骤S4.5.1~S4.5.3的方法处理得到归一化后的值。
7.根据权利要求1或2或3或4所述的基于客观权重确定的网络设备健康度评估方法,其特征在于,所述步骤S2和步骤S3的详细流程为:
1)获取单个时间点所有设备在数据库中的原始参数数据,为计算参数权值和数据归一化处理做好准备;
2)将获得的原始参数数据,分别交给步骤3)参数权值计算模块和步骤4)参数归一化模块处理,步骤3)和步骤4)同步执行,负责完成参数的权值计算和参数数据的归一化处理,并将处理后的结果放入数据库中;
3)选择任一个设备参数,计算单个参数期望值,然后计算单个参数方差值,并根据方差系数计算公式,得到单个参数的方差系数值,继续计算其他两个设备参数的方差系数值,并将所有参数的权重值存放到数据库中;
4)先判断数据库中是否有参数数据的历史值,如果存在历史值,根据历史的参数数据动态调整归一化过程所需的参数阈值,然后调至步骤5)计算单个参数数据的归一化结果,得到参数数据的归一化结果后,存放在对应的数据库中,如果不存在历史参数值调至步骤5);
5)进行单个参数的数据归一化处理,具体步骤:
5.1)取出时间点t下PortDropPer参数的所有数据vaulei,经过归一化处理后得到新值newValuei,令x=nmid,y=nmaxhis
5.2)判断vaulei是否在较小的波动范围内,然后处理vaulei,即If(vaulei>0andvaulei<=10x)newValuei=0.2*(10x-vaulei)/10x
5.3)判断vaulei是否超处于较大的波动范围,然后处理vaulei,即If(vaulei>10xandvaulei<=10y)newValuei=0.6*(vaulei-10x)/vaulei
5.4)判断vaulei是否超出了合理的波动范围内,然后处理vaulei,即If(vaulei>10yandvaulei<=1)newValuei=1;
5.5)判断vaulei是否为不合理数据,然后处理vaulei,即If(vaulei>1orvaulei<=0)newValuei=0;
5.6)重复5.1)至5.5)所有的数据处理过程,对该时间点t下的另外两个参数AvgPortErrPer、AvgPortDiscardPer同样采用上述方法处理得到归一化后的值,然后调至步骤6);
6)结束本次采集参数数据的处理流程。
CN201510442808.XA 2015-07-24 2015-07-24 一种基于客观权重确定的网络设备健康度评估方法 Pending CN105141446A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510442808.XA CN105141446A (zh) 2015-07-24 2015-07-24 一种基于客观权重确定的网络设备健康度评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510442808.XA CN105141446A (zh) 2015-07-24 2015-07-24 一种基于客观权重确定的网络设备健康度评估方法

Publications (1)

Publication Number Publication Date
CN105141446A true CN105141446A (zh) 2015-12-09

Family

ID=54726664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510442808.XA Pending CN105141446A (zh) 2015-07-24 2015-07-24 一种基于客观权重确定的网络设备健康度评估方法

Country Status (1)

Country Link
CN (1) CN105141446A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105743705A (zh) * 2016-03-31 2016-07-06 中国人民解放军国防科学技术大学 一种基于分级策略的数据中心网络可用性评估方法及评估装置
CN106209432A (zh) * 2016-06-30 2016-12-07 中国人民解放军国防科学技术大学 基于动态阈值的网络设备亚健康预警方法及装置
CN106327099A (zh) * 2016-08-31 2017-01-11 华北电力大学(保定) 一种通信网络综合性能评定参数权重的确定及调整方法
CN106992904A (zh) * 2017-05-19 2017-07-28 湖南省起航嘉泰网络科技有限公司 基于动态综合权重的网络设备健康度评估方法
CN107566222A (zh) * 2017-10-18 2018-01-09 中国联合网络通信集团有限公司 一种计算丢包率的方法及装置
CN108766571A (zh) * 2018-05-29 2018-11-06 新华三信息安全技术有限公司 一种健康状态的评估方法和装置
CN111556104A (zh) * 2020-04-15 2020-08-18 浙江浙大中控信息技术有限公司 应用于多路采集后数据的无缝切换方式
CN113904956A (zh) * 2021-10-29 2022-01-07 新华三大数据技术有限公司 一种网络健康度检测方法、装置、电子设备及存储介质
WO2024198859A1 (zh) * 2023-03-27 2024-10-03 华为技术有限公司 数据采集频率的确定方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102457412A (zh) * 2011-10-14 2012-05-16 中国人民解放军国防科学技术大学 基于指标体系的大规模网络安全态势评估方法
CN104468200A (zh) * 2014-11-25 2015-03-25 中国人民解放军国防科学技术大学 数据中心网络设备健康度的自适应评价方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102457412A (zh) * 2011-10-14 2012-05-16 中国人民解放军国防科学技术大学 基于指标体系的大规模网络安全态势评估方法
CN104468200A (zh) * 2014-11-25 2015-03-25 中国人民解放军国防科学技术大学 数据中心网络设备健康度的自适应评价方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈琳 等: "一种面向大规模系统域网络性能评估模型", 《2014全国高性能计算学术年会论文集 》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105743705A (zh) * 2016-03-31 2016-07-06 中国人民解放军国防科学技术大学 一种基于分级策略的数据中心网络可用性评估方法及评估装置
CN105743705B (zh) * 2016-03-31 2018-12-11 中国人民解放军国防科学技术大学 一种基于分级策略的数据中心网络可用性评估方法及评估装置
CN106209432A (zh) * 2016-06-30 2016-12-07 中国人民解放军国防科学技术大学 基于动态阈值的网络设备亚健康预警方法及装置
CN106209432B (zh) * 2016-06-30 2019-04-19 中国人民解放军国防科学技术大学 基于动态阈值的网络设备亚健康预警方法及装置
CN106327099A (zh) * 2016-08-31 2017-01-11 华北电力大学(保定) 一种通信网络综合性能评定参数权重的确定及调整方法
CN106327099B (zh) * 2016-08-31 2022-05-27 华北电力大学(保定) 一种通信网络综合性能评定参数权重的确定及调整方法
CN106992904A (zh) * 2017-05-19 2017-07-28 湖南省起航嘉泰网络科技有限公司 基于动态综合权重的网络设备健康度评估方法
CN107566222A (zh) * 2017-10-18 2018-01-09 中国联合网络通信集团有限公司 一种计算丢包率的方法及装置
CN108766571A (zh) * 2018-05-29 2018-11-06 新华三信息安全技术有限公司 一种健康状态的评估方法和装置
CN111556104A (zh) * 2020-04-15 2020-08-18 浙江浙大中控信息技术有限公司 应用于多路采集后数据的无缝切换方式
CN113904956A (zh) * 2021-10-29 2022-01-07 新华三大数据技术有限公司 一种网络健康度检测方法、装置、电子设备及存储介质
WO2024198859A1 (zh) * 2023-03-27 2024-10-03 华为技术有限公司 数据采集频率的确定方法及相关装置

Similar Documents

Publication Publication Date Title
CN105141446A (zh) 一种基于客观权重确定的网络设备健康度评估方法
CN109347668B (zh) 一种服务质量评估模型的训练方法及装置
CN104468200B (zh) 数据中心网络设备健康度的自适应评价方法
CN106992904A (zh) 基于动态综合权重的网络设备健康度评估方法
EP3863223A1 (en) Method and device for training service quality evaluation model
Yan et al. A survey of traffic classification in software defined networks
CN105721194B (zh) 移动网故障隐患智能定位系统
CN109783552A (zh) 一种数据清洗修复方法
CN105743705B (zh) 一种基于分级策略的数据中心网络可用性评估方法及评估装置
CN104965784B (zh) 自动测试方法及装置
CN104683182B (zh) Idc机房网络服务质量检测方法及装置
CN110162445A (zh) 基于主机日志及性能指标的主机健康评价方法及装置
CN118017509B (zh) 基于数字孪生空间的大规模配电网并行优化方法
JP2023504103A (ja) モデル更新システム、モデル更新方法及び関連装置
CN114666224A (zh) 业务资源容量动态分配方法、装置、设备及存储介质
CN107094086A (zh) 一种信息获取方法和装置
CN106817708A (zh) 一种巡检簇构建方法及装置
CN108243439A (zh) 移动互联网数据业务质量劣化定位的方法及系统
CN106714189A (zh) 一种小区过覆盖的分析方法及装置
CN108072858A (zh) 电能表质量管理方法、系统及终端设备
CN107484189A (zh) Lte数据处理系统
KR20200126766A (ko) Ict 인프라의 운용 관리 장치 및 방법
CN117493797A (zh) 一种物联网设备的故障预测方法及装置、电子设备、存储介质
WO2023231192A1 (zh) 一种基于SRv6的智能网络及设备故障预测方法及系统
CN110602070A (zh) 一种网络安全的自动配置管理系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151209