CN111126631A - 网络健康判定方法及装置 - Google Patents

网络健康判定方法及装置 Download PDF

Info

Publication number
CN111126631A
CN111126631A CN201911117161.8A CN201911117161A CN111126631A CN 111126631 A CN111126631 A CN 111126631A CN 201911117161 A CN201911117161 A CN 201911117161A CN 111126631 A CN111126631 A CN 111126631A
Authority
CN
China
Prior art keywords
network
inspection item
index value
determining
routing inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911117161.8A
Other languages
English (en)
Inventor
晏征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongying Youchuang Information Technology Co Ltd
Original Assignee
Zhongying Youchuang Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongying Youchuang Information Technology Co Ltd filed Critical Zhongying Youchuang Information Technology Co Ltd
Priority to CN201911117161.8A priority Critical patent/CN111126631A/zh
Publication of CN111126631A publication Critical patent/CN111126631A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种网络健康判定方法及装置,该方法包括:确定目标网络的网络设备和每个网络设备的多个巡检项;对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;根据目标网络的网络健康度,对目标网络的健康进行判定。本发明可以准确地判定网络健康。

Description

网络健康判定方法及装置
技术领域
本发明涉及互联网领域,尤其涉及一种网络健康判定方法及装置。
背景技术
为了能更加有效实时反映出网络真实的健康状态,提升网络运营商的网络运维人员的工作效率,避免不必要的工作,需要判定网络健康。
传统的网络健康判定方法一般是计算网络健康度,具体过程包括:对网络中网元设置不同的巡检项,同时制订每项正常、异常的标准,并制订每项如果异常扣的分数,再定期(如一天一次)进行相关巡检,对巡检结果进行计算,得出单个网元的健康度,再取算数平均值得到网络健康度。上述传统的网络健康判断方法网络健康判定的准确度不高,传统方法由于巡检区别于网元的告警,告警是需要及时解决,但是巡检项有些是存在一定趋势,对于其中的一些异常,并不需要或无法马上去解决,所以一旦无法为运维人员提供准确且有效的建议,往往会增加其工作内容或降低其工作积极性(如:一些不需要去马上去解决的异常巡检项,但会导致健康度低的,让运维人员去排查做无用功,增加其工作量;或者有些虽然看起来影响小的巡检项,但因为存在其他关联因素或出现时间较长,从趋势发展如果不紧急处理,会出现故障)。因此,目前缺乏一种准确度高的网络健康的判定方法。
发明内容
本发明实施例提出一种网络健康判定方法,用以准确地判定网络健康,该方法包括:
确定目标网络的网络设备和每个网络设备的多个巡检项;
对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;
对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;
根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;
根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;
根据目标网络的网络健康度,对目标网络的健康进行判定。
本发明实施例提出一种网络健康判定装置,用以准确地判定网络健康,该装置包括:
巡检项确定模块,用确定目标网络的网络设备和每个网络设备的多个巡检项;
第一指标值获得模块,用于对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;
第二指标值获得模块,用于对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;
第三指标值获得模块,用于根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;
网络健康度确定模块,用于根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;
判定模块,用于根据目标网络的网络健康度,对目标网络的健康进行判定。
本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述网络健康判定方法。
本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述网络健康判定方法的计算机程序。
在本发明实施例中,确定目标网络的网络设备和每个网络设备的多个巡检项;对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;根据目标网络的网络健康度,对目标网络的健康进行判定。在上述过程中,首先基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值,然后充分考虑了该网络设备的每个巡检项与该网络设备的告警信息的关系,以及根据网络设备的多个巡检项之间的关系,对之前确定的第一指标值进行调整,使得最后确定的第三指标值更准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中网络健康判定方法的流程图;
图2为本发明实施例中确定网络健康度的示例图;
图3为本发明实施例提出的网络健康判定方法的详细流程图;
图4为本发明实施例中网络健康判定装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
图1为本发明实施例中网络健康判定方法的流程图,如图1所示,该方法包括:
步骤101,确定目标网络的网络设备和每个网络设备的多个巡检项;
步骤102,对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;
步骤103,对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;
步骤104,根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;
步骤105,根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;
步骤106,根据目标网络的网络健康度,对目标网络的健康进行判定。
在本发明实施例中,首先基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值,然后充分考虑了该网络设备的每个巡检项与该网络设备的告警信息的关系,以及根据网络设备的多个巡检项之间的关系,对之前确定的第一指标值进行调整,使得最后确定的第三指标值更准确。
具体实施时,图2为本发明实施例中确定网络健康度的示例图,在图2的示例中,目标网络包括3个网络设备,该网络设备可以是网元,在有些情况下,也可以是链路。在步骤102中,对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值,在现有技术中第一指标值经常是1(巡检项无异常)或0(巡检项存在异常),而本发明实施例中,给出了每个巡检项的预设指标值确定方式,即可以定制每个巡检项的指标值不再只采用0或1表示,可以设置多阶段的值,例如0,1,2等。
在步骤103中,有些巡检项石油网络设备的告警信息有关系的,告警往往是对网元等网络设备异常更紧迫的体现,告警信息包括告警类型和告警级别,不同的告警类型、告警级别,对于每个网络设备的健康度的影响也更大,将网络设备的巡检项与告警信息进行关联,能更加有效体现实际的网络监控状况。例如,在某网络设备无告警信息时,该网络设备的巡检项1出现异常,那么该网络设备的巡检项1的第一指标值为2,而该网络设备出现告警信息时,调整巡检项的第一指标值从2变为3,即3为巡检项1的第二指标值。
在步骤104中,网络设备的多个巡检项之间有时候也相互影响,有些巡检项可能由于另外巡检项异常引起,如果不考虑这些关系,可能会存在指标值异常的现象,而让无法实际体现网络健康情况;而有些巡检项,一旦多个异常,往往能更加佐证网络出现了问题,反而需要加重对网络健康度的影响。图2中,巡检项POOL即巡检项池,巡检项POOL里面的巡检项能够互相影响,即多个巡检项之间是有关系的,该关系可以是同一个网络设备的多个巡检项之间的关系,也可以是不同网络设备的多个巡检项之间的关系,图2的示例中巡检项POOL里面的网络设备A的巡检项3与网络设备B的巡检项3有关系,具体关系为网络设备A的巡检项3出现异常后,会引起网络设备B的巡检项3出现异常,因此,若网络设备A的巡检项3的第二指标值为2(代表出现异常),那么调整网络设备B的巡检项3的第二指标值由原来的2变为为0(代表正常),即网络设备B的巡检项3的第三指标值为0,使得巡检项之间的指标值的准确度更高。在步骤105中,由于每个网络设备的每个巡检项的第三指标值均确定了,可以通过加权求和的方式获得目标网络的网络健康度,从而进入步骤106,根据目标网络的网络健康度,对目标网络的健康进行判定。
在一实施例中,所述预设指标值确定方式包括基线值确定方式或固定阈值确定方式;
对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值,包括:
对每一网络设备的每个巡检项,若该巡检项的预设指标值确定方式为基线值确定方式,获取该巡检项的历史指标值,根据所述历史指标值确定该巡检项的基线值;基于所述基线值和第一预设误差阈值,确定该巡检项的第一指标值;
若该巡检项的预设指标值确定方式为固定阈值确定方式,基于所述固定阈值和第二预设误差阈值,确定该巡检项的第一指标值。
在上述实施例中,若该巡检项的预设指标值确定方式为基线值确定方式,这类巡检项一般都是直接用数据值展示巡检项是否异常的,从其他数据库或存储介质上获得该巡检项的历史指标值,采用线性回归算法或者ARIMA模型算法等计算出该巡检项的基线值,从而取代传统的固定阈值的方法作为判断异常的判断标准,例如,巡检项1的基线值为90,然后确定第一预设误差阈值,该第一预设误差阈值可以有多个,例如,可以有两个,分别为10和5,那么该巡检项的第一指标值可以有四个范围,分别是0-80,80-85,85-90,90-100,在确定巡检项的第一指标值时,可以根据巡检项的异常程度,从上述四个范围内确定一个值。若该巡检项的预设指标值确定方式为固定阈值确定方式,基于所述固定阈值和第二预设误差阈值,确定该巡检项的第一指标值,且第二预设误差阈值也可以为多个。上述方法取代了传统的只有1(成功)和0(失败)的指标值,提高了第一指标值的准确度。
具体实施时,根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度的方法有多种,下面给出其中一个实施例。
在一实施例中,根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度,包括:
对每一网络设备,确定该网络设备的每个巡检项的权重;
根据该网络设备的每个巡检项的第三指标值和权重,确定该网络设备的健康度;
确定每个网络设备的权重;
根据每个网络设备的健康度和权重,确定目标网络的网络健康度。
在上述实施例中,是通过加权求和的方式,确定每个网络设备的健康度和目标网络的网络健康度的,其中权重的确定方法有多种,例如,层次分析法、专家打分法等,这里不再赘述。在确定每个网络设备的权重时,可针对不同类型网络设备、或者同类但不同位置的网络设备建立不同的权重(如有些网络设备所处位置需要重点保障,可提升其权重)。根据每个网络设备的健康度和权重,确定目标网络的网络健康度的公式可以如下:
Figure BDA0002274389060000061
其中,d为目标网络的网络健康度,ai和bi分别为第i个网络设备的健康度和权重,n为网络设备的个数。
在一实施例中,确定该网络设备的每个巡检项的权重,包括:
根据该网络设备的每个巡检项出现异常的时刻,确定每个巡检项的权重。
在上述实施例中,除了层次分析法等常规确定权重的方法,这里给出了另外一种确定该网络设备的每个巡检项的权重的方法,由于在网络设备中,不同的巡检项出现异常的时刻不同,例如工作日、休息日,夜间、白天,而在工作日白天出现异常对目标网络的健康度影响最大,因此,若一个巡检项在工作日白天出现异常,则在原权重的基础上,可提高该巡检项的权重,使得最后给出的网络健康度更加符合实际情况,即准确度更高。
具体实施时,为了保证网络的正常运行,越来越多的网络设备采取负载分担或者主备(多个网元在一个网络设备池)的方式,某一个网络设备(如MME)异常不代表整个网络设备池(如MME POOL)异常,即整个网络设备池是正常的,则不代表网络质量劣化,不影响网络健康度。因此,在一实施例中,在根据每个网络设备的健康度和权重,确定目标网络的网络健康度之前,还包括:
基于多个网络设备之间的关系,调整每个网络设备的健康度;
根据每个网络设备的调整后的健康度和权重,确定目标网络的网络健康度。
在一实施例中,在获得每个巡检项的第一指标值之后,还包括:
在设定时长内,统计每个巡检项出现异常的频次;
根据每个巡检项出现异常的频次,调整每个巡检项的第一指标值。
在上述实施例中,若在设定时长内,某个巡检项出现的频次过高,则可以提高该巡检项的第一指标值,从而提高最后网络健康度的准确度。
在现有技术中,存在网络网络健康判定不及时的问题,即虽然能简单看出网络可能存在的异常情况,但是考虑的因素较少,同时没有快速动态去观察和确认异常的变化情况,只能等到次日再次巡检再进行健康度的计算,这样就很难真正体现出网络实际的健康度,让运维人员无法对网络实际状况做出有效的判断。因此,为了提高对目标网络进行判断的准确度,需要反复确定目标网络的网络健康度,即对目标网络的网络健康度进行动态修改。下面给出两个动态修正的实施例。
在一实施例中,在确定目标网络的网络健康度之后,还包括:
每隔设定时长,检查出现异常的巡检项是否恢复正常;
在出现异常的巡检项恢复正常后,重新确定该巡检项的第一指标值;
根据重新确定的该巡检项的第一指标值,重新确定目标网络的网络健康度。
在上述实施例中,设定时长可以是15分钟一次,可以连续确认三次,同时可设置是否确认出现异常消除则停止的选项。如果出现变化,即出现异常的巡检项恢复正常,则去更新对于巡检项的第一指标值,以及网络健康度。
在一实施例中,在确定目标网络的网络健康度之后,还包括:
每隔设定时长,对存在告警信息的网络设备,检查该网络设备的告警信息是否消除;
在该网络设备的告警信息消除后,重新确定与该网络设备的告警信息有关系的巡检项的第二指标值;
根据所述与该网络设备的告警信息有关系的巡检项的第二指标值,重新确定目标网络的网络健康度。
在上述实施例中,一些与告警信息有关系的巡检项,可设置一定频率和次数去判断告警信息是否消除,一旦告警信息消除,则调整对应的检查项的第二指标值和网络健康度。
另外,对于对于有些特殊情况,如运维人员已知当前巡检项符合异常判断,但无法马上解决,同时又不影响业务正常运行的,可设置对巡检项异常的挂起,挂起可选择时间段。在对应时间段挂起的巡检项确认无异常,从而使得确定的网络健康度更夫符合实际情况。这种动态修正,可提高计算网络健康度的速度,例如,动态修正指标值后,根据权重直接更新网络健康度即可(如某个巡检项的权重为0.21%,由原先指标值0(严重异常)变为1(正常),只需要在整体的网络健康度增加0.21%即可),而不用再重新进行复杂的网络健康度计算。
基于上述实施例,本发明提出如下一个实施例来说明网络健康判定方法的详细流程,图3为本发明实施例提出的网络健康判定方法的详细流程图,如图3所示,在一实施例中,网络健康判定方法的详细流程包括:
步骤301,确定目标网络的网络设备和每个网络设备的多个巡检项;
步骤302,对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;
对每一网络设备的每个巡检项,若该巡检项的预设指标值确定方式为基线值确定方式,获取该巡检项的历史指标值,根据所述历史指标值确定该巡检项的基线值;基于所述基线值和第一预设误差阈值,确定该巡检项的第一指标值;
若该巡检项的预设指标值确定方式为固定阈值确定方式,基于所述固定阈值和第二预设误差阈值,确定该巡检项的第一指标值;
步骤303,在设定时长内,统计每个巡检项出现异常的频次;
步骤304,根据每个巡检项出现异常的频次,调整每个巡检项的第一指标值;
步骤305,对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;
步骤306,根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;
步骤307,对每一网络设备,确定该网络设备的每个巡检项的权重;
步骤308,根据该网络设备的每个巡检项的第三指标值和权重,确定该网络设备的健康度;
步骤309,确定每个网络设备的权重;
步骤310,根据每个网络设备的健康度和权重,确定目标网络的网络健康度,转至步骤311、步骤312和步骤313;
步骤311,每隔设定时长,检查出现异常的巡检项是否恢复正常;在出现异常的巡检项恢复正常后,转至步骤302;
步骤312,每隔设定时长,对存在告警信息的网络设备,检查该网络设备的告警信息是否消除;在该网络设备的告警信息消除后,转至步骤305;
步骤313,根据目标网络的网络健康度,对目标网络的健康进行判定。
当然,可以理解的是,上述网络健康判定方法的详细流程还可以有其他变化例,相关变化例均应落入本发明的保护范围。
综上所述,在本发明实施例提出的方法中,确定目标网络的网络设备和每个网络设备的多个巡检项;对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;根据目标网络的网络健康度,对目标网络的健康进行判定。在上述过程中,首先基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值,然后充分考虑了该网络设备的每个巡检项与该网络设备的告警信息的关系,以及根据网络设备的多个巡检项之间的关系,对之前确定的第一指标值进行调整,使得最后确定的第三指标值更准确。另外,本发明实施例采用了动态修正的方法,提高计算网络健康度的速度,替代了传统的要等到下一次集体巡检时才能更新网络健康度的方法,能为运维人员提供更加实时准确的网络健康情况。
基于同样的发明构思,本发明实施例还提供了一种网络健康判定装置,如下面的实施例所述。由于这些解决问题的原理与网络健康判定方法相似,因此装置的实施可以参见方法的实施,重复之处不在赘述。
图4为本发明实施例中网络健康判定装置的示意图,如图4所示,该装置包括:
巡检项确定模块401,用确定目标网络的网络设备和每个网络设备的多个巡检项;
第一指标值获得模块402,用于对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;
第二指标值获得模块403,用于对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;
第三指标值获得模块404,用于根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;
网络健康度确定模块405,用于根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;
判定模块406,用于根据目标网络的网络健康度,对目标网络的健康进行判定。
在一实施例中,所述预设指标值确定方式包括基线值确定方式或固定阈值确定方式;
第一指标值获得模块402具体用于:
对每一网络设备的每个巡检项,若该巡检项的预设指标值确定方式为基线值确定方式,获取该巡检项的历史指标值,根据所述历史指标值确定该巡检项的基线值;基于所述基线值和第一预设误差阈值,确定该巡检项的第一指标值;
若该巡检项的预设指标值确定方式为固定阈值确定方式,基于所述固定阈值和第二预设误差阈值,确定该巡检项的第一指标值。
在一实施例中,网络健康度确定模块405具体用于:
对每一网络设备,确定该网络设备的每个巡检项的权重;
根据该网络设备的每个巡检项的第三指标值和权重,确定该网络设备的健康度;
确定每个网络设备的权重;
根据每个网络设备的健康度和权重,确定目标网络的网络健康度。
在一实施例中,网络健康度确定模块405具体用于:
根据该网络设备的每个巡检项出现异常的时刻,确定每个巡检项的权重。
在一实施例中,所述装置还包括调整模块407,用于:
在获得每个巡检项的第一指标值之后,在设定时长内,统计每个巡检项出现异常的频次;
根据每个巡检项出现异常的频次,调整每个巡检项的第一指标值。
在一实施例中,所述装置还包括第一检查模块408,用于:
在确定目标网络的网络健康度之后,每隔设定时长,检查出现异常的巡检项是否恢复正常;
在出现异常的巡检项恢复正常后,重新确定该巡检项的第一指标值;
根据重新确定的该巡检项的第一指标值,重新确定目标网络的网络健康度。
在一实施例中,所述装置还包括第二检查模块409,用于:
在确定目标网络的网络健康度之后,每隔设定时长,对存在告警信息的网络设备,检查该网络设备的告警信息是否消除;
在该网络设备的告警信息消除后,重新确定与该网络设备的告警信息有关系的巡检项的第二指标值;
根据所述与该网络设备的告警信息有关系的巡检项的第二指标值,重新确定目标网络的网络健康度。
综上所述,在本发明实施例提出的装置中,确定目标网络的网络设备和每个网络设备的多个巡检项;对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;根据目标网络的网络健康度,对目标网络的健康进行判定。在上述过程中,首先基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值,然后充分考虑了该网络设备的每个巡检项与该网络设备的告警信息的关系,以及根据网络设备的多个巡检项之间的关系,对之前确定的第一指标值进行调整,使得最后确定的第三指标值更准确。另外,本发明实施例采用了动态修正的方法,提高计算网络健康度的速度,替代了传统的要等到下一次集体巡检时才能更新网络健康度的方法,能为运维人员提供更加实时准确的网络健康情况。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种网络健康判定方法,其特征在于,包括:
确定目标网络的网络设备和每个网络设备的多个巡检项;
对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;
对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;
根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;
根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;
根据目标网络的网络健康度,对目标网络的健康进行判定。
2.如权利要求1所述的网络健康判定方法,其特征在于,所述预设指标值确定方式包括基线值确定方式或固定阈值确定方式;
对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值,包括:
对每一网络设备的每个巡检项,若该巡检项的预设指标值确定方式为基线值确定方式,获取该巡检项的历史指标值,根据所述历史指标值确定该巡检项的基线值;基于所述基线值和第一预设误差阈值,确定该巡检项的第一指标值;
若该巡检项的预设指标值确定方式为固定阈值确定方式,基于所述固定阈值和第二预设误差阈值,确定该巡检项的第一指标值。
3.如权利要求1所述的网络健康判定方法,其特征在于,根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度,包括:
对每一网络设备,确定该网络设备的每个巡检项的权重;
根据该网络设备的每个巡检项的第三指标值和权重,确定该网络设备的健康度;
确定每个网络设备的权重;
根据每个网络设备的健康度和权重,确定目标网络的网络健康度。
4.如权利要求3所述的网络健康判定方法,其特征在于,确定该网络设备的每个巡检项的权重,包括:
根据该网络设备的每个巡检项出现异常的时刻,确定每个巡检项的权重。
5.如权利要求1所述的网络健康判定方法,其特征在于,在获得每个巡检项的第一指标值之后,还包括:
在设定时长内,统计每个巡检项出现异常的频次;
根据每个巡检项出现异常的频次,调整每个巡检项的第一指标值。
6.如权利要求1所述的网络健康判定方法,其特征在于,在确定目标网络的网络健康度之后,还包括:
每隔设定时长,检查出现异常的巡检项是否恢复正常;
在出现异常的巡检项恢复正常后,重新确定该巡检项的第一指标值;
根据重新确定的该巡检项的第一指标值,重新确定目标网络的网络健康度。
7.如权利要求1所述的网络健康判定方法,其特征在于,在确定目标网络的网络健康度之后,还包括:
每隔设定时长,对存在告警信息的网络设备,检查该网络设备的告警信息是否消除;
在该网络设备的告警信息消除后,重新确定与该网络设备的告警信息有关系的巡检项的第二指标值;
根据所述与该网络设备的告警信息有关系的巡检项的第二指标值,重新确定目标网络的网络健康度。
8.一种网络健康判定装置,其特征在于,包括:
巡检项确定模块,用确定目标网络的网络设备和每个网络设备的多个巡检项;
第一指标值获得模块,用于对每一网络设备,基于该网络设备的每个巡检项的预设指标值确定方式,获得每个巡检项的第一指标值;
第二指标值获得模块,用于对每一网络设备,根据该网络设备的每个巡检项与该网络设备的告警信息的关系,调整每个巡检项的第一指标值,获得每个巡检项的第二指标值;
第三指标值获得模块,用于根据多个网络设备的多个巡检项之间的关系,调整每个网络设备的每个巡检项的第二指标值,获得每个巡检项的第三指标值;
网络健康度确定模块,用于根据多个网络设备的多个巡检项的第三指标值,确定目标网络的网络健康度;
判定模块,用于根据目标网络的网络健康度,对目标网络的健康进行判定。
9.如权利要求8所述的网络健康判定装置,其特征在于,所述预设指标值确定方式包括基线值确定方式或固定阈值确定方式;
第一指标值获得模块具体用于:
对每一网络设备的每个巡检项,若该巡检项的预设指标值确定方式为基线值确定方式,获取该巡检项的历史指标值,根据所述历史指标值确定该巡检项的基线值;基于所述基线值和第一预设误差阈值,确定该巡检项的第一指标值;
若该巡检项的预设指标值确定方式为固定阈值确定方式,基于所述固定阈值和第二预设误差阈值,确定该巡检项的第一指标值。
10.如权利要求8所述的网络健康判定装置,其特征在于,网络健康度确定模块具体用于:
对每一网络设备,确定该网络设备的每个巡检项的权重;
根据该网络设备的每个巡检项的第三指标值和权重,确定该网络设备的健康度;
确定每个网络设备的权重;
根据每个网络设备的健康度和权重,确定目标网络的网络健康度。
11.如权利要求10所述的网络健康判定装置,其特征在于,网络健康度确定模块具体用于:
根据该网络设备的每个巡检项出现异常的时刻,确定每个巡检项的权重。
12.如权利要求8所述的网络健康判定装置,其特征在于,还包括调整模块,用于:
在获得每个巡检项的第一指标值之后,在设定时长内,统计每个巡检项出现异常的频次;
根据每个巡检项出现异常的频次,调整每个巡检项的第一指标值。
13.如权利要求8所述的网络健康判定装置,其特征在于,还包括第一检查模块,用于:
在确定目标网络的网络健康度之后,每隔设定时长,检查出现异常的巡检项是否恢复正常;
在出现异常的巡检项恢复正常后,重新确定该巡检项的第一指标值;
根据重新确定的该巡检项的第一指标值,重新确定目标网络的网络健康度。
14.如权利要求8所述的网络健康判定装置,其特征在于,还包括第二检查模块,用于:
在确定目标网络的网络健康度之后,每隔设定时长,对存在告警信息的网络设备,检查该网络设备的告警信息是否消除;
在该网络设备的告警信息消除后,重新确定与该网络设备的告警信息有关系的巡检项的第二指标值;
根据所述与该网络设备的告警信息有关系的巡检项的第二指标值,重新确定目标网络的网络健康度。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至7任一项所述方法的计算机程序。
CN201911117161.8A 2019-11-15 2019-11-15 网络健康判定方法及装置 Pending CN111126631A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911117161.8A CN111126631A (zh) 2019-11-15 2019-11-15 网络健康判定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911117161.8A CN111126631A (zh) 2019-11-15 2019-11-15 网络健康判定方法及装置

Publications (1)

Publication Number Publication Date
CN111126631A true CN111126631A (zh) 2020-05-08

Family

ID=70495606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911117161.8A Pending CN111126631A (zh) 2019-11-15 2019-11-15 网络健康判定方法及装置

Country Status (1)

Country Link
CN (1) CN111126631A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112054937A (zh) * 2020-08-18 2020-12-08 浪潮思科网络科技有限公司 一种云网融合环境中sdn健康巡检方法、设备及装置
CN112565007A (zh) * 2020-11-27 2021-03-26 中盈优创资讯科技有限公司 一种系统健康度评价方法及装置
CN113904956A (zh) * 2021-10-29 2022-01-07 新华三大数据技术有限公司 一种网络健康度检测方法、装置、电子设备及存储介质
CN114095345A (zh) * 2021-10-22 2022-02-25 深信服科技股份有限公司 主机网络健康状况评估方法、装置、设备和存储介质
CN115190039A (zh) * 2022-07-31 2022-10-14 苏州浪潮智能科技有限公司 一种设备健康评测方法、系统、设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102123052A (zh) * 2011-03-30 2011-07-13 北京星网锐捷网络技术有限公司 业务系统可用性评估方法及系统
CN102447570A (zh) * 2010-09-30 2012-05-09 中国移动通信集团福建有限公司 一种基于健康度分析的监控装置及方法
WO2017076328A1 (zh) * 2015-11-05 2017-05-11 中兴通讯股份有限公司 一种数据中心巡检方法及装置
CN108768710A (zh) * 2018-05-18 2018-11-06 国家电网公司信息通信分公司 一种光传输网络健康的动态权重评估方法、模型及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102447570A (zh) * 2010-09-30 2012-05-09 中国移动通信集团福建有限公司 一种基于健康度分析的监控装置及方法
CN102123052A (zh) * 2011-03-30 2011-07-13 北京星网锐捷网络技术有限公司 业务系统可用性评估方法及系统
WO2017076328A1 (zh) * 2015-11-05 2017-05-11 中兴通讯股份有限公司 一种数据中心巡检方法及装置
CN108768710A (zh) * 2018-05-18 2018-11-06 国家电网公司信息通信分公司 一种光传输网络健康的动态权重评估方法、模型及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邱潇钰: "《信息系统灾难恢复技术》", 西安电子科技大学出版社, pages: 115 - 66 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112054937A (zh) * 2020-08-18 2020-12-08 浪潮思科网络科技有限公司 一种云网融合环境中sdn健康巡检方法、设备及装置
CN112565007A (zh) * 2020-11-27 2021-03-26 中盈优创资讯科技有限公司 一种系统健康度评价方法及装置
CN114095345A (zh) * 2021-10-22 2022-02-25 深信服科技股份有限公司 主机网络健康状况评估方法、装置、设备和存储介质
CN113904956A (zh) * 2021-10-29 2022-01-07 新华三大数据技术有限公司 一种网络健康度检测方法、装置、电子设备及存储介质
CN115190039A (zh) * 2022-07-31 2022-10-14 苏州浪潮智能科技有限公司 一种设备健康评测方法、系统、设备以及存储介质
CN115190039B (zh) * 2022-07-31 2023-08-08 苏州浪潮智能科技有限公司 一种设备健康评测方法、系统、设备以及存储介质

Similar Documents

Publication Publication Date Title
CN111126631A (zh) 网络健康判定方法及装置
CN107871190B (zh) 一种业务指标监控方法及装置
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN105095747B (zh) 一种Java应用健康度评估方法及系统
CN111679952B (zh) 告警阈值生成方法及装置
CN104778111A (zh) 一种进行报警的方法和装置
US7299367B2 (en) Methods, systems and computer program products for developing resource monitoring systems from observational data
CN111143102A (zh) 异常数据检测方法、装置、存储介质及电子设备
CN110068435B (zh) 振动分析系统及方法
US9244711B1 (en) Virtual machine capacity planning
CN112130892A (zh) 产品灰度发布方法、装置、设备及存储介质
CN108320112B (zh) 一种确定设备健康状态的方法及装置
CN112380089A (zh) 一种数据中心监控预警方法及系统
CN117313957B (zh) 基于大数据分析的生产流水任务量智能预测方法
CN114021846A (zh) 工业企业设备状态预警方法及系统
CN114363212B (zh) 一种设备检测方法、装置、设备和存储介质
US10021013B2 (en) Optimizing the monitoring of an enterprise server environment
CN112508316A (zh) 实时异常检测系统中的自适应异常判定方法和装置
CN113590427A (zh) 一种监控指标异常的告警方法、装置、存储介质和设备
CN111258854B (zh) 模型训练方法、基于预测模型的报警方法和相关装置
CN108376553A (zh) 一种视频服务器的磁盘的监控方法及系统
CN108549981A (zh) 一种提高大批量并行业务流程服务质量的方法
CN110738327B (zh) 一种快充桩设备风险评估方法及系统
US10862812B2 (en) Information processing apparatus, data management system, data management method, and non-transitory computer readable medium storing program
CN116663747A (zh) 一种基于数据中心基础设施的智能预警方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200508