CN114301817A - 基于Netconf协议的设备监测阈值设置方法和系统 - Google Patents

基于Netconf协议的设备监测阈值设置方法和系统 Download PDF

Info

Publication number
CN114301817A
CN114301817A CN202111549691.7A CN202111549691A CN114301817A CN 114301817 A CN114301817 A CN 114301817A CN 202111549691 A CN202111549691 A CN 202111549691A CN 114301817 A CN114301817 A CN 114301817A
Authority
CN
China
Prior art keywords
network equipment
monitoring index
monitoring
time
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111549691.7A
Other languages
English (en)
Inventor
岳静波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Digital Intelligence Technology Co Ltd
Original Assignee
China Telecom Digital Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Digital Intelligence Technology Co Ltd filed Critical China Telecom Digital Intelligence Technology Co Ltd
Priority to CN202111549691.7A priority Critical patent/CN114301817A/zh
Publication of CN114301817A publication Critical patent/CN114301817A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种基于Netconf协议的设备监测阈值设置方法和系统。其中方法包括设置网络设备的监测指标和监测指标的第一阈值;获取网络设备故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间;判断网络设备故障持续时间是否超过目标时间;如果否,确定网络设备故障为误报;如果是,判断网络设备故障超过目标时间的次数是否超过目标次数;如果是,调整监测指标第一阈值,得到监测指标的第二阈值,并存储至历史阈值数据库;如果否,确定网络设备故障为误报;确定以监测指标的第二阈值监测网络设备。本发明采用上述方案,避免按照原有的阈值进行报警,会出现大量误报的情况。

Description

基于Netconf协议的设备监测阈值设置方法和系统
技术领域
本发明属于网络通信技术领域,尤其涉及一种基于Netconf协议的设备监测阈值设置方法和系统。
背景技术
随着信息时代的发展,网络配置协议(network configuration protocol,Netconf)在软件定义网络(software define network,SDN)中广泛使用。Netconf协议是基于XML的网络配置协议,通过对网络设备抽象出的YANG模型,用户可以使用这套机制对网络设备的配置进行增加、删除、查询和修改。
目前对于支持Netconf协议的网络设备,它的配置同步和上载方法,主要是通过读取网管设备数据库中保存的网络设备的XML配置信息,生成对应的EDIT-CONFIG类型XML报文以及自定义的RPC类型XML报文。为了保障网络设备的正常运行,需要对网络设备的部件参数设置阈值进行监测预警,例如,当CPU的运行内存超过50%时,Netconf客户端就会发生警报。在新网络设备上线后,网管设备将XML报文下发到新网络设备上,实现新网络设备的配置同步和上载。然而,新网络设备的部件参数可能与原有的网络设备的部件参数不同,按照原有的阈值进行报警,会出现大量误报的情况。
发明内容
本发明提供一种基于Netconf协议的设备监测阈值设置方法和系统,可用于解决现有技术中出现大量误报的情况的问题。
第一方面,本发明提供一种基于Netconf协议的设备监测阈值设置方法,包括:
设置Netconf服务器对网络设备的监测指标和监测指标的第一阈值,所述监测指标包括网络设备的网络流量、CPU的运行内存以及硬盘的存储空间;
将Netconf服务器的IP地址、监测指标和监测指标的第一阈值存储至历史阈值数据库;
获取网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间;
判断网络设备一天内故障持续时间是否超过目标时间;
如果否,确定网络设备故障为误报;
如果是,判断网络设备一天内故障超过目标时间的次数是否超过目标次数;
如果是,根据网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间调整监测指标第一阈值,得到监测指标的第二阈值,并存储至历史阈值数据库;
如果否,确定网络设备故障为误报;
确定以监测指标的第二阈值监测网络设备。
进一步地,所述设备监测阈值设置方法还包括将网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间存储至历史阈值数据库。
进一步地,所述网络设备提供规范的应用程序编程接口API,Netconf服务器通过编程接口API,向网络设备发送和获取配置信息。
第二方面,本发明提供一种基于Netconf协议的设备监测阈值设置系统,包括:
设置模块,用于设置Netconf服务器对网络设备的监测指标和监测指标的第一阈值,所述监测指标包括网络设备的网络流量、CPU的运行内存以及硬盘的存储空间;
第一存储模块,用于将Netconf服务器的IP地址、监测指标和监测指标的第一阈值存储至历史阈值数据库;
获取模块,用于获取网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间;
第一判断模块,用于判断网络设备一天内故障持续时间是否超过目标时间;
第一确定模块,用于在第一判断模块确定网络设备一天内故障持续时间不超过目标时间的情况下,确定网络设备故障为误报;
第二判断模块,用于在第一判断模块确定网络设备一天内故障持续时间超过目标时间的情况下,判断网络设备一天内故障超过目标时间的次数是否超过目标次数;
调整模块,用于在第二判断模块确定网络设备一天内故障超过目标时间的次数超过目标次数的情况下,根据网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间调整监测指标第一阈值,得到监测指标的第二阈值,并存储至历史阈值数据库;
第二确定模块,用于在第二判断模块确定网络设备一天内故障超过目标时间的次数不超过目标次数的情况下,确定网络设备故障为误报;
第三确定模块,用于确定以监测指标的第二阈值监测网络设备。
进一步地,所述设备监测阈值设置系统还包括:
第二存储模块,用于将网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间存储至历史阈值数据库。
本发明提供一种基于Netconf协议的设备监测阈值设置方法和系统。其中方法包括设置Netconf服务器对网络设备的监测指标和监测指标的第一阈值,所述监测指标包括网络设备的网络流量、CPU的运行内存以及硬盘的存储空间;将Netconf服务器的IP地址、监测指标和监测指标的第一阈值存储至历史阈值数据库;获取网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间;判断网络设备一天内故障持续时间是否超过目标时间;如果否,确定网络设备故障为误报;如果是,判断网络设备一天内故障超过目标时间的次数是否超过目标次数;如果是,根据网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间调整监测指标第一阈值,得到监测指标的第二阈值,并存储至历史阈值数据库;如果否,确定网络设备故障为误报;确定以监测指标的第二阈值监测网络设备。本发明采用上述方案,避免新网络设备的部件参数可能与原有的网络设备的部件参数不同,按照原有的阈值进行报警,会出现大量误报的情况。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例部分提供的一种基于Netconf协议的设备监测阈值设置方法的工作流程图;
图2为本发明实施例部分提供的一种基于Netconf协议的设备监测阈值设置系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如背景技术中所述为了保障网络设备的正常运行,需要对网络设备的部件参数设置阈值进行监测预警,例如,当CPU的运行内存超过50%时,Netconf客户端就会发生警报。在新网络设备上线后,网管设备将XML报文下发到新网络设备上,实现新网络设备的配置同步和上载。然而,新网络设备的部件参数可能与原有的网络设备的部件参数不同,按照原有的阈值进行报警,会出现大量误报的情况。
因此,为了解决上述问题,本发明实施例提供一种基于Netconf协议的设备监测阈值设置方法。如图1所示,所述设备监测阈值设置方法包括:
步骤S101,设置Netconf服务器对网络设备的监测指标和监测指标的第一阈值,所述监测指标包括网络设备的网络流量、CPU的运行内存以及硬盘的存储空间。
步骤S102,将Netconf服务器的IP地址、监测指标和监测指标的第一阈值存储至历史阈值数据库。
步骤S101-S102中,Netconf协议也可以叫做网络配置协议,它提供了一套管理网络设备的机制,用户可以使用这套机制增加,修改,删除网络设备的配置,获取网络设备的配置和状态信息。通过Netconf协议,网络设备可以提供规范的应用程序编程接口API,Netconf服务器可以直接使用这些编程接口API,向网络设备发送和获取配置。
采用Netconf管理协议来管理Netconf服务器并设置订阅监控事件。用户向设备订阅事件后,设备上发生用户订阅的事件时,设备会自动向订阅的客户端发送事件的相关信息。订阅只对当前链接生效。如果连链接开,订阅会自动取消。如果不配置订阅的事件流,则缺省订阅Syslog事件。通过程序命令执行对Netconf服务器订阅监控事件ColumnCondition字段监测阈值的设置。NETCONF客户端在Netconf服务器中订阅监控事件监测时间取值为1秒,参数名称:interval,从而完成对网络设备Netconf服务器的秒级巡检设置;将携带所述事件通知转换为Netconf客户端能够识别的格式后发送至Netconf客户端。同时将Netconf服务器的IP地址、监测指标及监测指标ColumnCondition字段的值,即监测阈值存储到历史阈值数据库。
步骤S103,获取网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间。
本步骤中,Netconf服务器监测指标的数据超过设置在ColumnCondition字段的阈值,触发监控事件的监测指标故障消息后主动上报给Netconf客户端。Netconf客户端在Netconf服务器中订阅监控事件监测时间取值为1~4294967,缺省值为300,单位为秒,即每隔300秒获取一次符合订阅条件的信息。
步骤S104,判断网络设备一天内故障持续时间是否超过目标时间。故障持续时间为故障发生时间与故障解决时间之间的时间差。
步骤S105,如果否,确定网络设备故障为误报。
步骤S106,如果是,判断网络设备一天内故障超过目标时间的次数是否超过目标次数。
步骤S107,如果是,根据网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间调整监测指标第一阈值,得到监测指标的第二阈值,并存储至历史阈值数据库。同时将
步骤S108,如果否,确定网络设备故障为误报。
步骤S109,确定以监测指标的第二阈值监测网络设备。
步骤S101-S109所述的技术方案,避免新网络设备的部件参数可能与原有的网络设备的部件参数不同,按照原有的阈值进行报警,会出现大量误报的情况。
如图2所示,本发明实施例部分还提供一种基于Netconf协议的设备监测阈值设置系统,包括:
设置模块10,用于设置Netconf服务器对网络设备的监测指标和监测指标的第一阈值,所述监测指标包括网络设备的网络流量、CPU的运行内存以及硬盘的存储空间;
第一存储模块20,用于将Netconf服务器的IP地址、监测指标和监测指标的第一阈值存储至历史阈值数据库;
获取模块30,用于获取网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间;
第一判断模块40,用于判断网络设备一天内故障持续时间是否超过目标时间;
第一确定模块50,用于在第一判断模块确定网络设备一天内故障持续时间不超过目标时间的情况下,确定网络设备故障为误报;
第二判断模块60,用于在第一判断模块确定网络设备一天内故障持续时间超过目标时间的情况下,判断网络设备一天内故障超过目标时间的次数是否超过目标次数;
调整模块70,用于在第二判断模块确定网络设备一天内故障超过目标时间的次数超过目标次数的情况下,根据网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间调整监测指标第一阈值,得到监测指标的第二阈值,并存储至历史阈值数据库;
第二确定模块80,用于在第二判断模块确定网络设备一天内故障超过目标时间的次数不超过目标次数的情况下,确定网络设备故障为误报;
第三确定模块90,用于确定以监测指标的第二阈值监测网络设备。
可选的,所述设备监测阈值设置系统还包括:
第二存储模块,用于将网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间存储至历史阈值数据库。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上结合具体实施方式和范例性实例对本发明进行了详细说明,不过这些说明并不能理解为对本发明的限制。本领域技术人员理解,在不偏离本发明精神和范围的情况下,可以对本发明技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本发明的范围内。本发明的保护范围以所附权利要求为准。

Claims (5)

1.一种基于Netconf协议的设备监测阈值设置方法,其特征在于,包括:
设置Netconf服务器对网络设备的监测指标和监测指标的第一阈值,所述监测指标包括网络设备的网络流量、CPU的运行内存以及硬盘的存储空间;
将Netconf服务器的IP地址、监测指标和监测指标的第一阈值存储至历史阈值数据库;
获取网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间;
判断网络设备一天内故障持续时间是否超过目标时间;
如果否,确定网络设备故障为误报;
如果是,判断网络设备一天内故障超过目标时间的次数是否超过目标次数;
如果是,根据网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间调整监测指标第一阈值,得到监测指标的第二阈值,并存储至历史阈值数据库;
如果否,确定网络设备故障为误报;
确定以监测指标的第二阈值监测网络设备。
2.根据权利要求1所述的设备监测阈值设置方法,其特征在于,还包括将网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间存储至历史阈值数据库。
3.根据权利要求1所述的设备监测阈值设置方法,其特征在于,所述网络设备提供规范的应用程序编程接口API,Netconf服务器通过编程接口API,向网络设备发送和获取配置信息。
4.一种基于Netconf协议的设备监测阈值设置系统,其特征在于,包括:
设置模块,用于设置Netconf服务器对网络设备的监测指标和监测指标的第一阈值,所述监测指标包括网络设备的网络流量、CPU的运行内存以及硬盘的存储空间;
第一存储模块,用于将Netconf服务器的IP地址、监测指标和监测指标的第一阈值存储至历史阈值数据库;
获取模块,用于获取网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间;
第一判断模块,用于判断网络设备一天内故障持续时间是否超过目标时间;
第一确定模块,用于在第一判断模块确定网络设备一天内故障持续时间不超过目标时间的情况下,确定网络设备故障为误报;
第二判断模块,用于在第一判断模块确定网络设备一天内故障持续时间超过目标时间的情况下,判断网络设备一天内故障超过目标时间的次数是否超过目标次数;
调整模块,用于在第二判断模块确定网络设备一天内故障超过目标时间的次数超过目标次数的情况下,根据网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间调整监测指标第一阈值,得到监测指标的第二阈值,并存储至历史阈值数据库;
第二确定模块,用于在第二判断模块确定网络设备一天内故障超过目标时间的次数不超过目标次数的情况下,确定网络设备故障为误报;
第三确定模块,用于确定以监测指标的第二阈值监测网络设备。
5.根据权利要求4所述的设备监测阈值设置系统,其特征在于,还包括:
第二存储模块,用于将网络设备一天内故障发生次数和故障过程中的监测指标、监测指标的数值、故障发生时间以及故障解决时间存储至历史阈值数据库。
CN202111549691.7A 2021-12-17 2021-12-17 基于Netconf协议的设备监测阈值设置方法和系统 Pending CN114301817A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111549691.7A CN114301817A (zh) 2021-12-17 2021-12-17 基于Netconf协议的设备监测阈值设置方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111549691.7A CN114301817A (zh) 2021-12-17 2021-12-17 基于Netconf协议的设备监测阈值设置方法和系统

Publications (1)

Publication Number Publication Date
CN114301817A true CN114301817A (zh) 2022-04-08

Family

ID=80967884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111549691.7A Pending CN114301817A (zh) 2021-12-17 2021-12-17 基于Netconf协议的设备监测阈值设置方法和系统

Country Status (1)

Country Link
CN (1) CN114301817A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022218A (zh) * 2022-05-27 2022-09-06 中电信数智科技有限公司 一种分布式Netconf协议订阅告警阈值设置方法
CN116863723A (zh) * 2023-08-14 2023-10-10 深圳市双银科技有限公司 一种数字孪生基座的使用方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110822A (zh) * 2007-07-06 2008-01-23 华为技术有限公司 基于网络配置协议的事件通知发送方法、系统及设备
CN108989135A (zh) * 2018-09-29 2018-12-11 新华三技术有限公司合肥分公司 网络设备故障检测方法及装置
CN109582529A (zh) * 2018-09-29 2019-04-05 阿里巴巴集团控股有限公司 一种报警阈值的设置方法及装置
CN111357259A (zh) * 2018-01-09 2020-06-30 康维达无线有限责任公司 服务层操作的自适应控制机制
WO2021083075A1 (zh) * 2019-11-01 2021-05-06 华为技术有限公司 用于订阅事件流的方法和装置
CN113162789A (zh) * 2020-01-22 2021-07-23 华为技术有限公司 调整服务等级的方法、装置、设备、系统及存储介质
CN113590429A (zh) * 2021-08-18 2021-11-02 北京爱奇艺科技有限公司 一种服务器故障诊断方法、装置及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110822A (zh) * 2007-07-06 2008-01-23 华为技术有限公司 基于网络配置协议的事件通知发送方法、系统及设备
CN111357259A (zh) * 2018-01-09 2020-06-30 康维达无线有限责任公司 服务层操作的自适应控制机制
CN108989135A (zh) * 2018-09-29 2018-12-11 新华三技术有限公司合肥分公司 网络设备故障检测方法及装置
CN109582529A (zh) * 2018-09-29 2019-04-05 阿里巴巴集团控股有限公司 一种报警阈值的设置方法及装置
WO2021083075A1 (zh) * 2019-11-01 2021-05-06 华为技术有限公司 用于订阅事件流的方法和装置
CN113162789A (zh) * 2020-01-22 2021-07-23 华为技术有限公司 调整服务等级的方法、装置、设备、系统及存储介质
CN113590429A (zh) * 2021-08-18 2021-11-02 北京爱奇艺科技有限公司 一种服务器故障诊断方法、装置及电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022218A (zh) * 2022-05-27 2022-09-06 中电信数智科技有限公司 一种分布式Netconf协议订阅告警阈值设置方法
CN115022218B (zh) * 2022-05-27 2024-01-19 中电信数智科技有限公司 一种分布式Netconf协议订阅告警阈值设置方法
CN116863723A (zh) * 2023-08-14 2023-10-10 深圳市双银科技有限公司 一种数字孪生基座的使用方法
CN116863723B (zh) * 2023-08-14 2024-05-07 深圳市双银科技有限公司 一种数字孪生基座的使用方法

Similar Documents

Publication Publication Date Title
CN110224858B (zh) 基于日志的告警方法及相关装置
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
TWI510955B (zh) Data monitoring method, system and its server side, the client side
CN114301817A (zh) 基于Netconf协议的设备监测阈值设置方法和系统
US20060265272A1 (en) System and methods for re-evaluating historical service conditions after correcting or exempting causal events
CN101312405B (zh) 一种告警处理方法及网管系统
JP2003536162A (ja) ライブエクセプションズ・システム
CN108737574B (zh) 一种节点离线判断方法、装置、设备及可读存储介质
AU2001270017A1 (en) Liveexception system
WO2007003107A1 (fr) Méthode et appareil pour réaliser une opération prédéterminée dans un dispositif de gestion
CN112636979B (zh) 一种集群告警方法及相关装置
CN114363222A (zh) 一种基于Netconf协议的网络设备巡检方法和系统
CN106357442A (zh) 一种服务器集群监控方法及系统
CN109905262A (zh) 一种cdn设备服务的监控系统及监控方法
EP4030690A1 (en) Device management method, apparatus, and system
CN112671557A (zh) 一种基于态势感知故障监控方法及系统
CN108156017A (zh) 一种输变电设备状态告警管理方法
CN114553747A (zh) redis集群的异常检测方法、装置、终端及存储介质
EP1622310B1 (en) Administration method and system for network management systems
CN111949421B (zh) Sdk调用方法、装置、电子设备和计算机可读存储介质
CN113037549A (zh) 一种运维环境告警方法
CN112312209B (zh) 综合告警生成方法、装置、服务器、存储介质
CN114296979A (zh) 一种检测物联网设备异常状态的方法及装置
CN111510351A (zh) 基于普罗米修斯监控系统的异常检测方法和装置
CN107317692B (zh) 故障上报方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220408

RJ01 Rejection of invention patent application after publication